首先下载heritrix-1.14.4-src源码。可以在http://sourceforge.net/projects/archive-crawler/files/archive-crawler (heritrix 1.x)/1.14.4/,下载解压后。

在eclipse新建java project,命名为MyHeritrix,右键MyHeritrix-->properties-->java bulid path-->libraries查看jre system library是否是jdk的,不是的话将其remove掉,然后点击右边的add library-->jre system library选择系统安装的jdk,因为jdk包含了jre。创建lib文件夹,将源码里lib下的jar包复制到工程的lib下,选择所要的jar文件,右键-->bulid path,将jar文件添加进工程。

复制源码里src/java下的com、org、st文件夹到MyHeritrix工程的src下,复制源码里src下的conf文件夹到MyHeritrix的根目录下,复制源码里src下的webapps文件夹到MyHeritrix的根目录下,复制conf下的jmxremote.password.template文件到MyHeritrix的根目录下,并改名为jmxremote.password。修改该文件最后两行的内容,

monitorRole admin
controlRole admin

复制源码src\resources\org\archive\util下的tlds-alpha-by-domain.txt到MyHeritrix工程的org.archive.util下,修改MyHeritrix工程conf下的heritrix.properties。heritrix.cmdline.admin = admin:admin  用户名和密码是用冒号隔开  heritrix.cmdline.port默认是8080,可以改为别的端口号。

右键MyHeritrix工程-->run as-->Run Configurations,双击Java Application创建新的java应用,Main现在的Project选择MyHeritrix,Main class选择org.archive.crawler.Heritrix,点击上面的Classpath-->User Entries-->Advanced-->Add Folders 选择MyHeritrix工程下的conf文件夹,点击ok,点击apply,再点击run。最后控制台打印类似下面的信息,说明启动成功了。

06:37:32.957 EVENT Starting Jetty/4.2.23
06:37:33.040 EVENT Started WebApplicationContext[/,Heritrix Console]
06:37:33.072 EVENT Started SocketListener on 127.0.0.1:8080
06:37:33.072 EVENT Started org.mortbay.jetty.Server@1b65d9bd
Heritrix version: 1.14.4

然后在浏览器输入:http://localhost:8080  进入登录界面,用户名:admin  密码:admin 可以进入管理页面了。

eclipse启动Heritrix的更多相关文章

  1. eclipse启动tomcat无法访问

    eclipse启动tomcat无法访问 症状: tomcat在eclipse里面能正常启动,而在浏览器中访问http://localhost:8080/不能访问,且报404错误.同时其他项目页面也不能 ...

  2. eclipse启动优化,终于不那么卡了!

    eclipse启动优化,终于不那么卡了! 网上找了好多都是myEclipse的优化的,跟eclipse有点区别,找了很多方法还是不能让这个eclipse(Version: Kepler Release ...

  3. eclipse启动不了,出现“Java was started but returned exit code=13......”对话框

    eclipse启动不了,出现"Java was started but returned exit code=13......"对话框如下 解决方案:1.使用的是java jdk6 ...

  4. Eclipse启动时发生An internal error occurred during: "Initializing Java Tooling".错误的解决方法

    问题描述: Eclipse启动时发生An internal error occurred during: "Initializing JavaTooling".错误的解决方法 解决 ...

  5. 指定eclipse启动使用的JVM

    不同eclispe对运行时要求不一样,而一台电脑只能同时使用一个运行时,当多个要求不同版本jvm的eclipse需要在一台电脑工作时,需要手动指定eclipse启动使用的jvm. [eclipse-j ...

  6. eclipse启动时报告错误:Java was started but returned exit code=-805306369

    这两天也没改过eclipse和java的配置,但eclipse启动时报告错误:Java was started but returned exit code=-805306369 后来在eclipse ...

  7. Eclipse启动参数

    from 网络 eclipse 启动参数 -clean2013-- : eclipse 启动参数介绍(如添加插件时,如果不显示,则使用eclipse -clean启动) 其实,Eclipse是一个可以 ...

  8. eclipse启动时报错 Could not create the java virtual machine

    eclipse启动的时候 报错 这是系统为eclipse分配的内存不足,需要去修改  eclipse.ini文件 eclipse.ini是eclipse 内存分配之类的配置文件   对java虚拟机的 ...

  9. eclipse启动的时候报错 出现Java was started but returned exit code=13

    eclipse启动的时候出现 这是你的jdk环境与你eclipse版本不匹配, 如果你的eclipse是32位的 jdk也得是32位的   重新安装一个比配的jdk就好了 如果你的jdk是解压版的   ...

随机推荐

  1. 用CSS实现文本框尖角

    经常看到这样的尖角,以前不懂,以为都是用图片做出来的,后来惊奇的发现,原来很多都是用CSS做出来的,既美观又节省资源,真是两全其美啊! 那么,用CSS怎么实现这种效果呢?首先,来写一个简单的代码: & ...

  2. ajax无法跳转页面的问题,

    将return true去掉!

  3. 敏捷开发(十)- Scrum每日例会

    本文主要是为了检测你对SCRUM 评估会议的了解和使用程度, 通过本文你可以检测一下     1.你们的SCRUM 没人例会的过程和步骤    2.SCRUM 每日例会的输出结果一.会议目的      ...

  4. DB2导入导出 学习笔记

    db2pd -osinfodb2mtrk -i -d (for aix)db2 get dbm cfg show detaildb2 get db cfg show detaildb2 get sna ...

  5. 可参考的gulp资源

    可参考的gulp资源 入门:https://segmentfault.com/a/1190000000435599 比较详细:https://markpop.github.io/2014/09/17/ ...

  6. Intellij Idea使用频率较高的几个快捷键

    自动补全参数定义: Ctrl+Alt+V 运行断点Expression: Alt+F8 选择具体的方法以断点步入:Shift+F7 智能操作: Alt+Enter 打开最近文件:Ctrl+E 打开最近 ...

  7. Proteus中MATRIX-8X8 LED灯的连接

    上面8个引脚用于选择行,低电平有效.下面8个引脚用于选择列,高电平有效. 经测试,红色点阵LED与之相反,是上面的引脚用于选择列,且高电平有效:下面的引脚用于选择行,低电平有效. 在AT89C51单片 ...

  8. ECOS-Mongodb安装

    安装Mongodb服务 安装Mongodb服务 author :James,jimingsong@vip.qq.com since :2015-03-03 下载Mongodb安装包(64位哦) 安装M ...

  9. 什么是Bash Shell的内建(build in)命令

    1.什么是build in命令: shell内建命令是指bash(或其它版本)工具集中的命令.一般都会有一个与之同名的系统命令,比如bash中的echo命令与/bin/echo是两个不同的命令,尽管他 ...

  10. HTML canvas图像裁剪

    canvas drawImage方法的图像裁剪理解可能会比较耗时,记录一下,以便供人翻阅! context.drawImage(img,sx,sy,swidth,sheight,x,y,width,h ...