首先下载heritrix-1.14.4-src源码。可以在http://sourceforge.net/projects/archive-crawler/files/archive-crawler (heritrix 1.x)/1.14.4/,下载解压后。

在eclipse新建java project,命名为MyHeritrix,右键MyHeritrix-->properties-->java bulid path-->libraries查看jre system library是否是jdk的,不是的话将其remove掉,然后点击右边的add library-->jre system library选择系统安装的jdk,因为jdk包含了jre。创建lib文件夹,将源码里lib下的jar包复制到工程的lib下,选择所要的jar文件,右键-->bulid path,将jar文件添加进工程。

复制源码里src/java下的com、org、st文件夹到MyHeritrix工程的src下,复制源码里src下的conf文件夹到MyHeritrix的根目录下,复制源码里src下的webapps文件夹到MyHeritrix的根目录下,复制conf下的jmxremote.password.template文件到MyHeritrix的根目录下,并改名为jmxremote.password。修改该文件最后两行的内容,

monitorRole admin
controlRole admin

复制源码src\resources\org\archive\util下的tlds-alpha-by-domain.txt到MyHeritrix工程的org.archive.util下,修改MyHeritrix工程conf下的heritrix.properties。heritrix.cmdline.admin = admin:admin  用户名和密码是用冒号隔开  heritrix.cmdline.port默认是8080,可以改为别的端口号。

右键MyHeritrix工程-->run as-->Run Configurations,双击Java Application创建新的java应用,Main现在的Project选择MyHeritrix,Main class选择org.archive.crawler.Heritrix,点击上面的Classpath-->User Entries-->Advanced-->Add Folders 选择MyHeritrix工程下的conf文件夹,点击ok,点击apply,再点击run。最后控制台打印类似下面的信息,说明启动成功了。

06:37:32.957 EVENT Starting Jetty/4.2.23
06:37:33.040 EVENT Started WebApplicationContext[/,Heritrix Console]
06:37:33.072 EVENT Started SocketListener on 127.0.0.1:8080
06:37:33.072 EVENT Started org.mortbay.jetty.Server@1b65d9bd
Heritrix version: 1.14.4

然后在浏览器输入:http://localhost:8080  进入登录界面,用户名:admin  密码:admin 可以进入管理页面了。

eclipse启动Heritrix的更多相关文章

  1. eclipse启动tomcat无法访问

    eclipse启动tomcat无法访问 症状: tomcat在eclipse里面能正常启动,而在浏览器中访问http://localhost:8080/不能访问,且报404错误.同时其他项目页面也不能 ...

  2. eclipse启动优化,终于不那么卡了!

    eclipse启动优化,终于不那么卡了! 网上找了好多都是myEclipse的优化的,跟eclipse有点区别,找了很多方法还是不能让这个eclipse(Version: Kepler Release ...

  3. eclipse启动不了,出现“Java was started but returned exit code=13......”对话框

    eclipse启动不了,出现"Java was started but returned exit code=13......"对话框如下 解决方案:1.使用的是java jdk6 ...

  4. Eclipse启动时发生An internal error occurred during: "Initializing Java Tooling".错误的解决方法

    问题描述: Eclipse启动时发生An internal error occurred during: "Initializing JavaTooling".错误的解决方法 解决 ...

  5. 指定eclipse启动使用的JVM

    不同eclispe对运行时要求不一样,而一台电脑只能同时使用一个运行时,当多个要求不同版本jvm的eclipse需要在一台电脑工作时,需要手动指定eclipse启动使用的jvm. [eclipse-j ...

  6. eclipse启动时报告错误:Java was started but returned exit code=-805306369

    这两天也没改过eclipse和java的配置,但eclipse启动时报告错误:Java was started but returned exit code=-805306369 后来在eclipse ...

  7. Eclipse启动参数

    from 网络 eclipse 启动参数 -clean2013-- : eclipse 启动参数介绍(如添加插件时,如果不显示,则使用eclipse -clean启动) 其实,Eclipse是一个可以 ...

  8. eclipse启动时报错 Could not create the java virtual machine

    eclipse启动的时候 报错 这是系统为eclipse分配的内存不足,需要去修改  eclipse.ini文件 eclipse.ini是eclipse 内存分配之类的配置文件   对java虚拟机的 ...

  9. eclipse启动的时候报错 出现Java was started but returned exit code=13

    eclipse启动的时候出现 这是你的jdk环境与你eclipse版本不匹配, 如果你的eclipse是32位的 jdk也得是32位的   重新安装一个比配的jdk就好了 如果你的jdk是解压版的   ...

随机推荐

  1. 2016NOMS全国运营峰会——史上更强嘉宾阵容提前揭晓!

    参加2016NOMS全国运营峰会的演讲嘉宾来自运营领域的各个方面,包括用户运营.内容运营.活动运营.数据运营等.自大会消息一出立刻受到业界的广泛关注,并吸引了众多业内人士踊跃报名.日前,这一运营界峰会 ...

  2. 面试题-Java基础-垃圾回收

    1.Java中垃圾回收有什么目的?什么时候进行垃圾回收? 垃圾回收的目的是识别并且丢弃应用不再使用的对象来释放和重用资源. 2.System.gc()和Runtime.gc()会做什么事情? 这两个方 ...

  3. python 主机宝

    需求:开发一个主机批量管理系统,要求按saltstack方式执行命令 #!/usr/bin/env python3. # -*- coding:utf8 -*- import os,sys,pickl ...

  4. HDU 5795 A Simple Nim(SG打表找规律)

    SG打表找规律 HDU 5795 题目连接 #include<iostream> #include<cstdio> #include<cmath> #include ...

  5. 1张图看懂RAID功能,6张图教会配置服务器【转】

    RAID 包含一组或者一个集合甚至一个阵列.使用一组磁盘结合驱动器组成 RAID 阵列或 RAID 集.将至少两个磁盘连接到一个 RAID 控制器,而成为一个逻辑卷,也可以将多个驱动器放在一个组中.一 ...

  6. [Mark] KVM 虚拟化基本原理

    X86 操作系统是设计在直接运行在裸硬件设备上的,因此它们自动认为它们完全占有计算机硬件.x86 架构提供四个特权级别给操作系统和应用程序来访问硬件. Ring 是指 CPU 的运行级别,Ring 0 ...

  7. 2016 ACM Amman Collegiate Programming Contest D Rectangles

    Rectangles time limit per test 5 seconds memory limit per test 256 megabytes input standard input ou ...

  8. .net通过WCF调用java发布的服务,获取数据

    功能描述 java作为后台,连接数据库获取数据,然后发布SOAP services,让.net平台通过WCF进行引用. 实现步骤 1.在项目特定文件夹下,右键->添加服务引用,输入服务的url地 ...

  9. 在Ubuntu 14.04安装 Let’s Encrypt并配置ssl

    1.下载安装 Let's Encrypt客户端 cd /usr/local/sbin sudo wget https://dl.eff.org/certbot-auto 2.添加执行权限 sudo c ...

  10. 【MySQL】使用 Optimizer Trace 观察SQL执行过程

    Optimizer Trace 是MySQL 5.6.3里新加的一个特性,可以把MySQL Optimizer的决策和执行过程输出成文本.输出使用JSON格式,便于程序分析和人类阅读. 使用方法 1) ...