Hadoop windows编译:

能够略过这一段,直接下载hadoo2.7.1 bin文件。我的资源里有终于生成的winutils.exe和一些native code,放在bin文件夹即可了

參考building.txt以及http://wiki.apache.org/hadoop/Hadoop2OnWindows,编译条件:

* Windows System - win8

* JDK 1.7+ - jdk1.8

* Maven 3.0 or later - maven 3.3

* Findbugs 1.3.9 (if running findbugs) - None

* ProtocolBuffer 2.5.0 - 2.5 build by vs2013

* CMake 2.6 or newer - cmake3.3

* Windows SDK 7.1 or Visual Studio 2010 Professional - vs2010

* Windows SDK 8.1 (if building CPU rate control for the container executor)

* zlib headers (if building native code bindings for zlib)

* Internet connection for first build (to fetch all Maven and Hadoop dependencies)

* Unix command-line tools from GnuWin32: sh, mkdir, rm, cp, tar, gzip. These

  tools must be present on your PATH.

1. Unix command-line tools: http://git-scm.com/download/win

PATH设置环境变量C:\Program Files (x86)\Git\cmd;C:\Program Files (x86)\Git\bin

想用gnuwin32的话,hosts文件须要加入(国内訪问不了)

216.34.181.96 getgnuwin32.sourceforge.net

2. protocolbuffer 2.5.0 能够用vs2010/vs2013编译,几个project须要加上 /FS

加上,#include <algorithm>

watermark/2/text/aHR0cDovL2Jsb2cuY3Nkbi5uZXQv/font/5a6L5L2T/fontsize/400/fill/I0JBQkFCMA==/dissolve/70/gravity/SouthEast">

编译好的protoc.exe / libprotobuf.lib / libprotobuf-lite.lib / libprotoc.lib 放到c:/windows,打开CMD输入protoc,

3. 拷贝zlib1.dll(网上能够下载到,最好用1.2.7版本号的)到C:/windows

4. 按编译过程中提示的错误信息。把C:\Java\jdk1.8.0_51\lib\tools.jar复制到C:\Java\jdk1.8.0_51\lib\

5. 打开CMD。注意JAVA_HOME文件夹中不要有Program file这样有空格

CALL "%VS100COMNTOOLS%..\..\VC\bin\vcvars32.bat"

set Platform=Win32

set JAVA_HOME=C:\Java\jdk1.8.0_51

cd e:/hadoop-2.7.1-src

mvn package -Pdist,native-win -DskipTests -Dtar

6. mvn能够多试几次,终于tar文件在hadoop-dist\target\

启动Hadoop:

配置hadoop能够全然參照linux下配置,须要注意的是:

1. 涉及到本机文件夹的地方,加上file:///。否则 hdfs namenode -format 会失败

file:///e:/nutch/hdfs/name

2. 可能会提示Error: missing `server' JVM at `C:\Java\jdk1.8.0_51\bin\server\jvm.dll'.

将C:\Java\jdk1.8.0_51\jre\bin\server 文件夹复制到C:\Java\jdk1.8.0_51\bin\

eclipse导入Nutch2.3:

1. windows下编译,ant runtime和linux区别不大

2. 导入nutch2.3,网上有例程。ant runtime以后再导入例程

打开eclipse。new - java project - ,基本就

能够finish了,还会有一些bug:

watermark/2/text/aHR0cDovL2Jsb2cuY3Nkbi5uZXQv/font/5a6L5L2T/fontsize/400/fill/I0JBQkFCMA==/dissolve/70/gravity/SouthEast">

3. Run as - java appliction, 选择InjectorJob

watermark/2/text/aHR0cDovL2Jsb2cuY3Nkbi5uZXQv/font/5a6L5L2T/fontsize/400/fill/I0JBQkFCMA==/dissolve/70/gravity/SouthEast">

4. 执行成功,先执行hadoop

5. InjectorJob: java.lang.NullPointerException

 at java.lang.ProcessBuilder.start(Unknown Source)

,同一时候HADOOP_HOME/bin增加到PATH能够解决

也许须要重新启动一下eclipse:)



hadoop2.7.1 nutch2.3 二次开发windows环境的更多相关文章

  1. Selenium2学习-001-Selenium2 WebUI自动化Java开发 Windows 环境配置

    此文主要介绍 Selenium2 WebUI自动化Java开发 Windows 环境配置,供各位亲们参考,若有不足之处,敬请各位大神指正,非常感谢! 所需软件列表如下所示: 所属分类 具体名称 备注 ...

  2. 基于Java的Arc Engine二次开发的环境的配置

    1.软件准备 ArcGIS for Desktop 10.2, Arc engine, jdk-7u60-windows-i586,Eclipse Mar2 2.软件的安装 2.1 ArcGIS fo ...

  3. openfire二次开发eclipse环境搭建

    转自:http://blog.csdn.net/daigua245/article/details/7918243 1.将openfire源码项目解压到(如果是从SVN CO下来的则不用)eclips ...

  4. 消息队列的使用 RabbitMQ (二): Windows 环境下集群的实现

    一.RabbitMQ 集群的基本概念 一个 RabbitMQ 中间件(broker) 由一个或多个 erlang 节点组成,节点之间共享 用户名.虚拟目录.队列消息.运行参数 等, 这个 节点的集合被 ...

  5. MongoDB(二):在Windows环境安装MongoDB

    1. 在Windows环境安装 1.1 MongoDB下载 要在Windows上安装MongoDB,首先打开MongoDB官网:https://www.mongodb.com/download-cen ...

  6. RN开发-windows环境搭建

    1.安装jdk,sdk,C++运行环境(cygwin,Windows SDK,mingw),node.js和git 2.设置全局使用指定的镜像        打开git-cmd.exe         ...

  7. datax二次开发

    从hive抽取数据,写入hbase 一.datax插件hbase12xwriter开发 查看datax源码,发现有hbase094xwriter和hbase11xwriter源码,说明datax支持h ...

  8. Navisworks API 简单二次开发 (自定义工具条)

    在Navisworks软件运行的时候界面右侧有个工具条.比较方便.但是在二次开发的时候我不知道在Api那里调用.如果有网友知道请告诉我.谢谢. 我用就自己设置一个工具.界面比较丑!没有美工. 代码: ...

  9. [连载]《C#通讯(串口和网络)框架的设计与实现》- 12.二次开发及应用

    目       录 第十二章     二次开发及应用... 2 12.1        项目配制... 3 12.2        引用相关组件... 4 12.3        构建主程序... 5 ...

随机推荐

  1. 算法学习记录-排序——选择排序(Simple Selection Sort)

    之前在冒泡排序的附录中提到可以在每次循环时候,不用交换操作,而只需要记录最小值下标,每次循环后交换哨兵与最小值下标的书, 这样可以减少交换操作的时间. 这种方法针对冒泡排序中需要频繁交换数组数字而改进 ...

  2. 剑指offer面试题43:n个筛子的点数

    题目描述: 把n个筛子扔在地上,所有筛子朝上的一面点数之和为s,输入n,打印出s的所有可能的值出线的概率. 书上给了两种解法,第一种递归的方法由于代码太乱,没有看懂=.= 第二种方法很巧妙,lz已经根 ...

  3. 面试准备——java设计模式

    1 总体来说,设计模式分为三大类: 设计模式(design pattern)是对软件设计中普遍存在(反复出现)的各种问题,所提出的解决方案. 创建型模式(五种):工厂方法模式.抽象工厂模式.单例模式. ...

  4. jsp jstl标签库 el表达式

    一.JSTL标签是什么? 提供了对国际化(I18N)的支持,它可以根据发出请求的客户端地域的不同来显示不同的语言. 同时还提供了格式化数据和日期的方法.实现这些功能需要I18N格式标签库(I18N-c ...

  5. 【JavaScript 14—学习总结】:从小事做起

    导读:花了将近两个月,JavaScript的学习视频算是做完了.里面的例子,都敲过一遍,但有少数的几个就是实现不了,比如:百度分享侧栏随着滚动条移动:菜单切换只对第一个起作用等,也就先放着了.现在,就 ...

  6. Cookie窃取实验

    文章:IE/FIREFOX/CHROME等浏览器保存COOKIE的位置 Chrome的Cookie数据位于:%LOCALAPPDATA%\Google\Chrome\User Data\Default ...

  7. POJ-1236 Network of Schools,人生第一道Tarjan....

    Network of Schools 题意:若干个学校组成一个计算机网络系统,一个学校作为出发端连接着若干个学校,信息可以传送到这些学校.被链接的学校不需要再次与出发端相连,现在问你:A:最少选几个学 ...

  8. 彻底解决Request Too Long的问题

    运行regedit,进入 HKEY_LOCAL_MACHINE\System\CurrentControlSet\Services\HTTP\Parameters , 1. 添加类型为 DWORD(3 ...

  9. git 本地保存账号密码

    用ssh连接的项目都不用输账号密码 如果https的话   每次都用输入账号密码   很繁琐 解决方法,在本地的工程文件夹的.git下打开config文件添加: [credential]     he ...

  10. hdu6060[贪心+dfs] 2017多校3

    /* hdu6060[贪心+dfs] 2017多校3*/ #include <bits/stdc++.h> using namespace std; typedef long long L ...