一、          
为什么要编译Hadoop源码

Hadoop是使用Java语言开发的,但是有一些需求和操作并不适合使用java,所以就引入了本地库(Native Libraries)的概念,通过本地库,Hadoop可以更加高效地执行某一些操作。

native目录是本地库,位于hadoop-2.x.x/lib/native目录下,仅支持linux和unix操作系统。

hadoop中的zlib和gzip模块会加载本地库,如果加载失败,会提示:

16/07/06 12:18:24 WARN util.NativeCodeLoader:
Unable to load native-hadoop library for your platform... using builtin-java
classes where applicable

可以在core-site.xml中配置hadoop.native.lib值是否使用本地库,默认值为true。

官方提供的hadoop-2.x版本中,native文件都是32位编译的,在实际使用64位环境中,为了能让Hadoop更高效地运行,最好还是在本地编译Hadoop源码,用本地编译好的本地库(native目录)替换官方安装包里自带的本地库。

二、          
编译源码的环境要求

1、   必须在Linux下进行

2、   Java JDK必须为1.6以上

3、   Maven 版本必须为3.0以上

4、   安装Findbugs插件,版本1.3.9

5、   安装CMake编译工具,版本2.6

6、   安装zlib devel

7、   安装openssl devel

8、   编译时必须可以连接互联网,因为需要yum下载软件。

三、          
用到的软件包

1、   apache-maven-3.0.5-bin.tar.gz

2、   cmd_markdown_win64.zip

3、   findbugs-1.3.9.tar.gz

4、   hadoop-2.5.0-src.tar.gz

5、   jdk-7u67-linux-x64.tar.gz

6、   native-2.5.0.tar.gz

7、   protobuf-2.5.0.tar.gz

四、          
Hadoop2.x源码编译步骤

1、   解压Hadoop源码安装包

(1)    [hadoop@bigdata-senior01 sofeware]$ tar -zxf 
hadoop-2.5.0-src.tar.gz -C /opt/modules/

(2)    查看是否已经解压成功

[hadoop@bigdata-senior01
sofeware]$ ll /opt/modules/

total 12

drwxr-xr-x. 11
hadoop hadoop 4096 Jul  4 17:48 hadoop-2.5.0

drwxr-xr-x 
15 hadoop hadoop 4096 Aug  7  2014 hadoop-2.5.0-src

2、   解压JDK

(1)    [hadoop@bigdata-senior01 sofeware]$ tar -zxf jdk-7u67-linux-x64.tar.gz
-C /opt/modules/

(2)    查看是否已经解压成功

[hadoop@bigdata-senior01
sofeware]$ ll /opt/modules/

total 12

drwxr-xr-x. 11
hadoop hadoop 4096 Jul  4 17:48 hadoop-2.5.0

drwxr-xr-x 
15 hadoop hadoop 4096 Aug  7  2014 hadoop-2.5.0-src

drwxr-xr-x. 
8 hadoop hadoop 4096 Jul 26  2014 jdk1.7.0_67

3、   root用户配置Java
JDK环境变量

(1)    root用户进入/etc/profile文件

[root@bigdata-senior01
sofeware]$ vim /etc/profile

(2)    配置JDK_HOME和PATH

export
JAVA_HOME="/opt/modules/jdk1.7.0_67"

export
PATH=$JAVA_HOME/bin:$PATH

(3)    生效配置文件

[root@bigdata-senior01
sofeware]$ source /etc/profile

(4)    确认Jave配置成功

[root@bigdata-senior01
sofeware]$ java -version

java version
"1.7.0_67"

Java(TM) SE
Runtime Environment (build 1.7.0_67-b01)

Java HotSpot(TM)
64-Bit Server VM (build 24.65-b04, mixed mode)

4、   root用户安装Maven

(1)    Apache Maven,是一个软件项目管理及自动构建工具。Maven 完成项目生命周期的所有阶段,包括验证、代码生成、编译、测试、打包、集成测试、安装、部署、以及项目网站创建和部署。maven的好处在于可以将项目过程规范化、自动化、高效化以及强大的可扩展性。

对于需要的依赖,Maven可以从配置的远程仓库里按需自动下载到本地仓库

(2)    解压Maven

[hadoop@bigdata-senior01
sofeware]$ tar -zxf apache-maven-3.0.5-bin.tar.gz -C /opt/modules/

(3)    配置/etc/profile文件

export
MAVEN_HOME="/opt/modules/apache-maven-3.0.5"

export
PATH=$MAVEN_HOME/bin:$PATH

(4)    生效配置文件

[root@bigdata-senior01
sofeware]# source /etc/profile

(5)    确认Maven配置成功

[root@bigdata-senior01
sofeware]# mvn -version

Apache Maven
3.0.5 (r01de14724cdef164cd33c7c8c2fe155faf9602da; 2013-02-19 21:51:28+0800)

Maven home:
/opt/modules/apache-maven-3.0.5

Java version:
1.7.0_67, vendor: Oracle Corporation

Java home:
/opt/modules/jdk1.7.0_67/jre

Default locale:
en_US, platform encoding: UTF-8

OS name:
"linux", version: "2.6.32-504.el6.x86_64", arch:
"amd64", family: "unix"

5、   root用户安装gcc/gcc-c++/make

[root@bigdata-senior01
sofeware]# yum -y install gcc gcc-c++

接下来yum自动安装,直到安装成功会显示Complete!

6、   普通用户下安装protobuf

(1)    [hadoop@bigdata-senior01 sofeware]$ tar -zxf protobuf-2.5.0.tar.gz
-C /opt/modules/

(2)    [hadoop@bigdata-senior01 sofeware]$
/opt/modules/protobuf-2.5.0/configure --prefix=/usr/local/protoc

(3)    [hadoop@bigdata-senior01 sofeware]$ cd /opt/modules/protobuf-2.5.0

(4)    [root@bigdata-senior01 protobuf-2.5.0]# make

(5)    [root@bigdata-senior01 protobuf-2.5.0]# make install

(6)    配置/etc/profile

export
PROTOBUF_HOME="/usr/local/protoc"

export
PATH=$PROTOBUF_HOME/bin:$PATH

(7)    生效配置文件

[root@bigdata-senior01
sofeware]# source /etc/profile

(8)    确认配置成功

[root@bigdata-senior01
protobuf-2.5.0]# protoc --version

libprotoc 2.5.0

7、   root用户下下载安装CMake、openssl、ncurses

(1)    安装Cmake

[root@bigdata-senior01
protobuf-2.5.0]# yum -y install cmake

(2)    安装openssl

[root@bigdata-senior01
protobuf-2.5.0]# yum install openssl-devel

(3)    安装ncurses

[root@bigdata-senior01
protobuf-2.5.0]# yum -y install ncurses-devel

8、   添加maven镜像

(1)    编辑maven配置文件settings.xml

(2)    添加镜像

<mirror>

<id>nexus-osc</id>

<mirrorOf>*</mirrorOf>

<name>Nexus osc</name>

<url>http://maven.oschina.net/content/groups/public</url>

</mirror>

9、   编译Hadoop源码

(1)    切换到普通用户:[root@bigdata-senior01
protobuf-2.5.0]# su hadoop

(2)    进入hadoop源码目录:[hadoop@bigdata-senior01
protobuf-2.5.0]$ cd /opt/modules/hadoop-2.5.0-src/

(3)    执行编译,编译过程中需要从yum仓库下载依赖包,需要一段时间

[hadoop@bigdata-senior01
hadoop-2.5.0-src]$ mvn package
–DskipTests –Pdist,native

(4)   
执行过程中如果报错,发现是下载依赖失败,可以换个apache的maven镜像地址后能够正常下载。

https://repo.maven.apache.org/maven2

10、          
编译后,将native目录替换之前安装的hadoop lib 目录下的native目录。

(1)    将编译后的native目录覆盖本地原有的native目录

[hadoop@bigdata-senior01 hadoop-2.5.0-src]$ cp -R
/opt/modules/hadoop-2.5.0-src/hadoop-dist/target/hadoop-2.5.0/lib/native/*  
/opt/modules/hadoop-2.5.0/lib/native/

(2)    进入${HADOOP_HOME}目录启动HDFS

[hadoop@bigdata-senior01 hadoop-2.5.0-src]$ cd ${HADOOP_HOME}

[hadoop@bigdata-senior01 hadoop-2.5.0]$ sbin/hadoop-daemon.sh start
namenode

[hadoop@bigdata-senior01 hadoop-2.5.0]$ sbin/hadoop-daemon.sh start
datanode

(3)    执行dfs命令就不会有警告了

[hadoop@bigdata-senior01 hadoop-2.5.0]$ bin/hdfs dfs -ls /

附件列表

Hadoop源码编译过程的更多相关文章

  1. Ubuntu 14.04 LTS 下 android 2.3.5 源码编译过程

    Ubuntu 14.04 LTS 下 android 2.3.5 源码编译过程   在新的Ubuntu 64位系统下去编译早期的安卓源码是会出现很多问题的,因为64位系统在安装完成后,很多32位的兼容 ...

  2. 英蓓特Mars board的android4.0.3源码编译过程

    英蓓特Mars board的android4.0.3源码编译过程 作者:StephenZhu(大桥++) 2013年8月22日 若要转载,请注明出处 一.编译环境搭建及要点: 1. 虚拟机软件virt ...

  3. hadoop 源码编译

    hadoop 源码编译 1.准备jar 1) hadoop-2.7.2-src.tar.gz 2) jdk-8u144-linux-x64.tar.gz 3) apach-ant-1.9.9-bin. ...

  4. hadoop源码编译

    为何要自行编译hadoop源码,往往是由于官方提供的hadoop发行版都是基于32位操作系统,在操作hadoop时会发生warn.   准备软件: 1)JDK 2)Hadoop源码 3)Maven 4 ...

  5. Hadoop源码编译环境搭建

    准备工具: maven 3.0.0版本或者更高版本(配置中心库) protocbuff 2.5.0 http://www.zlib.net/ git bash(Windows环境可以用此工具执行编译命 ...

  6. nginx源码编译以及源码编译过程中遇到的问题

    本文主要讲nginx安装以及安装过程中遇到的问题. 谈到nginx 必须聊聊它的起源和发展. nginx是由俄罗斯工程师Igor Sysoev 用C语言开发的一个免费开源的Web服务器软件,于2004 ...

  7. Hadoop2.7.2源码编译过程

    目录 准备工作 jar包安装 源码编译 准备工作 CentOS可以联网,验证:ping www.baidu.com 是畅通的 jar 包准备(hadoop 源码.JDK8.maven.ant .pro ...

  8. android源码编译过程

    1.下载好android源码包. 2.装好vm,ubuntu(如果能在实体机装linux更好). 3.安装所需要的deb包 在终端执行如下命令: sudo apt-get install flex b ...

  9. spring5源码编译过程中必经的坑

    spring源码编译流程:Spring5 源码下载 第 一 步 : https://github.com/spring-projects/spring-framework/archive/v5.0.2 ...

随机推荐

  1. 性能分析工具-PerfView

    Roslyn的PM(程序经理) Bill Chiles,Roslyn使用纯托管代码开发,但性能超过之前使用C++编写的原生实现,这有什么秘诀呢?他最近写了一篇文章叫做<Essential Per ...

  2. 标准数据源访问库 - JayData

    JayData 是一个标准的.跨平台的库和方法,用于访问和操作各种不同的数据源,最适合用于 JavaScript 和 HTML5 应用. 官方网站:http://jaydata.org/  ASP.N ...

  3. 论如何在手机端web前端实现自定义原生控件的样式

    手机开发webapp的同学一定遇到过这样问题,如何为丑极了的手机元素应用自定义的样式.首先,要弄清楚为什么要定义手机原生控件的样式,就需要看看手机的那些原生框样式的丑陋摸样: android: ios ...

  4. ASP.Net请求处理机制初步探索之旅 - Part 4 WebForm页面生命周期

    开篇:上一篇我们了解了所谓的请求处理管道,在众多的事件中微软开放了19个重要的事件给我们,我们可以注入一些自定义的业务逻辑实现应用的个性化设计.本篇,我们来看看WebForm模式下的页面生命周期. ( ...

  5. 【转】我的技术学习方法 — Anytao

    原文作者:anytao—王涛 他的著作:<你必须知道的.Net> 关于这个问题,也有不少刚刚入行的朋友向我问起.我想可能一千个人就有一千个答案,我不能保证自己的想法适合于所有的人,但是这确 ...

  6. 简单一招实现json数据可视化

    开发一个内部功能时碰到的需求,要把json数据在页面上展示出来,平时浏览器会安装jsonView这样的扩展来看json数据,但是程序要用到的话该怎么办呢?今天在网上搜索的时候,发现了这个小技巧,分享一 ...

  7. K-Means聚类和EM算法复习总结

    摘要: 1.算法概述 2.算法推导 3.算法特性及优缺点 4.注意事项 5.实现和具体例子 6.适用场合 内容: 1.算法概述 k-means算法是一种得到最广泛使用的聚类算法. 它是将各个聚类子集内 ...

  8. AngularJS中的表单验证

    AngularJS中的表单验证 AngularJS自带了很多验证,什么必填,最大长度,最小长度...,这里记录几个有用的正则式验证 1.使用angularjs的表单验证 正则式验证 只需要配置一个正则 ...

  9. Security2:Create User

    User 用于访问DB Users based on logins in master (This is the most common type of user.) User based on a ...

  10. 那些让IE6-8羞愧的替补型js

    1,html5shiv 这个js特别简单,可以让IE8识别一些新的标签,常用的比如 header footor section,就能使用更好的语义的标签了. 引入方式: <!--[if lt I ...