自己动手一步一步安装hadoop（含编译hadoop的native本地包）

近期项目须要用到hadoop。边学习边应用，第一步无疑是安装hadoop。我安装的是hadoop-2.4.1。以下是具体步骤，做备忘以后查看

一、下载依赖软件

1、java

hadoop官网说明仅仅支持java 6和7 ，下载最新的java7

http://download.oracle.com/otn-pub/java/jdk/7u65-b17/jdk-7u65-linux-x64.tar.gz

2、maven

从maven官网下载http://maven.apache.org/download.cgi

3、hadoop安装文件

http://mirrors.hust.edu.cn/apache/hadoop/common/hadoop-2.4.1/hadoop-2.4.1.tar.gz

4、hadoop源码（用于编译生成hadoop的native包）

http://mirror.bit.edu.cn/apache/hadoop/common/hadoop-2.4.1/hadoop-2.4.1-src.tar.gz

5、hive

http://mirrors.cnnic.cn/apache/hive/hive-0.13.1/apache-hive-0.13.1-bin.tar.gz

6、protobuf（用于编译生成hadoop的native包）

http://protobuf.googlecode.com/files/protobuf-2.5.0.tar.gz

二、把上述软件分别解压到soft文件夹下，然后环境变量设置

1、在管理员权限下centos 运行命令vi /etc/profile ubuntu下为sudo gedit /etc/profile

2、在最后加入以下的路径

export HADOOP_HOME=/root/soft/hadoop/hadoop-2.4.1

export HIVE_HOME=/root/soft/hadoop/apache-hive-0.13.1-bin

export JAVA_HOME=/root/soft/java/jdk1.7.0_65

export M2_HOME=/root/soft/apache-maven-3.2.1

export JRE_HOME=$JAVA_HOME/jre

export CLASSPATH=.:$JAVA_HOME/lib:$JRE_HOME/lib:$CLASSPATH

export PATH=$JAVA_HOME/bin:$PATH:$JRE_HOME/lib:$HADOOP_HOME/bin:$HIVE_HOME/bin:$M2_HOME/bin

依据解压后的详细路径改动

通过source /etc/profile然环境变量生效

3、验证

java -version 验证java

mvn -version 验证maven

三、编译hadoop

1、安装必要工具

centos下：

yum -y install lzo-devel zlib-devel gcc autoconf automake libtool

安装g++：yum -y install gcc-c++

安装cmake：yum -y install cmake

安装openssl-devel：yum -y install openssl-devel

ubuntu下为

apt-get -y install maven build-essential autoconf automake libtool cmake zlib1g-dev pkg-config libssl-dev

2、进入下载的protobuf-2.5.0文件夹下

cd protobuf-2.5.0

./configure

make

make install

（ubantu额外运行sudo ldconfig）

3、进入hadoop-2.4.1-src编译hadoop

cd hadoop-2.4.1-src

mvn clean package -Pdist,native -DskipTests -Dtar

4、普通情况下/root/soft/hadoop/hadoop-2.4.1-src/hadoop-hdfs-project/hadoop-hdfs-httpfs/downloads路径下的apache-tomcat-6.0.36.tar.gz下载不全然，

正常大小应该为6.47M左右。假设不正确请官网手动下载。路径为http://archive.apache.org/dist/tomcat/tomcat-6/v6.0.36/bin/apache-tomcat-6.0.36.tar.gz

5、替换hadoop-2.4.1/lib/native为编译后hadoop-2.4.1-src/hadoop-dist/target/hadoop-2.4.1/lib/native包

四、配置ssh

1、验证ssh

  ssh localhost

没有安装的话。运行yum -y install openssh-clients

2、运行命令

ssh-keygen -t dsa -P '' -f ~/.ssh/id_dsa

cat ~/.ssh/id_dsa.pub >> ~/.ssh/authorized_keys

   五、配置hadoop

1、etc/hadoop/core-site.xml:

<configuration>

    <property>

        <name>fs.defaultFS</name>

        <value>hdfs://localhost:9000</value>

    </property>

</configuration>
2、etc/hadoop/hdfs-site.xml:

<configuration>

    <property>

        <name>dfs.replication</name>

        <value>1</value>

    </property>

</configuration>
3、etc/hadoop/mapred-site.xml:

<configuration>

    <property>

        <name>mapreduce.framework.name</name>

        <value>yarn</value>

    </property>

</configuration>
4、etc/hadoop/yarn-site.xml:

<configuration>

    <property>

        <name>yarn.nodemanager.aux-services</name>

        <value>mapreduce_shuffle</value>

    </property>

</configuration>

5、etc/hadoop/hadoop-env.sh:

更改27行export JAVA_HOME=${JAVA_HOME}为

export JAVA_HOME=实际路径

    六、启动hadoop

1、进入hadoop文件夹 cd $HADOOP_HOME

2、格式化namenode：bin/hdfs namenode -format

3、启动dfs：sbin/start-dfs.sh

4、验证dfs：http://localhost:50070/

5、启动yarn：sbin/start-yarn.sh

6、官方小样例

bin/hdfs dfs -mkdir /user

bin/hdfs dfs -mkdir /user/<username>（username必须为用户名）

bin/hadoop jar share/hadoop/mapreduce/hadoop-mapreduce-examples-2.4.1.jar grep input output 'dfs[a-z.]+'

bin/hdfs dfs -get output output

cat output/*

    七、编译后的native包

ubuntu链接为http://download.csdn.net/detail/zhulin40/7698377

centos链接为http://download.csdn.net/detail/zhulin40/7698327

自己动手一步一步安装hadoop（含编译hadoop的native本地包）的更多相关文章

Centos编译Hadoop 2.x 源码
1. 前言 Hadoop-2.4.0的源码目录下有个BUILDING.txt文件,它介绍了如何在Linux和Windows下编译源代码,本文基本是遵照BUILDING.txt指示来操作的,这里再做一下 ...
Eclipse如何安装JD-Eclipse反编译插件
一.Eclipse在线安装JD-Eclipse反编译插件 1.在eclipse的help—>Install New Software...中添加新软件开发,添加它的源: name:jd-ecli ...
myeclipse和eclipse安装Java反编译插件
为myeclipse和eclipse安装Java反编译插件插件所需包 1.解压jad1.5.8g.zip.将jad.exe放到jre的bin目录下,下载地址: http://ishare.ia ...
一步一步hadoop安装
部署hadoop集群 1.下载jdk1.6,从http://www.oracle.com/technetwork/java/javase/downloads/java-archive-download ...
一步一步跟我学hadoop(1)----hadoop概述和安装配置
这几年云计算大数据非常火,借这个东风.今天開始学习apache的分布式计算框架hadoop,希望不要太落后. Hadoop说明对于hadoop.apache官方wiki给出的说明为 Apache H ...
12.Linux软件安装 (一步一步学习大数据系列之 Linux)
1.如何上传安装包到服务器有三种方式: 1.1使用图形化工具,如: filezilla 如何使用FileZilla上传和下载文件 1.2使用 sftp 工具: 在 windows下使用CRT 软件 ...
一步一步安装UEFI分区方式的windows 10 企业版
发现很多坛友不会安装UEFI分区的windows 10 从启动设置,到分区,到最后的引导与激活都是很大的问题. 在我看来这是最不容易出错的安装方式适合于刚刚上手的菜鸟,自己按照图片一步一步的就可以安装 ...
四步完成NodeJS安装,配置和测试
四步完成NodeJS安装,配置和测试 NodeJS 官网地址: http://nodejs.org/ 第一步:在官网点击 ’ INSTALL ’,下载相应的版本(我的机器是Win7专业版 64bit) ...
[ALM]一步一步搭建MS ALM环境 - 安装TFS + SQL SERVER
描述: 安装SQL SERVER 2012,安装TFS 2013,配置TFS,挽起袖子,准备干活儿步骤: 1,打开Hyper-V Manager,参考[Hyper-V]使用操作系统模板创建新的虚拟机 ...

随机推荐

洛谷 P1012 拼数 [字符串]
题目描述设有n个正整数(n≤20),将它们联接成一排,组成一个最大的多位整数. 例如:n=3时,3个整数13,312,343联接成的最大整数为:34331213 又如:n=4时,4个整数7,13,4 ...
遇见requestAnimationFrame
今天,在读javascript异步编程的js事件深入理解部分的时候,了解到了requestAnimationFrame 这个api,在这里记录一下. 原文: setTimeout 和 setInter ...
hibernate中session的线程安全问题
Hibernate的基本特征是完成面向对象的程序设计语言到关系数据库的映射,在Hibernate中使用持久化对象PO(Persistent Object)完成持久化操作,对PO的操作必须在Sessio ...
sdoi2018酱油鸡
ruand1滚粗啦,然后过来写游记四月是你の省选... day -1 老师突然告诉我们说 day2 回来参加月考,心态爆炸. day0 坐车,颓,和队爷zpd补了b站翻唱2017top100,晚上收 ...
[BZOJ2226]LCMSum
转化一下,$\sum\limits_{i=1}^n[i,n]=n\sum\limits_{i=1}^n\dfrac i{(i,n)}$ 枚举$d=(i,n)$,上式变为$n\sum\limits_{d ...
【DFS】Codeforces Round #398 (Div. 2) C. Garland
设sum是所有灯泡的亮度之和有两种情况: 一种是存在结点U和V,U是V的祖先,并且U的子树权值和为sum/3*2,且U不是根,且V的子树权值和为sum/3. 另一种是存在结点U和V,他们之间没有祖先 ...
【最短路】【spfa】小vijos P1447 Updown
小vijos P1447 Updown 背景开启了升降梯的动力之后,探险队员们进入了升降梯运行的那条竖直的隧道,映入眼帘的是一条直通塔顶的轨道.一辆停在轨道底部的电梯.和电梯内一杆控制电梯升降的巨大 ...
SpringMVC实现操作的第二种方式
一: 运行效果: 点击提交之后显示效果二: (1).web.xml <?xml version="1.0" encoding="UTF-8"?> ...
Android 架构 2.界面
其中,最上层的界面,是变化最频繁的一个层面,也是最复杂最容易出问题的一个层面,如果规划不好,很容易做着做着,又乱成一团了.要规划好界面层,至少应该遵循几条基本的原则: 保持规范性:定义好开发规范,包括 ...
EF需要注意的virtual，懒加载，还有1对n更新
1.如果实体类型有任何一个集合属性是 virtual 的,那么该属性会懒加载,在查询该对象时,看到的类型是代理对象(proxy_xxxx), 使用new来更新1对n关系时会增加 ).FirstOrD ...

自己动手一步一步安装hadoop（含编译hadoop的native本地包）

自己动手一步一步安装hadoop（含编译hadoop的native本地包）的更多相关文章

随机推荐

热门专题