hadoop 2.5.1 、Hadoop 2.7 Hadoop 2.6

1 rpm 安装

yum install rpm

2 JDK安装

《《一定要先删除JDK！！！！！！》》

rpm -qa | grep java

rpm -e --nodeps

rpm -qa | grep java

下载 JDK

tar -zxvf or xvf java

环境变量更改

/usr/local/opt/jdk1.7.0_67

jdk环境变量

8.1) vi /etc/profile

8.2)

export JAVA_HOME=/usr/local/opt/jdk1.7.0_67

export CLASSPATH=.:$JAVA_HOME/lib/dt.jar:$JAVA_HOME/lib/tools.jar

export PATH=$PATH:$JAVA_HOME/bin

1 下载Hadoop

wget http://mirror.bit.edu.cn/apache/hadoop/common/hadoop-2.5.1/hadoop-2.5.1.tar.gz

wget http://mirror.bit.edu.cn/apache/hbase/hbase-1.0.2/hbase-1.0.2-bin.tar.gz

wget http://mirror.bit.edu.cn/apache/hbase/1.1.2/hbase-1.1.2-bin.tar.gz

wget http://mirror.bit.edu.cn/apache/hadoop/common/hadoop-2.7.2/hadoop-2.7.2.tar.gz

wget http://mirror.bit.edu.cn/apache/hadoop/common/hadoop-2.6.0/hadoop-2.6.0.tar.gz

如果环境变量崩了就子机whereis vim 应该是这样 /usr/bin/vim /etc/profile

hadoop 环境变量

vi /etc/profile

/usr/local/opt/hadoop-2.5.1

/home/hadoop/hadoop/hadoop-2.6.0

export HADOOP_HOME=/usr/local/opt/hadoop-2.7.2

export CLASSPATH=.:$JAVA_HOME/lib:$JRE_HOME/lib:$HADOOP_HOME/lib:$HIVE_HOME/lib

export PATH=$PATH:$JAVA_HOME/bin:$JRE_HOME/bin:$HADOOP_HOME/bin:$HIVE_HOME/bin

hive 环境变量

export HIVE_HOME=/usr/hive-0.11.0

4 hdfs 初始化 yarn 初始化

进入hadoop下面的etc/hadoop/不是系统的etc，是hadoop下面的），ls，看到很多配置文件。

修改core-site.xml

<configuration>
<property>
<name>fs.defaultFS</name>
<value</value>
</property>
<property>
<name>hadoop.tmp.dir</name>
<value>/opt/hadoop-data/tmp/hadoop-${user.name}</value>
<description>A base for other temporary directories.</description>
</property>
</configuration>

修改hdfs-site.xml

<configuration>
<property>
<name>dfs.namenode.name.dir</name>
<value></value>
</property>
<property>
<name>dfs.datanode.data.dir</name>
<value>/hdfs/data</value>
</property>
<property>
<name>dfs.permissions</name>
<value>false</value>
</property>
<property>
<name>dfs.federation.nameservices</name>
<value>t1</value>
</property>
<property>
<name>dfs.namenode.rpc-address.master</name>
<value>t1:9000</value>
</property>
<property>
<name>dfs.namenode.http-address.master</name>
<value>t1:23001</value>
</property>
<property>
<name>dfs.namenode.secondary.http-address.master</name>
<value>t1:23002</value>
</property>

</configuration>

修改mapred-site.xml

<name>mapreduce.framework.name</name>

</property>

<name>mapreduce.jobhistory.address</name>

</property>

<name>mapreduce.jobhistory.webapp.address</name>

</property>

</configuration>

修改yarn-site.xml

<name>yarn.nodemanager.aux-services</name>

<value>mapreduce_shuffle</value>

</property>

<name>yarn.nodemanager.aux-services.mapreduce.shuffle.class</name>

<value>org.apache.hadoop.mapred.ShuffleHandler</value>

</property>

host is the hostname of the resource manager and port is the port on which the NodeManagers contact the Resource Manager

</description>

<name>yarn.resourcemanager.resource-tracker.address</name>

</property>

the hostsis the hostname of the ResourceManager and the port is the port on which the clients can talk to the Resource Manager.

</description>

<name>yarn.resourcemanager.address</name>

</property>

host is the hostname of the resourcemanager and port is the port on which the Applications in the cluster talk to the Resource Manager.

</description>

<name>yarn.resourcemanager.scheduler.address</name>

</property>

<description>The address of the RM admin interface.</description>

<name>yarn.resourcemanager.admin.address</name>

</property>

<description>Resource Manager的Web访问地址</description>

<name>yarn.resourcemanager.webapp.address</name>

</property>

<name>yarn.nodemanager.local-dirs</name>

<value>${hadoop.tmp.dir}/nodemanager/local</value>

<description>the local directories used by the nodemanager to store the temp file</description>

</property>

<name>yarn.nodemanager.log-dirs</name>

<value>${hadoop.tmp.dir}/nodemanager/logs</value>

<description>the directories used by Nodemanagers as log directories</description>

</property>

</configuration>

修改 hadoop-env.sh、yarn-env.sh

export JAVA_HOME=/usr/local/jdk

5 配置 slave

vi etc/hadoop/slaves

加入

6 HDFS 初始化

./bin/hdfs namenode -format

如果 format 出异常 JAVA环境变量监察一下。

7 将 hadoop 目录分发至其余节点

整文件夹拷贝

scp -r file root@slave1:/path

8 启动所有。

./sbin/start-all.sh

http://master:50070/ hdfs

http://master:50030/ mapReduce

成功后可以运行个例子

hadoop-2.7.2/share/hadoop/mapreduce 这里有一坨。

**************************** HDFS ***************************

yum install gcc

查看系统的libc版本
# ll /lib64/libc.so.6
lrwxrwxrwx 1 root root 11 Apr 24 16:49 /lib64/libc.so.6 -> libc-2.5.so
系统中的版本为2.5
将系统中的glibc升级为2.9
下载glibc
wget http://ftp.gnu.org/gnu/glibc/glibc-2.9.tar.bz2
下载glibc-linuxthreads
wget http://ftp.gnu.org/gnu/glibc/glibc-linuxthreads-2.5.tar.bz2
解压
$tar -jxvf glibc-2.9.tar.bz2
$cd glibc-2.9
$tar -jxvf ../glibc-linuxthreads-2.5.tar.bz2
$cd ..
$export CFLAGS="-g -O2"
$./glibc-2.9/configure --prefix=/usr --disable-profile --enable-add-ons --with-headers=/usr/include --with-binutils=/usr/bin
$make
#make install
安装编译过程中需要注意三点：
1、要将glibc-linuxthreads解压到glibc目录下。
2、不能在glibc当前目录下运行configure。
3、加上优化开关，export CFLAGS="-g -O2"，否则会出现错误

***************************** HIVE *****************************

http://apache.fayea.com/hive/

hadoop 2.5.1 、Hadoop 2.7 Hadoop 2.6的更多相关文章

hadoop与云技术、云计算混肴澄清
本文引用自:http://www.aboutyun.com/blog-61-248.html 一.初学者问题: 请教个问题在实际的生成环境里面,数据源产生的地方部署Hadoop,还是需要程序把数据给迁 ...
Hadoop — HDFS的概念、原理及基本操作
1. HDFS的基本概念和特性设计思想——分而治之:将大文件.大批量文件分布式存放在大量服务器上,以便于采取分而治之的方式对海量数据进行运算分析.在大数据系统中作用:为各类分布式运算框架(如:map ...
Hadoop家族学习路线、实践案例
作者:Han Hsiao链接:https://www.zhihu.com/question/19795366/answer/24524910来源:知乎著作权归作者所有.商业转载请联系作者获得授权,非商 ...
hadoop第一部分-安装、测试
一.hadoop安装(本地模式及伪分布式安装) hadoop历史版本下载网站:http://archive.apache.org/dist/运行模式: 本地模式 yarn模式 hadoop ...
hadoop配置文件详解、安装及相关操作
一. Hadoop伪分布配置 1. 在conf/hadoop-env.sh文件中增加:export JAVA_HOME=/home/Java/jdk1.6 2. 在c ...
【转帖】Hadoop — HDFS的概念、原理及基本操作
Hadoop — HDFS的概念.原理及基本操作 https://www.cnblogs.com/swordfall/p/8709025.html 分类: Hadoop undefined 1. HD ...
五十九.大数据、Hadoop 、 Hadoop安装与配置、 HDFS
1.安装Hadoop 单机模式安装Hadoop 安装JAVA环境设置环境变量,启动运行 1.1 环境准备 1)配置主机名为nn01,ip为192.168.1.21,配置yum源(系统源) 备 ...
linux运维、架构之路-Hadoop完全分布式集群搭建
一.介绍 Hadoop实现了一个分布式文件系统(Hadoop Distributed File System),简称HDFS.HDFS有高容错性的特点,并且设计用来部署在低廉的(low-cost)硬件 ...
hadoop配置文件详解、安装及相关操作补充版
一. Hadoop伪分布配置首先应该现在profile文件添加hadoop_home操作如下: export JAVA_HOME=/usr/java/jdk expor ...

随机推荐

php面向对象的基础：OOP的常量
常量(constant) 用来表示不会改变的值.对于从该类实例化的任何对象来说,常量值在这些对象的整个生命周期中都保持不变. class Computer{ const PI=3.1415926; } ...
python中的json
import json# dumps #一般处理字符串# dump #一般处理文件 #字符串和json之间的转换test_dict={"name":"fxh", ...
C#获取实例运行时间StopWatch类
在程序运行时有时需要获取某一步骤的操作时间,C#提供的StopWatch类可以很方便的实现这一目的. StopWatch sw=new StopWatch(); sw.Start(); //Do So ...
线性规划（LP）资料下载
1.学习用PPT harvard gondzio IOE610 mit cxg286 含matlab程序 2.测试库 BPMPD netlib fsu 3.软件测试 BENCHMARKS FOR OP ...
Kneser猜想与相关推广
本文本来是想放在Borsuk-Ulam定理的应用这篇文章当中.但是这个文章实在是太长,导致有喧宾夺主之嫌,从而独立出为一篇文章,仅供参考.$\newcommand{\di}{\mathrm{dist} ...
[MST] Test mobx-state-tree Models by Recording Snapshots or Patches
Testing models is straightforward. Especially because MST provides powerful tools to track exactly h ...
POJ 1743 Musical Theme 后缀数组不可重叠最长反复子串
二分长度k 长度大于等于k的分成一组每组sa最大的和最小的距离大于k 说明可行 #include <cstdio> #include <cstring> #include & ...
设计模式-策略模式(Go语言描写叙述)
好久没有更新博客了.近期也是在忙着充电,今天这篇博客開始,我们来了解一下设计模式. 设计模式那什么是设计模式呢?首先来看看我从百科上copy下来的概念吧. 设计模式/软件设计模式(Design pa ...
51nod-1273: 旅行计划
[传送门:51nod-1273] 简要题意: 给出一棵树,点数为n,现在你有一个旅行计划,从k城市出发,每天前往一个没去过的城市,并且旅途中经过的没有去过的城市尽可能的多(如果有2条路线,经过的没有去 ...
bzoj1026: [SCOI2009]windy数（传说你是数位DP）
1026: [SCOI2009]windy数题目:传送门题解: 其实之前年少无知的时候好像A过...表示当时并不知道什么数位DP 今天回来深造一发... 其实如果对这个算法稍有了解...看到这题的 ...

hadoop 2.5.1 、Hadoop 2.7 Hadoop 2.6

hadoop 2.5.1 、Hadoop 2.7 Hadoop 2.6的更多相关文章

随机推荐

热门专题