Centos 6.5 hadoop 2.2.0 全分布式安装

http://xjliao.me/2014/03/21/hadoop-2.2.0-cluster-setup.html

==============================

cluster: n0,n1,n2

n0:NameNode,ResourceManager ;

n1.n2:DataNode,NodeManager;

1. prerequiration

1.1 添加用户hm

#useradd hm

#passwd hm

1.2 jdk 1.6/1.7

Remove OpenJDK.
yum -y remove *jdk*
yum -y remove *java*

1.3 ssh 无密码登录

  1.所有机器: 使用hm用户登录

      $cd /home/hm

      $mkdir .ssh

   2.  在namenode上生成密钥对

     $ ssh-keygen -t dsa -P '' -f ~/.ssh/id_dsa

     $ cat ~/.ssh/id_dsa.pub >> ~/.ssh/authorized_keys

    2.1  .ssh目录要设成700 有执行权限

    2.2  authorized_keys要设成600 否则会出错

    2.3  还有ssh 登陆要加入用户名的 比如(需要密码)

      $ssh  n1

      $ssh  n2

   3. 复制公钥(需要密码)

      $cd   .ssh

      $scp  authorized_keys   n1:/home/hm/.ssh

    $scp   authorized_keys  n2:/home/hm/.ssh

   4.测试 (！！不需要密码)

     ssh  n1

     ssh  n2

2. hadoop 通用配置

2.1 hadoop-env.sh

2.2 slave 工作节点

3. hadoop四大组件配置

3.1 组件core-site.xml

<?xml version="1.0" encoding="UTF-8"?>

<?xml-stylesheet type="text/xsl" href="configuration.xsl"?>

<configuration>

<property>

<name>fs.defaultFS</name>

<value>hdfs://n0:9000</value>

</property>

<property>

<name>io.file.buffer.size</name>

<value>131072</value>

</property>

<property>

<name>hadoop.tmp.dir</name>

<value>file:/home/hm/temp</value>

</property>

<property>

<name>hadoop.proxyuser.hm.hosts</name>

<value>*</value>

</property>

<property>

<name>hadoop.proxyuser.hm.groups</name>

<value>*</value>

</property>

</configuration>

3.2 组件 hdfs-site.xml

<?xml version="1.0" encoding="UTF-8"?>

<?xml-stylesheet type="text/xsl" href="configuration.xsl"?>

<configuration>

<property>

<name>dfs.namenode.secondary.http-address</name>

<value>n0:9001</value>

</property>

<property>

<name>dfs.namenode.name.dir</name>

<value>file:/home/hm/dfs/name</value>

</property>

<property>

<name>dfs.datanode.data.dir</name>

<value>file:/home/hm/dfs/data</value>

</property>

<property>

<name>dfs.replication</name>

<value>2</value>

</property>

<property>

<name>dfs.webhdfs.enabled</name>

<value>true</value>

</property>

</configuration>

3.3 组件yarn-site.xml

<?xml version="1.0"?>

<configuration>

<!-- Site specific YARN configuration properties -->

<property>

<name>yarn.nodemanager.aux-services</name>

<value>mapreduce_shuffle</value>

</property>

<property>

<name>yarn.nodemanager.aux-services.mapreduce.shuffle.class</name>

<value>org.apache.hadoop.mapred.ShuffleHandler</value>

</property>

<property>

<name>yarn.resourcemanager.address</name>

<value>n0:8032</value>

</property>

<property>

<name>yarn.resourcemanager.scheduler.address</name>

<value>n0:8030</value>

</property>

<property>

<name>yarn.resourcemanager.resource-tracker.address</name>

<value>n0:8031</value>

</property>

<property>

<name>yarn.resourcemanager.admin.address</name>

<value>n0:8033</value>

</property>

<property>

<name>yarn.resourcemanager.webapp.address</name>

<value>n0:8088</value>

</property>

</configuration>

3.4 组件mapred-site.xml

<?xml version="1.0"?>

<?xml-stylesheet type="text/xsl" href="configuration.xsl"?>

<configuration>

<property>

<name>mapreduce.framework.name</name>

<value>yarn</value>

</property>

<property>

<name>mapreduce.jobhistory.address</name>

<value>n0:10020</value>

</property>

<property>

<name>mapreduce.jobhistory.webapp.address</name>

<value>n0:19888</value>

</property>

</configuration>

4. 启动和停止

4.1 启动

sbin/start-dfs.sh

sbin/start-yarn.sh

4.2 停止

sbin/stop-dfs.sh

sbin/stop-yarn.sh

5.测试

运行wordcount单词计数案例：

$ mkdir input
$ cat > input/file
This is word count example
using hadoop 2.2.0

将目录加入hadoop:

$ bin/hadoop hdfs -copyFromLocal input /input

在HADOOP_HOME运行wordcount案例：:
$ bin/hadoop jar share/hadoop/mapreduce/hadoop-mapreduce-examples-2.3.0.jar wordcount /input /output
检查输出：
$ bin/hadoop dfs -cat /out/*

===================

yarn hadoop-2.3.0 installation cluster Centos 64bits的更多相关文章

Centos 6.5 hadoop 2.2.0 全分布式安装
hadoop 2.2.0 cluster setup 环境: 操作系统:Centos 6.5 jdk:jdk1.7.0_51 hadoop版本:2.2.0 hostname ip master ...
Hadoop 3.0完全分布式集群搭建方法（CentOS 7+Hadoop 3.2.0）
本文详细介绍搭建4个节点的完全分布式Hadoop集群的方法,Linux系统版本是CentOS 7,Hadoop版本是3.2.0,JDK版本是1.8. 一.准备环境 1. 在VMware worksta ...
Centos 6.5 X64 环境下编译 hadoop 2.6.0 --已验证
Centos 6.5 x64 hadoop 2.6.0 jdk 1.7 protobuf-2.5.0 maven-3.0.5 set environment export JAVA_HOME=/hom ...
CentOS 6.4 64位源码编译hadoop 2.2.0
搭建环境:Centos 6.4 64bit 1.安装JDK 参考这里2.安装mavenmaven官方下载地址,可以选择源码编码安装,这里就直接下载编译好的wget http://mirror.bit. ...
64位CentOS上编译 Hadoop 2.2.0
下载了Hadoop预编译好的二进制包,hadoop-2.2.0.tar.gz,启动起来后.总是出现这样的警告: WARN util.NativeCodeLoader: Unable to load n ...
CentOS 64位上编译 Hadoop 2.6.0
Hadoop不提供64位编译好的版本号,仅仅能用源代码自行编译64位版本号. 学习一项技术从安装開始.学习hadoop要从编译開始. 1.操作系统编译环境 yum install cmake lzo- ...
基于Hadoop 2.2.0的高可用性集群搭建步骤（64位）
内容概要: CentSO_64bit集群搭建, hadoop2.2(64位)编译,安装,配置以及测试步骤新版亮点: 基于yarn计算框架和高可用性DFS的第一个稳定版本. 注1:官网只提供32位re ...
Hadoop 2.6.0分布式部署參考手冊
Hadoop 2.6.0分布式部署參考手冊关于本參考手冊的word文档.能够到例如以下地址下载:http://download.csdn.net/detail/u012875880/8291493 ...
hadoop 2.2.0集群安装
相关阅读: hbase 0.98.1集群安装本文将基于hadoop 2.2.0解说其在linux集群上的安装方法,并对一些重要的设置项进行解释,本文原文链接:http://blog.csdn.net ...

随机推荐

topcoder srm 495 div1
problem1 link 从前向后确定一下,然后再从后向前确定一下.一样的话就是可以确定的. problem2 link 首先将强连通分量缩点.理论上来说,只需要遍历所有入度为0的联通块中的一个即可 ...
tp框架中的一些疑点知识-3
rewrite就是伪静态, 伪静态就是 rewirte, 可以把入口地址隐藏掉. 兼容模式就是普通模式和 pathinfo模式的结合, 前面是普通模式 ?s= , 后面的模块/控制器/操作和参 ...
windows下如何安装vundle?
参考: http://blog.csdn.net/zhuxiaoyang2000/article/details/8636472 vundle是gmarik 受 ruby的 bunler的启发开发的. ...
luoguP4072 [SDOI2016]征途
[SDOI2016]征途大体大概就是推推公式,发现很傻逼的$n^3$DP get60 进一步我们发现状态不能入手,考虑优化转移套个斜率优化板子每一层转移来一次斜率优化思路先便便式子 \ ...
bitset，2018蓝桥杯-明码（二进制转换）
bitset可以存储二进制数位 bitset<8> x(2); cout<<x<<endl; //输出:00000010 #include <iostream ...
HDU 1392 Surround the Trees（凸包）题解
题意:给一堆二维的点,问你最少用多少距离能把这些点都围起来思路: 凸包: 我们先找到所有点中最左下角的点p1,这个点绝对在凸包上.接下来对剩余点按照相对p1的角度升序排序,角度一样按距离升序排序.因 ...
Trim Galore用法及参数考量
Trim Galore是一个非常流行的用于「去接头序列」的软件,用于处理高通量测序得到的原始数据.通常我们从测序公司拿到数据后,第一步就是评估数据的质量以及对raw data去接头处理.公司拿来的数据 ...
LOJ 6485 LJJ学多项式
前言蒟蒻代码惨遭卡常,根本跑不过前置芝士--单位根反演单位根有这样的性质: \[ \frac{1}{n}\sum_{i=0}^{n-1}\omega_{n}^{ki}=\left[n|k\rig ...
facebook api之Business Manager API
Business-scoped Users - The new user is tied to a particular business and has permissions scoped to ...
精通正则表达式（第三版）—Mastering Regular Expressions,3rd Edition—读书笔记2
1.肯定断言:必须匹配一个字符排除型字符组:匹配未列出字符的字符组 2.范围表示法——列出范围内所有的字符大多数情况下,不会影响执行速度.但是,某些实现方式不能完全优化字符组.所以,最好是有范围表 ...

yarn hadoop-2.3.0 installation cluster Centos 64bits

Apache Hadoop -2.2.0 - How to Install a Three Nodes Cluster

Centos 6.5 hadoop 2.2.0 全分布式安装

yarn hadoop-2.3.0 installation cluster Centos 64bits的更多相关文章

随机推荐

热门专题