一个4节点Hadoop集群的配置示例

环境：

操作系统：CentOS 6.5 64bit

Hadoop：Version 1.2.1

Servers：hadoopnamenode，hadoop2ndnamenode，hadoopdatanode1，hadoopdatanode2

注：为方便起见，在这4台server上，我都直接使用root账户进行操作

下载及环境变量设置：

在所有4台server上：

从Apache网站下载hadoop-1.2.1-bin.tar.gz，解压后放置在某个目录下，我放在了/usr/local下，为方便起见，我把目录hadoop-1.2.1改名为hadoop。

修改.bashrc，添加下面的环境变量：

export HADOOP_PREFIX=/usr/local/hadoop

export PATH=$PATH:$HADOOP_PREFIX/bin

配置hosts文件：

在/etc/hosts中添加：

153.65.170.11 hadoopnamenode

153.65.170.45 hadoop2ndnamenode

153.65.171.174 hadoopdatanode1

153.65.171.24 hadoopdatanode2

配置ssh：

在hadoopnamenode上执行：

ssh-keygen//生成公钥、私钥

ssh-copy-id   –i   ~/.ssh/id_rsa.pub   root@hadoop2ndnamenode//将hadoopnamenode的公钥copy到其它三台server上

ssh-copy-id   –i   ~/.ssh/id_rsa.pub   root@hadoopdatanode1

ssh-copy-id   –i   ~/.ssh/id_rsa.pub   root@hadoopdatanode2

这么做的目的是可以不需要密码从hadoopnamenode上ssh到其它三台server上。经过ssh-copy-id后，这个公钥实际上会被添加到其它三台server的~/.ssh/authorized_keys文件中。

例如要从hadoopnamenode登录hadoop2ndnamenode，其流程大概是：hadoop2ndnamenode向hadoopnamenode发送一段随机字符串，hadoopnamenode用自己的私钥加密后，再发回来。hadoop2ndnamenode用事先储存的hadoopnamenode公钥进行解密，如果成功，就证明用户是可信的，直接允许登录shell，不再要求密码。

配置Hadoop：

一般地，我们将使用下面的命令启动hdfs（即name node, secondary name node, data node）及MapReduce：

/usr/local/hadoop/bin/start-dfs.sh

/usr/local/hadoop/bin/start-mapred.sh

start-dfs.sh的流程大概是这样：

执行该命令的机器自动成为name node(以及job tracker)，
启动/usr/local/hadoop/conf /slaves中列出的所有机器并作为data node(以及task tracker)，
启动/usr/local/hadoop/conf /masters中列出的所有机器并作为secondary name node。

start-mapred.sh的流程类似：

执行该命令的机器自动成为job tracker，
启动/usr/local/hadoop/conf /slaves中列出的所有机器并作为task tracker

注：conf/masters文件往往给人带来困惑，直观上让人觉得它是为配置name node所用，但是因为(1)的原因，name node是不需要特别配置到conf/masters中，需要配置的只有secondary name node。

根据以上描述，我们可以开始修改hadoopnamenode上的masters文件，删除原内容，添加一行：

hadoop2ndnamenode

修改hadoopnamenode上的slaves文件，删除原内容，添加两行：

hadoopdatanode1

hadoopdatanode2

除此之外，需要在hadoopdatanode1与hadoopdatanode2上作出配置，使得data node知道name node，task tracker知道job tracker。所以分别修改hadoopdatanode1与hadoopdatanode2上的conf/core-site.xml：

<configuration>

<property>

<name>fs.default.name</name>

<value>hdfs://hadoopnamenode:10001</value>

</property>

</configuration>

及conf/mapred-site.xml：

<configuration>

<property>

<name>mapred.job.tracker</name>

<value>hadoopnamenode:10002</value>

</property>

</configuration>

格式化name node：

在hadoopnamenode上执行：

hadoop namenode -format

启动Hadoop：

首先，在hadoopnamenode上执行下面命令来启动所有name node, secondary name node, data node：

start-dfs.sh

可以使用jps命令在4台server上查看当前运行的java进程，正常情况你会看到：

hadoopnamenode上有进程：NameNode

hadoop2ndnamenode上有进程：SecondaryNameNode

hadoopdatanode1/hadoopdatanode2上有进程：DataNode

其次，在hadoopnamenode上执行下面命令来启动所有job tracker, task tracker：

start-mapred.sh

继续使用jps命令在4台server上查看当前运行的java进程，正常情况你会看到：

hadoopnamenode上有进程：NameNode, JobTracker

hadoop2ndnamenode上有进程：SecondaryNameNode

hadoopdatanode1/hadoopdatanode2上有进程：DataNode, TaskTracker

关闭Hadoop：

在hadoopnamenode上：

stop-mapred.sh

stop-dfs.sh

其它：

Name node管理界面：http://hadoopnamenode:50070/

Job tracker 管理界面：http://hadoopnamenode:50030/

一个4节点Hadoop集群的配置示例的更多相关文章

【Big Data】HADOOP集群的配置（一）
Hadoop集群的配置(一) 摘要: hadoop集群配置系列文档,是笔者在实验室真机环境实验后整理而得.以便随后工作所需,做以知识整理,另则与博客园朋友分享实验成果,因为笔者在学习初期,也遇到不少问 ...
【Big Data】HADOOP集群的配置（二）
Hadoop集群的配置(二) 摘要: hadoop集群配置系列文档,是笔者在实验室真机环境实验后整理而得.以便随后工作所需,做以知识整理,另则与博客园朋友分享实验成果,因为笔者在学习初期,也遇到不少问 ...
基于Docker快速搭建多节点Hadoop集群--已验证
Docker最核心的特性之一,就是能够将任何应用包括Hadoop打包到Docker镜像中.这篇教程介绍了利用Docker在单机上快速搭建多节点 Hadoop集群的详细步骤.作者在发现目前的Hadoop ...
Hadoop集群的配置（一）
摘要: hadoop集群配置系列文档,是笔者在实验室真机环境实验后整理而得.以便随后工作所需,做以知识整理,另则与博客园朋友分享实验成果,因为笔者在学习初期,也遇到不少问题.但是网上一些文档大多互相抄 ...
Hadoop的学习前奏（二）——Hadoop集群的配置
前言: Hadoop集群的配置即全然分布式Hadoop配置. 笔者的环境: Linux: CentOS 6.6(Final) x64 JDK: java version "1.7 ...
hadoop 集群的配置
在经过几天折腾,终于将hadoop环境搭建成功,整个过程中遇到各种坑,反复了很多遍,光虚拟机就重新安装了4.5次,接下来就把搭建的过程详细叙述一下 0.相关工具: 1,系统环境说明: 我这边给出我的集 ...
Hadoop集群安装配置教程_Hadoop2.6.0_Ubuntu/CentOS
摘自:http://www.powerxing.com/install-hadoop-cluster/ 本教程讲述如何配置 Hadoop 集群,默认读者已经掌握了 Hadoop 的单机伪分布式配置,否 ...
从VMware虚拟机安装到hadoop集群环境配置详细说明（第一期）
http://blog.csdn.net/whaoxysh/article/details/17755555 虚拟机安装我安装的虚拟机版本是VMware Workstation 8.04,自己电脑上 ...
三节点Hadoop集群搭建
1. 基础环境搭建新建3个CentOS6.5操作系统的虚拟机,命名(可自定)为masternode.slavenode1和slavenode2.该过程参考上一篇博文CentOS6.5安装配置详解 2 ...

随机推荐

CGRectXXX笔记
CoreGraphics中有关CGRect相关函数笔记 1.CGRectInset //该结构体的应用是以原rect为中心,再参考dx,dy,进行缩放或者放大. CGRect rect = CGRec ...
html5新特性之音频、视频
1.视频标签video video标签的属性属性描述 autoplay 视频就绪后自动播放 preload 视频在页面加载时加载 loop 视频播放完成后循环播放 controls 显示控件 s ...
matlab微分方程dsolve使用
y=dsolve('Dy=exp(-x-y-2)','y(0)=-2','x') dy/dx 写成Dy (注意大小写) y(0)=-2 表示初始条件 'x'表示积分变量
android --- Afianl框架里面的FinalBitmap加载网络图片
Afinal里面FinalBitmap:用于显示bitmap图片,而无需考虑线程并发和oom等问题. 1.测试请求使用网页打开http://avatar.csdn.net/C/6/8/1_bz419 ...
spinner与arrays.xml的使用
在Android中,用string-array是一种简单的提取XML资源文件数据的方法. 例: 把相应的数据放到values/arrays.xml文件里 <?xml version=" ...
python+图像分割seg
好痛苦 1.目前思路为HOG+SVM 提取HOG时候发现,包装的lib cv2 里有hog算子,但是函数是指针形式.不会用了.. 现在改用推荐的scikits.image , from skimage ...
配置本地IIS和VS自带IIS
以前调试网站一直用的vs自带的IIS,做为学习没啥大碍,但要是用于团队项目开发就会带来诸多不便.团队开发项目有统一的网站端口号.文件目录什么的,端口号可以在配置文件中修改倒也没啥,但是要在自己的项目中 ...
.NET 实现自定义ContextUser的Identity和Principal实现自定义用户信息，权限验证。
备用收藏,http://blog.csdn.net/msdnxgh/article/details/6894885 .NET 实现自定义ContextUser的Identity和Principal 在 ...
C#设计模式(17)——观察者模式（Observer Pattern）
一.引言在现实生活中,处处可见观察者模式,例如,微信中的订阅号,订阅博客和QQ微博中关注好友,这些都属于观察者模式的应用.在这一章将分享我对观察者模式的理解,废话不多说了,直接进入今天的主题. 二. ...
C#设计模式(14)——模板方法模式（Template Method）
一.引言提到模板,大家肯定不免想到生活中的“简历模板”.“论文模板”.“Word中模版文件”等,在现实生活中,模板的概念就是——有一个规定的格式,然后每个人都可以根据自己的需求或情况去更新它,例如简 ...

一个4节点Hadoop集群的配置示例

一个4节点Hadoop集群的配置示例的更多相关文章

随机推荐

热门专题