[版权申明：本文系作者原创，转载请注明出处]

文章出处：http://www.cnblogs.com/sdksdk0/p/5585355.html

作者：朱培 ID：sdksdk0

--------------------------------------------------

在我之前的一篇博客中，已经分享了关于hadoop的基本配置，地址：http://blog.csdn.net/sdksdk0/article/details/51498775，但是那个是使用与初学者学习和测试的，今天用分享的这个比上次那个要复杂一些，主要是加了zookeeper和两台namenode的配置，同时使用这种方式，可以解决服务器的脑裂问题。

一、hdfs的HA机制

NameNode服务器一台是ACTIVE和一台是STANDBY。通过Qjournal(日志管理系统) 使用zkfc（基于zookeeper失败切换控制)

如何防止脑裂现象：当ACTIVE假死的时候，STANDBY的zkfc会发出指令 ssh kill-9 namenode 返回0（成功杀死，返回1则杀死失败）的时候再去通知第二台namenode去切换状态。若无返回码的时候（超时未响应),则启动proweroff.sh（用户自定义的脚本）给第一台namenode断电，返回0则执行正常，然后去切换。

当第一台机器断电的时候（指活跃状态的namenode和zkfc都断电了)，则第2台的zkfc会执行proweroff.sh。

关键词： 1、有两个namenode,分别是active和standby.

2、有两个zkfc来监控和管理两个namenode的状态

3、元数据日志edits由一个专门的日志系统负责管理--qjoournal

4、zkfc及qjournal的功能都要依赖于zookeeper的服务来实现

5、zkfc做状态切换时有两个防止脑裂的机制--ssh和shell脚本。

二、Hadoop集群的配置

打开hadoop的安装目录，如果还不会下载或者基础都不会使用的请看文章开头我提供的链接，请先学习基础配置。我这里主要使用了5台虚拟机来模拟搭建这整个集群环境。

主机名 IP地址主要功能

ubuntu1 192.168.44.128 namenode zkfc ResourceManager

ubuntu2 192.168.44.131 namenode zkfc ResourceManager

ubuntu3 192.168.44.132 DataNode、NodeManager、JournalNode、QuorumPeerMain

ubuntu4 192.168.44.133 DataNode、NodeManager、JournalNode、QuorumPeerMain

ubuntu5 192.168.44.134 DataNode、NodeManager、JournalNode、QuorumPeerMain

我们可以先来配置ubuntu1，然后剩下的就scp到其他机器上就可以了

core-site.xml

<configuration>

    <property>

        <name>fs.defaultFS</name>

        <value>hdfs://ns1/</value>

    </property>

    <!-- 指定hadoop临时目录 -->

    <property>

        <name>hadoop.tmp.dir</name>

        <value>/home/admin1/hadoop/HAhadoop/tmp/hadoop</value>

    </property>

    <!-- 指定zookeeper地址 -->

    <property>

        <name>ha.zookeeper.quorum</name>

        <value>ubuntu3:2181,ubuntu4:2181,ubuntu5:2181</value>

        </property>

</configuration>

hdfs-site.xml

<configuration>

					<!--指定hdfs的nameservice为ns1，需要和core-site.xml中的保持一致 -->

					<property>

						<name>dfs.nameservices</name>

						<value>ns1</value>

					</property>

					<!-- ns1下面有两个NameNode，分别是nn1，nn2 -->

					<property>

						<name>dfs.ha.namenodes.ns1</name>

						<value>nn1,nn2</value>

					</property>

					<!-- nn1的RPC通信地址 -->

					<property>

						<name>dfs.namenode.rpc-address.ns1.nn1</name>

						<value>ubuntu1:9000</value>

					</property>

					<!-- nn1的http通信地址 -->

					<property>

						<name>dfs.namenode.http-address.ns1.nn1</name>

						<value>ubuntu1:50070</value>

					</property>

					<!-- nn2的RPC通信地址 -->

					<property>

						<name>dfs.namenode.rpc-address.ns1.nn2</name>

						<value>ubuntu2:9000</value>

					</property>

					<!-- nn2的http通信地址 -->

					<property>

						<name>dfs.namenode.http-address.ns1.nn2</name>

						<value>ubuntu2:50070</value>

					</property>

					<!-- 指定NameNode的元数据在JournalNode上的存放位置 -->

					<property>

						<name>dfs.namenode.shared.edits.dir</name>

						<value>qjournal://ubuntu3:8485;ubuntu4:8485;ubuntu5:8485/ns1</value>

					</property>

					<!-- 指定JournalNode在本地磁盘存放数据的位置 -->

					<property>

						<name>dfs.journalnode.edits.dir</name>

						<value>/home/admin1/hadoop/HAhadoop/journaldata</value>

					</property>

					<!-- 开启NameNode失败自动切换 -->

					<property>

						<name>dfs.ha.automatic-failover.enabled</name>

						<value>true</value>

					</property>

					<!-- 配置失败自动切换实现方式 -->

					<property>

						<name>dfs.client.failover.proxy.provider.ns1</name>

						<value>org.apache.hadoop.hdfs.server.namenode.ha.ConfiguredFailoverProxyProvider</value>

					</property>

					<!-- 配置隔离机制方法，多个机制用换行分割，即每个机制暂用一行-->

					<property>

						<name>dfs.ha.fencing.methods</name>

						<value>

							sshfence

							shell(/bin/true)

						</value>

					</property>

					<!-- 使用sshfence隔离机制时需要ssh免登陆 -->

					<property>

						<name>dfs.ha.fencing.ssh.private-key-files</name>

						<value>/home/admin1/.ssh/id_rsa</value>

					</property>

					<!-- 配置sshfence隔离机制超时时间 -->

					<property>

						<name>dfs.ha.fencing.ssh.connect-timeout</name>

						<value>30000</value>

					</property>

				</configuration>

mapred-site.xml

  <configuration>

                <!-- 指定mr框架为yarn方式 -->

               <property>

                   <name>mapreduce.framework.name</name>

                   <value>yarn</value>

               </property>

            </configuration>

yarn-site.xml

<configuration>

<!-- 开启RM高可用 -->

						<property>

						   <name>yarn.resourcemanager.ha.enabled</name>

						   <value>true</value>

						</property>

						<!-- 指定RM的cluster id -->

						<property>

						   <name>yarn.resourcemanager.cluster-id</name>

						   <value>yrc</value>

						</property>

						<!-- 指定RM的名字 -->

						<property>

						   <name>yarn.resourcemanager.ha.rm-ids</name>

						   <value>rm1,rm2</value>

						</property>

						<!-- 分别指定RM的地址 -->

						<property>

						   <name>yarn.resourcemanager.hostname.rm1</name>

						   <value>ubuntu1</value>

						</property>

						<property>

						   <name>yarn.resourcemanager.hostname.rm2</name>

						   <value>ubuntu2</value>

						</property>

						<!-- 指定zk集群地址 -->

						<property>

						   <name>yarn.resourcemanager.zk-address</name>

						   <value>ubuntu3:2181,ubuntu4:2181,ubuntu5:2181</value>

						</property>

						<property>

						   <name>yarn.nodemanager.aux-services</name>

						   <value>mapreduce_shuffle</value>

						</property>

				</configuration>

slaves

1 ubuntu3

2 ubuntu4

3 ubuntu5

还有就是修改一下主机名。 sudo vi /etc/hostname ubuntu1 以及hosts的内容：

192.168.44.128 ubuntu1

192.168.44.131 ubuntu2

192.168.44.132 ubuntu3

192.168.44.133 ubuntu4

192.168.44.134 ubuntu5

注意：一定要把原来的那两天127.0.1.1 这一条给删除掉，一个hosts文件中，不能出现主机名相同和ip地址不同的情况，我开始就是因为这个因为，折腾了很久，datanode就是搭建不起来。

三、启动HA的Hadoop过程

1、启动zookeeper集群分别在ubuntu3,4,5中输入开启服务： bin/zkServer.sh start 查看状态： bin/zkServer.sh status

2、启动journalnode 分别在ubuntu3,4,5中输入 sbin/hadoop-daemon.sh start journalnode 运行jps命令检验，多了JournalNode进程

3、格式化HDFS

　　在ubuntu1上执行命令:

bin/hdfs namenode -format

#格式化后会在根据core-site.xml中的hadoop.tmp.dir配置生成个文件，这里我配置的是/HAhadoop/tmp，然后将/HAhadoop/tmp拷贝到ubuntu2的/HAhadoop/下。

　　

scp -r tmp/ ubuntu2:/home/admin1/hadoop/HAhadoop/

4、格式化ZKFC(在ubuntu1上执行即可) bin/hdfs zkfc -formatZK

5、启动HDFS(在ubuntu1上执行) sbin/start-dfs.sh

6、启动YARN（在ubuntu1上执行） sbin/start-yarn.sh

如果是在ubuntu1中启动的话，那么默认的浏览窗口会是这样： ubuntu2是Active的，ubuntu1是一个Standby状态，

这个时候如果你去ubuntu2里面把这个namenode进程杀死的话，ubuntu1会自动切换为Active，ubuntu2会变成无法连接。

这样就实现了服务器的动态切换，这样万一有一个namenode宕机了，剩下了一台会自动切换。这种使用了zookeeper切换的就是前面说到的HA机制了。

当整个集群搭建完毕的效果就会是这样，如果用jps去查看一下：

在两个namenode节点上面会这样显示：

在剩下的3个datanode上面会这样：

可以通过访问ubuntu2:8088/Cluster来查看：活跃节点是3个

到这里整个集群环境就搭建完毕了，当然如果你电脑配置不是很高的话，可以选择把datanode直接放在namenode一起配置也可以。

HA机制下的Hadoop配置的更多相关文章

Java API操作HA方式下的Hadoop
通过java api连接Hadoop集群时,如果集群支持HA方式,那么可以通过如下方式设置来自动切换到活动的master节点上.其中,ClusterName 是可以任意指定的,跟集群配置无关,dfs. ...
初始化ha环境下的hadoop的hdfs
1)启动zookeeper2)启动所有的journalnode[hadoop@datanode1 ~]$ ~/hadoop-2.7.3/sbin/hadoop-daemon.sh start jour ...
基于HA机制的MyCat架构——配置HAProxy
HAProxy简介HAProxy提供高可用性.负载均衡以及基于TCP和HTTP应用的代理,支持虚拟主机,它是免费.快速并且可靠的一种解决方案. HAProxy特别适用于那些负载特大的web站点,这些站 ...
虚拟机centos7系统下安装hadoop ha和yarn ha（详细）
一:基础环境准备 (一):虚拟机新建五个centos7系统(复制文件夹的方式) (二):角色分配 (三)按照角色分配表配置 (1)更改主机ip(自行查找),如果只是个人搭建玩一玩,可选择安装cento ...
Hadoop的HA机制
前言:正式引入HA机制是从hadoop2.0开始,之前的版本中没有HA机制 1. HA的运作机制 (1)hadoop-HA集群运作机制介绍所谓HA,即高可用(7*24小时不中断服务) 实现高可用最关 ...
Hadoop 高可用(HA)的自动容灾配置
参考链接 Hadoop 完全分布式安装 ZooKeeper 集群的安装部署 0. 说明在 Hadoop 完全分布式安装 & ZooKeeper 集群的安装部署的基础之上进行 Hadoop 高 ...
Hadoop HA on Yarn——集群配置
集群搭建因为服务器数量有限,这里服务器开启的进程有点多: 机器名安装软件运行进程 hadoop001 Hadoop,Zookeeper NameNode, DFSZKFailoverContro ...
【Hadoop】HA 场景下访问 HDFS JAVA API Client
客户端需要指定ns名称,节点配置,ConfiguredFailoverProxyProvider等信息. 代码示例: package cn.itacst.hadoop.hdfs; import jav ...
【Hadoop】HDFS笔记（二）：HDFS的HA机制和Federation机制
HA解决了HDFS的NameNode的单点问题: Federation解决了整个HDFS集群中只有一个名字空间,并且只有单独的一个NameNode管理所有DataNode的问题. 一.HA机制(Hig ...

随机推荐

Linux 文件读写操作与磁盘挂载
文件读写 [文件描述符] Linux下,通常通过open打开一个文件,它然后返回给我们一个整数,通过这个整数便可以操作文件,这个整数我们称文件描述符(fd).对应被打开的文件,它也是一种系统资源,那么 ...
python3安装ibm_db
在安装好python3之后,使用pip install ibm_db总是报错. 然后按照官方文档的说明添加了环境变量IBM_DB_HOME, 同时在命令行执行easy_install ibm_db就可 ...
C语言时间函数的学习
一直都是以简单的time_t t,time(&t),ctime(&t)来表示时间,后来要以时间为日志文件的名字时,就有点蒙逼了.学习一下. tm结构: struct tm { int ...
myeclipse自动添加注释
开发需要,新建类的时候,需要加自己的名字,每次都要自己写,嫌麻烦,修改一下myeclipse配置文件即可打开window---preferences 选中 new Java files 点击edit ...
控制公司 Controlling Companies
题目描述有些公司是其他公司的部分拥有者,因为他们获得了其他公司发行的股票的一部分.(此处略去一句废话)据说,如果至少满足了以下三个条件之一,公司A就可以控制公司B了: 公司A = 公司B. 公司A拥 ...
USACO 2017 US Open
只会做T1,FallDream T2 n^2暴力AC,太强啦. T1.Modern Art 题目大意:有一个n*n的矩阵,一开始都是0,你有n^2种颜色,编号1到n^2,每次可以选出一种颜色涂满一个子 ...
2015 多校联赛 ——HDU5302（构造）
Connect the Graph Time Limit: 2000/1000 MS (Java/Others) Memory Limit: 65536/65536 K (Java/Others ...
bzoj4514
4514: [Sdoi2016]数字配对 Time Limit: 10 Sec Memory Limit: 128 MBSubmit: 1870 Solved: 712[Submit][Statu ...
TOJ 数据结构实验--静态顺序栈
描述创建一个顺序栈(静态),栈大小为5.能够完成栈的初始化.入栈.出栈.获取栈顶元素.销毁栈等操作. 顺序栈类型定义如下: typedef struct { int data[Max]; i ...
关于java线程中stop interrupt daemon wait notify
一.关于终止线程stop与interrupt 一般来说,线程执行结束后就变成消亡状态,乍看之下我们并不需要人为进行干预(人为停止线程),不过凡事都有例外吧,在服务器或者其他应用场景下,线程为了提供服务 ...

HA机制下的Hadoop配置

一、hdfs的HA机制

二、Hadoop集群的配置

三、启动HA的Hadoop过程

HA机制下的Hadoop配置的更多相关文章

随机推荐

热门专题