原创hadoop2.6.4 namenode HA+Federation集群高可用部署

今天下午刚刚搭建了一个高可用hadoop集群，整理如下，希望大家能够喜欢。

namenode HA：得有两个节点，构成一个namenode HA集群

namenode Federation：可以有多个HA集群，分管不同的数据

至少得有4个节点，才能满足要求

节点	NN	JournalNode	DN	ZK	归属组
Hmaster	Y	Y			cluster1
Hslave1	Y	Y	Y	Y	cluster1
Hslave2	Y	Y	Y	Y	cluster2
Hslave3	Y		Y	Y	cluster2

一、配置hosts、ssh免密登录、ZK集群等通用

二、有hadoop-env.sh、core-site.xml、hdfs-site.xml、mapred-site.xml、yarn-site.xml、slaves 6个文件需要配置

（1）hadoop-env.sh

export JAVA_HOME=/usr/java/jdk1.8.0_91

（2）core-site.xml

fs.defaultFS	hdfs://cluster1
hadoop.tmp.dir	/home/hadoop/hadoop/tmp
ha.zookeeper.quorum	Hslave1:2181,Hslave2:2181,Hslave3:2181

（3）hdfs-site.xml

dfs.nameservices	cluster1,cluster2	备注
dfs.ha.namenodes.cluster1	nn1,nn2
dfs.namenode.rpc-address.cluster1.nn1	Hmaster:9000
dfs.namenode.rpc-address.cluster1.nn2	Hslave1:9000
dfs.namenode.http-address.cluster1.nn1	Hmaster:9000
dfs.namenode.http-address.cluster1.nn2	Hslave1:50070
dfs.client.failover.proxy.provider.cluster1	org.apache.hadoop.hdfs.server.namenode.ha.ConfiguredFailoverProxyProvider
dfs.ha.automatic-failover.enabled.cluster1	true
dfs.namenode.shared.edits.dir	qjournal://Hmaster:8485;Hslave1:8485;Hslave2:8485/cluster1	只能出现在cluster1节点上
dfs.ha.namenodes.cluster2	nn1,nn2
dfs.namenode.rpc-address.cluster2.nn1	Hslave2:9000
dfs.namenode.rpc-address.cluster2.nn2	Hslave3:9000
dfs.namenode.http-address.cluster2.nn1	Hslave2:9000
dfs.namenode.http-address.cluster2.nn2	Hslave3:50070
dfs.client.failover.proxy.provider.cluster2	org.apache.hadoop.hdfs.server.namenode.ha.ConfiguredFailoverProxyProvider
dfs.ha.automatic-failover.enabled.cluster2	true
dfs.namenode.shared.edits.dir	qjournal://Hmaster:8485;Hslave1:8485;Hslave2:8485/cluster2	只能出现在cluster2节点上
dfs.journalnode.edits.dir	/home/hadoop/hadoop/tmp/journal
dfs.ha.fencing.methods	sshfence
dfs.ha.fencing.ssh.private-key-files	/home/hadoop/.ssh/id_rsa
dfs.ha.fencing.ssh.connect-timeout	5000
dfs.datanode.data.dir	file:///home/hadoop/dfs/data
dfs.replication	3

（4）mapred-site.xml

mapreduce.framework.name

yarn

true

（5）yarn-site.xml

yarn.resourcemanager.hostname	Hmaster	RM目前是单节点，存在单点故障，以后配成RM HA
yarn.nodemanager.aux-services	mapreduce_shuffle

（6）slaves（DataNode节点）

Hslave1

Hslave2

Hslave3

分发到各节点，只有hdfs-site.xml中标红字段，根据cluster情况注释掉不必要的

三、启动集群

（1）启动、格式化ZK集群。

在每个ZK上执行：启动 zkServer.sh start

在每个cluster的其中一个节点执行：建立HA节点：hdfs zkfc –formatZK

（2）启动JournalNode集群

每个节点上执行：hadoop-daemon.sh start journalnode

（3）格式化、启动NameNode集群

格式化并启动集群cluster1的namenode：

先在集群中的一个节点执行：hdfs namenode -format -clusterId c1 hadoop-daemon.sh start namenode

再在另一个节点执行（数据同步）：hdfs namenode -bootstrapStandby hadoop-daemon.sh start namenode

cluster2集群类似

（4）启动DataNode

hadoop-daemons.sh start datanode

（5）启动YARN

start-yarn.sh

（6）启动ZooKeeperFailoverController

在其中一个节点执行：hadoop-daemons.sh start zkfc

四、测试

http://Hmaster:50070 看namenode的情况

http://Hmaster:8080/cluster 看集群的情况

kill其中一个namenode后，发现集群仍可正常使用

原创hadoop2.6.4 namenode HA+Federation集群高可用部署的更多相关文章

Centos 7 RabbitMQ + Haproxy 集群高可用部署
一. 功能和原理介绍 RabbitMQ是一个开源的AMQP实现,服务器端用Erlang语言编写,支持多种客户端,如:Python.Ruby..NET.Java.JMS.C.PHP.ActionSc ...
Rabbitmq集群高可用部署详细
序言清风万里的季节,周末本该和亲人朋友一起消遣这烂漫的花花草草,或是懒洋洋的晒个太阳听听风声鸟鸣.无奈工作使然,理想使然,我回到啦公司,敲起啦键盘,撸起啦代码,程序狗的世界一片黯然,一片黯然,愿天下 ...
hadoop+zookeeper集群高可用搭建
hadoop+zookeeper集群高可用搭建 Senerity 发布于 2 ...
Rabbitmq集群高可用测试
Rabbitmq集群高可用 RabbitMQ是用erlang开发的,集群非常方便,因为erlang天生就是一门分布式语言,但其本身并不支持负载均衡. Rabbit模式大概分为以下三种:单一模式.普通模 ...
openstack pike 集群高可用安装部署目录汇总
# openstack pike 集群高可用安装部署#安装环境 centos 7 史上最详细的openstack pike版部署文档欢迎经验分享,欢迎笔记分享欢迎留言,或加QQ群663105353 ...
bitmq集群高可用测试
Rabbitmq集群高可用 RabbitMQ是用erlang开发的,集群非常方便,因为erlang天生就是一门分布式语言,但其本身并不支持负载均衡. Rabbit模式大概分为以下三种:单一模式.普通模 ...
RabbitMQ从零到集群高可用(.NetCore5.0) -高可用集群构建落地
系列文章: RabbitMQ从零到集群高可用(.NetCore5.0) - RabbitMQ简介和六种工作模式详解 RabbitMQ从零到集群高可用(.NetCore5.0) - 死信队列,延时队列 ...
浅谈MySQL集群高可用架构
前言高可用架构对于互联网服务基本是标配,无论是应用服务还是数据库服务都需要做到高可用.对于一个系统而言,可能包含很多模块,比如前端应用,缓存,数据库,搜索,消息队列等,每个模块都需要做到高可用,才能 ...
Eureka 集群高可用配置.
SERVER:1 server: port: 1111 eureka: instance: hostname: ${spring.cloud.client.ip-address} instance-i ...

随机推荐

Springboot CORS跨域访问
Springboot CORS跨域访问什么是跨域浏览器的同源策略限制: 它是浏览器最核心也最基本的安全功能,如果缺少了同源策略,则浏览器的正常功能可能都会受到影响.可以说Web是构建在同源策略基础 ...
PyTorch专栏开篇
目前研究人员正在使用的深度学习框架不尽相同,有 TensorFlow .PyTorch.Keras等.这些深度学习框架被应用于计算机视觉.语音识别.自然语言处理与生物信息学等领域,并获取了极好的效果. ...
[AI开发]一个例子说明机器学习和深度学习的关系
深度学习现在这么火热,大部分人都会有‘那么它与机器学习有什么关系?’这样的疑问,网上比较它们的文章也比较多,如果有机器学习相关经验,或者做过类似数据分析.挖掘之类的人看完那些文章可能很容易理解,无非就 ...
Java 垃圾回收机制方法，判断对象存活算法
垃圾回收机制: 不定时去堆内存中清理不可达对象.不可达的对象并不会马上就会直接回收, 垃圾收集器在一个Java程序中的执行是自动的,不能强制执行,即使程序员能明确地判断出有一块内存已经无用了,是应该回 ...
浅谈服务架构“五脏六腑”之Spring Cloud
本文将从 Spring Cloud 出发,分两小节讲述微服务框架的「五脏六腑」: 第一小节「服务架构」旨在说明的包括两点,一服务架构是什么及其必要性:二是服务架构的基本组成.为什么第一节写服务架构而不 ...
[codevs1227]草地排水<Dinic网络流最大流>
题目链接:http://codevs.cn/problem/1993/ https://www.luogu.org/problemnew/show/P2740 之前一直都没去管网络流这算法,但是老师最 ...
JS烟花案例优化版
不明白为什么是烟花优化版本的先参考作者的烟花基础版本烟花优化版本主要实在优化爆炸的范围和运动上做了优化,爆炸范围我们采用已圆的爆炸方式,以鼠标点击的位置为圆形爆炸的烟花效果 <!DOCTYPE ...
Activiti网关--包含网关
1.什么是包含网关包含网关可以看做是排他网关和并行网关的结合体:和排他网关一样,你可以在外出顺序流上定义条件,包含网关会解析它们:但是主要的区别是包含网关可以选择多于一条顺序流,这和并行网关一样,包 ...
D - D 分糖果HDU - 1059(完全背包+二进制优化)
有两个小朋友想要平分一大堆糖果,但他们不知道如何平分需要你的帮助,由于没有spj我们只需回答能否平分即可. 糖果大小有6种分别是1.2.3.4.5.6,每种若干颗,现在需要知道能不能将这些糖果分成等额 ...
【linux】【tomcat】linux下定时重启tomcat 【CentOS 6.4】【CentOS 7.6】
本章内容以CentOS 6.4 和 CentOS 7.6 两个版本为例.[6和7的命令不同] 转载 :https://www.cnblogs.com/sxdcgaq8080/p/10730 ...

原创hadoop2.6.4 namenode HA+Federation集群高可用部署

原创hadoop2.6.4 namenode HA+Federation集群高可用部署的更多相关文章

随机推荐

热门专题