配置HDFS的HA
配置前准备:
-- 配置hadoop
-- 配置ZooKeeper,传送门:https://www.cnblogs.com/zhqin/p/11906106.html
安装配置好hadoop和ZooKeeper之后,接下来开始正式配置HA:
1、在/opt下创建ha文件夹
sudo mkdir ha
2、更改ha文件夹所有者
sudo chown admin:admin ha
3、将之前配置安装的hadoop文件夹拷贝到刚创建的ha文件夹下
cp -r module/hadoop-2.7.2/ ha/
4、然后进入到刚拷贝过去的ha文件夹下的hadoop文件夹,将之前集群运行产生的data和logs文件夹删除
rm -rf data/ logs/
5、进入etc/haoop/ 文件夹下
/opt/ha/hadoop-2.7.2/etc/hadoop
6、修改core-site.xml
<configuration>
<!-- 把两个NameNode)的地址组装成一个集群mycluster -->
<property>
<name>fs.defaultFS</name>
<value>hdfs://mycluster</value>
</property>
<!-- 指定hadoop运行时产生文件的存储目录 -->
<property>
<name>hadoop.tmp.dir</name>
<value>/opt/ha/hadoop-2.7.2/data/tmp</value>
</property>
</configuration>
7、配置hdfs-site.xml
<configuration>
<!-- 完全分布式集群名称 -->
<property>
<name>dfs.nameservices</name>
<value>mycluster</value>
</property>
<!-- 集群中NameNode节点都有哪些 -->
<property>
<name>dfs.ha.namenodes.mycluster</name>
<value>nn1,nn2</value>
</property>
<!-- nn1的RPC通信地址 -->
<property>
<name>dfs.namenode.rpc-address.mycluster.nn1</name>
<value>hadoop102:9000</value>
</property>
<!-- nn2的RPC通信地址 -->
<property>
<name>dfs.namenode.rpc-address.mycluster.nn2</name>
<value>hadoop103:9000</value>
</property>
<!-- nn1的http通信地址 -->
<property>
<name>dfs.namenode.http-address.mycluster.nn1</name>
<value>hadoop102:50070</value>
</property>
<!-- nn2的http通信地址 -->
<property>
<name>dfs.namenode.http-address.mycluster.nn2</name>
<value>hadoop103:50070</value>
</property>
<!-- 指定NameNode元数据在JournalNode上的存放位置 -->
<property>
<name>dfs.namenode.shared.edits.dir</name>
<value>qjournal://hadoop102:8485;hadoop103:8485;hadoop104:8485/mycluster</value>
</property>
<!-- 配置隔离机制,即同一时刻只能有一台服务器对外响应 -->
<property>
<name>dfs.ha.fencing.methods</name>
<value>sshfence</value>
</property>
<!-- 使用隔离机制时需要ssh无秘钥登录-->
<property>
<name>dfs.ha.fencing.ssh.private-key-files</name>
<value>/home/atguigu/.ssh/id_rsa</value>
</property>
<!-- 声明journalnode服务器存储目录-->
<property>
<name>dfs.journalnode.edits.dir</name>
<value>/opt/ha/hadoop-2.7.2/data/jn</value>
</property>
<!-- 关闭权限检查-->
<property>
<name>dfs.permissions.enable</name>
<value>false</value>
</property>
<!-- 访问代理类:client,mycluster,active配置失败自动切换实现方式-->
<property>
<name>dfs.client.failover.proxy.provider.mycluster</name>
<value>org.apache.hadoop.hdfs.server.namenode.ha.ConfiguredFailoverProxyProvider</value>
</property>
</configuration>
8、分发ha文件夹
sudo xsync /opt/ha/
其实到目前为止,手动切换的HA已经配置完成。
接下来继续配置自动切换(自动故障转移)的HA,也就是ZooKeeper。
9、进入配置文件的文件夹下,修改hdfs-site.xml,vim /opt/ha/hadoop-2.7.2/etc/hadoop/hdfs-site.xml
在原有的配置基础上追加如下内容:
<property>
<name>dfs.ha.automatic-failover.enabled</name>
<value>true</value>
</property>
10、修改core-site.xml,在core-site.xml最后追加如下内容:
<property>
<name>ha.zookeeper.quorum</name>
<value>hadoop102:2181,hadoop103:2181,hadoop104:2181</value>
</property>
11、同步三台机器的配置文件
xsync /opt/ha/hadoop-2.7.2/etc/hadoop/
到此配置完成,接下来开始第一次启动前的各种准备工作。
12、启动JournalNode
/opt/ha/hadoop-2.7.2/sbin/hadoop-daemons.sh start journalnode
13、格式化namenode(注意,执行该命令需等待上条命令执行之后稍等片刻,因为JournalNode节点启动稍微需要些时间,而HDFS是建立在这个节点之上的)
/opt/ha/hadoop-2.7.2/bin/hdfs namenode -format
14、启动namenode
/opt/ha/hadoop-2.7.2/sbin/hadoop-daemon.sh start namenode
此时执行jpsall应该有的进程是:
----------- hadoop102 -----------
10178 NameNode
10014 JournalNode
----------- hadoop103 -----------
12740 JournalNode
----------- hadoop104 -----------
12521 JournalNode
这样的结果的话代表目前执行正确
15、在hadoop103机器上执行:
/opt/ha/hadoop-2.7.2/bin/hdfs namenode -bootstrapStandby
16、然后在hadoop103上启动namenode
/opt/ha/hadoop-2.7.2/sbin/hadoop-daemon.sh start namenode
这个时候执行jpsall应该是三个jn两个nn,如下所示:
----------- hadoop102 -----------
10178 NameNode
10014 JournalNode
----------- hadoop103 -----------
12740 JournalNode
12981 NameNode
----------- hadoop104 -----------
12521 JournalNode
17、启动ZooKeeper集群
在所有机器同时发送命令:
$ZOOKEEPER_HOME/bin/zkServer.sh start
可以通过命令:$ZOOKEEPER_HOME/bin/zkServer.sh start
查看ZooKeeper各个节点的状态。
18、需要格式化一下Zkfc需要在ZooKeeper中用到的数据信息。
/opt/ha/hadoop-2.7.2/bin/hdfs zkfc -formatZK
19、在配置了namenode节点的机器上启动zkfc
在hadoop102和hadoop103分别执行:
/opt/ha/hadoop-2.7.2/sbin/hadoop-daemon.sh start zkfc
此时执行jpsall,显示结果应该为:
----------- hadoop102 -----------
10432 QuorumPeerMain
10178 NameNode
10650 DFSZKFailoverController
10014 JournalNode
----------- hadoop103 -----------
13363 DFSZKFailoverController
12740 JournalNode
12981 NameNode
13151 QuorumPeerMain
----------- hadoop104 -----------
12772 QuorumPeerMain
12521 JournalNode
20、然后启动数据节点datanode,切换到hadoop102
/opt/ha/hadoop-2.7.2/sbin/hadoop-daemons.sh start datanode
这个时候执行jpsall
----------- hadoop102 -----------
10432 QuorumPeerMain
10817 DataNode
10178 NameNode
10650 DFSZKFailoverController
10014 JournalNode
----------- hadoop103 -----------
13665 DataNode
13363 DFSZKFailoverController
12740 JournalNode
12981 NameNode
13151 QuorumPeerMain
----------- hadoop104 -----------
12772 QuorumPeerMain
13092 DataNode
12521 JournalNode
21、至此,已经配置完成。
以后启动的话就一条启动命令即可:
/opt/ha/hadoop-2.7.2/sbin/start-dfs.sh
关闭同理:
/opt/ha/hadoop-2.7.2/sbin/stop-dfs.sh
配置HDFS的HA的更多相关文章
- 【Hadoop 分布式部署 十:配置HDFS 的HA、启动HA中的各个守护进程】
官方参考 配置 地址 :http://hadoop.apache.org/docs/r2.5.2/hadoop-project-dist/hadoop-hdfs/HDFSHighAvailabili ...
- hbase配置hdfs的HA之后需要修改的路径
hbase-site.xml中配置了hdfs的一个路径 <property> <name>hbase.rootdir</name> <value>hdf ...
- HDFS NameNode HA 部署文档
简介: HDFS High Availability Using the Quorum Journal Manager Hadoop 2.x 中,HDFS 组件有三个角色:NameNode.DataN ...
- Hadoop 2、配置HDFS HA (高可用)
前提条件 先搭建 http://www.cnblogs.com/raphael5200/p/5152004.html 的环境,然后在其基础上进行修改 一.安装Zookeeper 由于环境有限,所以在仅 ...
- 第九章 搭建Hadoop 2.2.0版本HDFS的HA配置
Hadoop中的NameNode好比是人的心脏,非常重要,绝对不可以停止工作.在hadoop1时代,只有一个NameNode.如果该NameNode数据丢失或者不能工作,那么整个集群就不能恢复了.这是 ...
- 3.配置HDFS HA
安装zookeeper下载zookeeper编辑zookeeper配置文件创建myid文件启动zookeeper配置HDFS HA配置手动HA配置自动HA启动HDFS HA namenode负责管理整 ...
- 使用QJM实现HDFS的HA配置
使用QJM实现HDFS的HA配置 1.背景 hadoop 2.0.0之前,namenode存在单点故障问题(SPOF,single point of failure),如果主机或进程不可用时,整个集群 ...
- hdfs的HA集群搭建的相关配置
前期准备就不详细说了 .修改Linux主机名 .修改IP .修改主机名和IP的映射关系 ######注意######如果你们公司是租用的服务器或是使用的云主机(如华为用主机.阿里云主机等) /etc/ ...
- Hadoop 2.7.4 HDFS+YRAN HA部署
实验环境 主机名称 IP地址 角色 统一安装目录 统一安装用户 sht-sgmhadoopnn-01 172.16.101.55 namenode,resourcemanager /usr/local ...
随机推荐
- python初学者-从小到大排序
x=input("x=") y=input("y=") z=input("z=") if x>y: x,y=y,x if x>z ...
- SpringBoot 与 SpringSecurity
一.环境搭建 (1)IDEA创建SpringBoot工程 (2)导入依赖 (3)如果是thymeleaf项目 需导入thymeleaf整合security的依赖 (4)编写配置类(采用AOP横切入程序 ...
- 小白经典CNN论文复现系列(一):LeNet1989
小白的经典CNN复现系列(一):LeNet-1989 之前的浙大AI作业的那个系列,因为后面的NLP的东西我最近大概是不会接触到,所以我们先换一个系列开始更新博客,就是现在这个经典的CNN复现啦(。・ ...
- Interface注意事项
Interface 成员声明 声明属性,默认static & final 声明方法,默认public interface Instrument { int VALUE = 5; // stat ...
- spark提交至yarn的的动态资源分配
1.为什么开启动态资源分配 ⽤户提交Spark应⽤到Yarn上时,可以通过spark-submit的num-executors参数显示地指定executor 个数,随后,ApplicationMast ...
- umi3.2+ targets ie不生效的问题
直接创建umi项目 config.ts对targets{ie:11}不生效 错误方法1: 在入口页app.tsx新增 import @babel/polyfill 错误方法2: 在入口页app.tsx ...
- 为什么 StringBuffer 有 toStringCache 而 StringBuilder 没有?
对于 StringBuilder 和 StringBuffer 的源码会发现,StringBuffer 中有一个叫 toStringCache 的成员变量,用来缓存 toString() 方法返回字符 ...
- LeetCode109 将有序链表转为二叉搜索树
给定一个单链表,其中的元素按升序排序,将其转换为高度平衡的二叉搜索树. 本题中,一个高度平衡二叉树是指一个二叉树每个节点 的左右两个子树的高度差的绝对值不超过 1. 示例: 给定的有序链表: [-10 ...
- 剑指offer 面试题5:替换空格
题目描述 请实现一个函数,将一个字符串中的每个空格替换成"%20".例如,当字符串为We Are Happy. 则经过替换之后的字符串为We%20Are%20Happy. 编程思想 ...
- 操作系统-1w字关于内存的总结
内存的基本概念 什么是内存,有何作用 内存是用于存放数据的硬件.程序执行前需要先放入内存中才能被CPU处理 存储单元 内存中也有一个一个的小房间,每个小房间就是一个存储单元. 如果计算机按照 字节编址 ...