HDFS 高可用（HA）环境搭建

步骤一：修改公共属性配置 core-site.xml 文件

[root@node-01 ~]# cd /root/apps/hadoop-3.2.1/etc/hadoop

[root@node-01 hadoop]# vim core-site.xml

<configuration>

    <!-- 设置hdfs文件系统-->

    <property>

        <name>fs.defaultFs</name>

        <value>hdfs://node-01:9000</value>

    </property>

    <!-- zookeeper 集群-->

    <property>

      <name>ha.zookeeper.quorum</name>

        <value>node-01:2181,node-02:2181,node-03:2181</value>

    </property>

</configuration>

步骤二：修改 HDFS 属性配置 hdfs-site.xml 文件

[root@node-01 ~]# cd /root/apps/hadoop-3.2.1/etc/hadoop

<configuration>

    <property>

        <name>dfs.namenode.name.dir</name>

        <value>/root/apps/hadoop-3.2.1/data/namenode</value>

    </property>

    <property>

        <name>dfs.datanode.data.dir</name>

        <value>/root/apps/hadoop-3.2.1/data/datanode</value>

    </property>

    <property>

        <name>dfs.namenode.secondary.http-address</name>

        <value>node-02:9868</value>

    </property>

    <property>

        <!-- 指定hdfs的命名服务，需要和core-site.xml中的保持一致 -->

        <name>dfs.nameservices</name>

        <value>hadoop</value>

    </property>

    <property>

        <!-- hadoop下面有两个NameNode，分别是nn1，nn2 -->

        <name>dfs.ha.namenodes.hadoop</name>

        <value>nn1,nn2</value>

    </property>

    <property>

        <!-- nn1的RPC通信地址 -->

        <name>dfs.namenode.rpc-address.hadoop.nn1</name>

        <value>node-01:9000</value>

    </property>

    <property>

        <!-- nn1的http通信地址 -->

        <name>dfs.namenode.http-address.hadoop.nn1</name>

        <value>node-01:9870</value>

    </property>

    <property>

        <!-- nn2的RPC通信地址 -->

        <name>dfs.namenode.rpc-address.hadoop.nn2</name>

        <value>node-02:9000</value>

    </property>

    <property>

        <!-- nn2的http通信地址 -->

        <name>dfs.namenode.http-address.hadoop.nn2</name>

        <value>node-02:9870</value>

    </property>

    <property>

        <!-- 指定NameNode的元数据在JournalNode上的存放位置 -->

        <name>dfs.namenode.shared.edits.dir</name>

        <value>qjournal://node-01:8485;node-02:8485;node-03:8485/hadoop</value>

    </property>

    <property>

        <!-- 指定JournalNode在本地磁盘存放数据的位置 -->

        <name>dfs.journalnode.edits.dir</name>

        <value>/root/apps/hadoop-3.2.1/data/journal</value>

    </property>

    <property>

        <!-- 开启NameNode故障时自动切换 -->

        <name>dfs.ha.automatic-failover.enabled.hadoop</name>

        <value>true</value>

    </property>

    <property>

        <!-- 配置失败自动切换实现方式 -->

        <name>dfs.client.failover.proxy.provider.hadoop</name>

        <value>org.apache.hadoop.hdfs.server.namenode.ha.ConfiguredFailoverProxyProvider</value>

    </property>

    <property>

        <!-- 配置故障切换脑裂解决方案-->

        <name>dfs.ha.fencing.methods</name>

        <value>sshfence</value>

    </property>

      <property>

      <name>dfs.ha.fencing.ssh.private-key-files</name>

      <value>/root/.ssh/id_rsa</value>

    </property>

    <property>

        <!-- 配置namenode 连接 journalnode 重试次数-->

         <name>ipc.client.connect.max.retries</name>

         <value>30</value>

    </property>

</configuration>

步骤三：添加 JournalNode 进程执行权限

[root@node-01 ~]# echo "export HDFS_JOURNALNODE_USER=root" >> /etc/profile

[root@node-01 ~]# source /etc/profile

[root@node-02 ~]# echo "export HDFS_JOURNALNODE_USER=root" >> /etc/profile

[root@node-02 ~]# source /etc/profile

[root@node-03 ~]# echo "export HDFS_JOURNALNODE_USER=root" >> /etc/profile

[root@node-03 ~]# source /etc/profile

步骤四：拷贝配置到 node-02、node-03

[root@node-01 hadoop]# scp core-site.xml node-02:$PWD

[root@node-01 hadoop]# scp hdfs-site.xml node-02:$PWD

[root@node-01 hadoop]# scp core-site.xml node-03:$PWD

[root@node-01 hadoop]# scp hdfs-site.xml node-03:$PWD

步骤五：删除 node-01、node-02 和 node-03 存储数据目录

[root@node-01 ~]# rm -rf /root/apps/hadoop-3.2.1/data

[root@node-02 ~]# rm -rf /root/apps/hadoop-3.2.1/data

[root@node-03 ~]# rm -rf /root/apps/hadoop-3.2.1/data

步骤六：启动所有进程

启动所有的进程可以直接执行 start-dfs.sh 脚本，但是为了对 Hadoop 的进程有所了解，这里选择一个个进程按顺序来启动（注：必须严格按照顺序启动进程）

启动 ZooKeeper 进程

[root@node-01 ~]# zkCluster.sh start

[root@node-01 ~]# jps

1567 QuorumPeerMain

启动 Journalnode 进程

[root@node-01 ~]# hdfs --daemon start journalnode

[root@node-01 hadoop]# jps

2039 JournalNode #journalnode 进程已启动

2059 Jps

[root@node-02 ~]# hdfs --daemon start journalnode

[root@node-03 ~]# hdfs --daemon start journalnode

启动 NameNode（nn1）进程



[root@node-01 ~]# hdfs namenode -format

[root@node-01 ~]# hdfs --daemon start namenode

启动 NameNode（nn2）进程
```
[root@node-02 ~]# hdfs namenode -bootstrapStandby

[root@node-02 ~]# hdfs --daemon start namenode
```
注：在 HA 中不需要启动 SecondaryNameNode 进程，因为 Standby NameNode 会执行 checkpointing 机制

启动 DataNode 进程

[root@node-01 hadoop]# hdfs --daemon start datanode

[root@node-02 hadoop]# hdfs --daemon start datanode

[root@node-03 hadoop]# hdfs --daemon start datanode

启动 DFSZKFailoverController（ZKFC）进程

[root@node-01 hadoop]# hdfs zkfc -formatZK

[root@node-01 hadoop]# hdfs --daemon start zkfc

[root@node-02 hadoop]# hdfs --daemon start zkfc

步骤七：查看所有进程

[root@node-01 hadoop]# jps

2368 QuorumPeerMain

3715 DataNode

3987 DFSZKFailoverController

4435 NameNode

3430 JournalNode

[root@node-02 hadoop]# jps

2069 QuorumPeerMain

3033 DataNode

2379 JournalNode

5278 NameNode

[root@node-03 logs]# jps

2036 QuorumPeerMain

2170 JournalNode

2298 DataNode

步骤八：查看 HDFS HA 集群状态报告信息

[root@node-02 ~]# hdfs dfsadmin -report

步骤九：Web UI 中查看 NameNode（nn1）和 NameNode（nn2）状态

nn1地址： 192.168.229.21:9870
nn2 地址：192.168.229.22:9870

步骤十：故障转移测试

#安装故障转移脑裂问题解决工具

[root@node-01 hadoop]# yum install psmisc

[root@node-02 hadoop]# yum install psmisc

[root@node-03 hadoop]# yum install psmisc

#关闭 node-01 的 NameNode（active）进程

[root@node-01 hadoop-3.2.1]# hdfs --daemon stop namenode

查看 node-02 的 NameNode，由 Standby 变为了 Active，说明自动故障转移成功：）

HDFS 高可用（HA）环境搭建的更多相关文章

HDFS 高可用分布式环境搭建
HDFS 高可用分布式环境搭建作者:Grey 原文地址: 博客园:HDFS 高可用分布式环境搭建 CSDN:HDFS 高可用分布式环境搭建首先,一定要先完成分布式环境搭建并验证成功然后在 no ...
MySQL 系列（五）多实例、高可用生产环境实战
MySQL 系列(五) 多实例.高可用生产环境实战第一篇:MySQL 系列(一) 生产标准线上环境安装配置案例及棘手问题解决第二篇:MySQL 系列(二) 史上最屌.你不知道的数据库操作第三 ...
Hadoop HA高可用集群搭建（Hadoop+Zookeeper+HBase）
声明:作者原创,转载注明出处. 作者:帅气陈吃苹果一.服务器环境主机名 IP 用户名密码安装目录 master188 192.168.29.188 hadoop hadoop /home/ha ...
Hadoop 3.1.2(HA)+Zookeeper3.4.13+Hbase1.4.9(HA)+Hive2.3.4+Spark2.4.0(HA)高可用集群搭建
目录目录 1.前言 1.1.什么是 Hadoop? 1.1.1.什么是 YARN? 1.2.什么是 Zookeeper? 1.3.什么是 Hbase? 1.4.什么是 Hive 1.5.什么是 Sp ...
hadoop HA+Federation（高可用联邦）搭建配置（一）
hadoop HA+Federation(高可用联邦)搭建配置(一) 标签(空格分隔): 未分类介绍 hadoop 集群一共有4种部署模式,详见<hadoop 生态圈介绍>. HA联邦模 ...
hadoop HA+Federation（高可用联邦）搭建配置（二）
hadoop HA+Federation(高可用联邦)搭建配置(二) 标签(空格分隔): hadoop core-site.xml <?xml version="1.0" e ...
Hadoop框架：HDFS高可用环境配置
本文源码:GitHub·点这里 || GitEE·点这里一.HDFS高可用 1.基础描述在单点或者少数节点故障的情况下,集群还可以正常的提供服务,HDFS高可用机制可以通过配置Active/Sta ...
[大数据] hadoop高可用(HA)部署（未完）
一.HA部署架构如上图所示,我们可以将其分为三个部分: 1.NN和DN组成Hadoop业务组件.浅绿色部分. 2.中间深蓝色部分,为Journal Node,其为一个集群,用于提供高可用的共享文件存 ...
RabbitMQ高级指南：从配置、使用到高可用集群搭建
本文大纲: 1. RabbitMQ简介 2. RabbitMQ安装与配置 3. C# 如何使用RabbitMQ 4. 几种Exchange模式 5. RPC 远程过程调用 6. RabbitMQ高可用 ...
【转载】Redis Sentinel 高可用服务架构搭建
作者:田园里的蟋蟀出处:http://www.cnblogs.com/xishuai/ 本文版权归作者和博客园共有,欢迎转载,但未经作者同意必须保留此段声明,且在文章页面明显位置给出原文连接. 阅读 ...

随机推荐

Python简单实现杨辉三角
n=input("请输入要打印的行数")n=int(n)for x in range(0,n+1): p=1 print(''.rjust(n-x),end="" ...
odoo视图入门学习- tree视图的使用
上一篇内容:如何快速在odoo中创建自己的菜单前言上面的内容我们已经学会了如何去创建odoo的菜单,下面我们要学习的是odoo的基础视图tree视图,我们的目标是实现型号管理的列表页面创建mod ...
Spring Boot入门学习
1. Spring Boot概述 1.1.什么是Spring Boot SpringBoot是一个可使用Java构建微服务的微框架.是Spring框架及其社区对"约定优先于配置"理 ...
[C++]一篇文章搞懂C++中五花八门的各种初始化
总结初始化的概念:创建变量时赋予它一个值(不同于赋值的概念) 类的构造函数控制其对象的初始化过程,无论何时只要类的对象被创建就会执行构造函数如果对象未被用户指定初始值,那么这些变量会被执行默认初始 ...
Mysql之Mycat读写分离及分库分表
## 什么是mycat ```basic 1.一个彻底开源的,面向企业应用开发的大数据库集群 2.支持事务.ACID.可以替代MySQL的加强版数据库 3.一个可以视为MySQL集群的企业级数据库,用 ...
（数据科学学习手札118）Python+Dash快速web应用开发——特殊部件篇
本文示例代码已上传至我的Github仓库https://github.com/CNFeffery/DataScienceStudyNotes 1 简介这是我的系列教程Python+Dash快速web ...
JavaScript设计模式(一)：单例模式
单例模式的定义与特点单例(Singleton)模式的定义:指一个类只有一个实例,且该类能自行创建这个实例的一种模式.例如,Windows 中只能打开一个任务管理器,这样可以避免因打开多个任务管理器窗 ...
基于MATLAB的手写公式识别(2)
基于MATLAB的手写公式识别图像的预处理(除去噪声.得到后续定位分割所需的信息.) 预处理其本质就是去除不需要的噪声信息,得到后续定位分割所需要的图像信息.图像信息在采集的过程中由于天气环境的影响 ...
hdu4791水题
题意: 打印东西,给你区间和每个区间的价格,然后输入任务张数,输出最少花费.. 题解: 昨晚的小测试就有这个题目,当时蒙B了,怎么也读不懂题目,一直纠结怎么把150拆成1 ...
Android平台下Dalvik层hook框架ddi的研究
通过adbi,可以对native层的所有代码进行hook.但对于Android系统来说,这还远远不够,因为很多应用都还是在Dalvik虚拟机中运行的. 那么,有没有什么办法可以对Dalvik虚拟机中跑 ...

HDFS 高可用（HA）环境搭建

步骤一：修改公共属性配置 core-site.xml 文件

步骤二：修改 HDFS 属性配置 hdfs-site.xml 文件

步骤三：添加 JournalNode 进程执行权限

步骤四：拷贝配置到 node-02、node-03

步骤五：删除 node-01、node-02 和 node-03 存储数据目录

步骤六：启动所有进程

步骤七：查看所有进程

步骤八：查看 HDFS HA 集群状态报告信息

步骤九：Web UI 中 查看 NameNode（nn1）和 NameNode（nn2）状态

步骤十：故障转移测试

HDFS 高可用（HA）环境搭建的更多相关文章

随机推荐

热门专题

步骤九：Web UI 中查看 NameNode（nn1）和 NameNode（nn2）状态