【Hadoop 分布式部署十：配置HDFS 的HA、启动HA中的各个守护进程】

官方参考配置地址：http://hadoop.apache.org/docs/r2.5.2/hadoop-project-dist/hadoop-hdfs/HDFSHighAvailabilityWithQJM.html

一、

　　在Hadoop-senior.zuoyan.com 的主机上

　　　　首先将Hadoop安装目录下 etc下的hadoop的配置文件进行备份使用命令： cp -r hadoop dist-hadoop

　　　　然后在Hadoop安装目录下 data 文件夹内将tmp 文件夹重命名使用命令： mv tmp dits-tmp ,重命名完成后，在创建一个文件夹 mkdir tmp

　　然后在其余的两台主机上也重复这个操作

　　　　　将hadoop安装目录下的etc下的hadoop的所有配置文件复制文件为 dist-hadoop 然后再Hadoop的主安装目录中的data 下的 tmp 目录重命名为 dist-tmp 然后在创建新的数据存放目录

　　　　　　说明：图片中使用的命令有错误，不应该是重命名hadoop 而应该是重新复制文件，将复制文件的名字设置为 dist-hadoop

二、修改配置文件

　　　　打开core-site.xml 和　　hdfs-site.xml 文件

　　　　在core-site.xml 文件中配置

　　　　　　　因为是NameNode 的高可用行，配制两台机器的NameNode ，需要修改这个，所以需要配置成集群

　　　　在hdfs-site.xml 配置文件中配制：

　　　　　首先去除掉

	<!--配置secondary namenode 所在的主机-->

	<property>

            <name>dfs.namenode.secondary.http-address</name>

            <value>hadoop-senior03.zuoyan.com:50090</value>

        </property>

　　　　在 /opt/app/hadoop2.5.0/data 目录下创建文件夹 dfs/jn 用来存放NameNode的日志信息

　　　　然后在从hdfs-site.xml 文件中配置

        <!--配置Hadoop NameNode 的HA -->

    <property>

        <name>dfs.nameservices</name>

        <value>ns1</value>

    </property>

    <property>

      <name>dfs.ha.namenodes.ns1</name>

      <value>nn1,nn2</value>

    </property>

    <!--                 NameNode RPC  Adress             -->

    <property>

      <name>dfs.namenode.rpc-address.ns1.nn1</name>

      <value>hadoop-senior.zuoyan.com:8020</value>

    </property>

    <property>

      <name>dfs.namenode.rpc-address.ns1.nn2</name>

      <value>hadoop-senior02.zuoyan.com:8020</value>

    </property>

    <!-- 配置 WEB  界面的 访问地址和端口  -->

    <property>

        <name>dfs.namenode.http-address.ns1.nn1</name>

        <value>hadoop-senior.zuoyan.com:50070</value>

    </property>

    <property>

        <name>dfs.namenode.http-address.ns1.nn2</name>

        <value>hadoop-senior02.zuoyan.com:50070</value>

    </property>

    <!--配置 NameNode Shared  EDITS  Address  和NameNode 日志文件存放的位置   -->

    <property>

      <name>dfs.namenode.shared.edits.dir</name>

      <value>qjournal://hadoop-senior.zuoyan.com:8485;hadoop-senior02.zuoyan.com:8485;hadoop-senior03.zuoyan.com:8485/ns1</value>

    </property>

    <property>

      <name>dfs.journalnode.edits.dir</name>

      <value>/opt/app/hadoop-2.5.0/data/dfs/jn</value>

    </property>

    <!-- 配置 HDFS  PROXY  Client -->

    <property>

      <name>dfs.client.failover.proxy.provider.mycluster</name>

      <value>org.apache.hadoop.hdfs.server.namenode.ha.ConfiguredFailoverProxyProvider</value>

    </property>

    <!--配置两个  NameNode的隔离机制  -->

    <!--   使用的方式是  ssh-fence   要求是两个NameNode 之间能够无密码登录  两个主机之间能互相ssh无密钥登录   -->

    <property>

      <name>dfs.ha.fencing.methods</name>

      <value>sshfence</value>

    </property>

    <property>

      <name>dfs.ha.fencing.ssh.private-key-files</name>

      <value>/home/beifeng/.ssh/id_rsa</value>

    </property>

配置好主机一（hadoop-senior.zuoyan.com）需要将配置文件进行同步

　　　　使用命令 scp -r etc/hadoop/core-site.xml etc/hadoop/hdfs-site.xml etc/hadoop/slaves beifeng@hadoop-senior02.zuoyan.com:/opt/app/hadoop-2.5.0/etc/hadoop/

开始启动QJM HA：

　　　　完成后，分别启动三个节点的journalnode 使用命令: sbin/hadoop-daemon.sh start journalnode 每个节点启动后使用jps查看一下进程，看任务是否启动

　　　　可以查看一下启动日志（这个步骤不是必须要做的可以看见journalnode 的启动日志）：

　　　　在NameNode1节点上对文件系统进行格式化，产生fsimage 文件使用命令： bin/hdfs namenode -format 然后再启动NameNode

　　　　在NameNode1 上启动namenode 使用命令： bin/hadoop-daemon.sh start namenode

　　　　之后在NameNode2 上同步NameNode1 的元数据信息

　　　　使用命令：bin/hdfs namenode -bootstrapStandby

　　　　　可以看到复制镜像文件是从Hadoop-senior.zuoyan.com 上拷贝

　　　　　　然后启动NameNode2 使用命令： sbin/hadoop-daemon.sh start namenode

　　　　　　然后分别访问这两个主机的50070 发现如果可以访问就初步配置成功

　　　　　　　　然后启动所有机器上的DataNode 使用命令:sbin/start-dfs.sh (也可以使用命令一个个启动 sbin/hadoop-daemon.sh start datanode 我这里省事，就所有机器的都启动)

　　　　　　　　　　　　打开WEB界面发现两个NameNode 都可以进行管理这样就是配置成功！！！

　　　　　　　　使用命令将第一个节点改变为活跃状态，使用命令: bin/hdfs haadmin -transitionToActive nn1

　　　　　　　　　　　　(可以看到这个NameNode 节点已经改变为活跃状态)

　　　　　　　　　　　　也可以通过命令来查看节点的状态（可以看到这两个主机一个是active 一个是 standby）

　　　　　　　　　　　　现在查看一下 HDFS文件系统上的文件来进行测试NameNode

　　　　　　　　　　　　(下面没有打印出文件这个上面说没有找到ns1 这个原因技就是我们在配置Proxy的时候没有改变myclsur)

　　　　　　　　　　　　下面这个内容配置错误的原因，我现在已经更改过来了

　　　　　　　　　　　　更改完成后，在执行一下 (就可以看见文件目录已经循环出来了)

　　　　　　　　　　　　使用命令创建文件目录

　　　　　　　　　　　　将文件上传到文件系统上

　　　　　　　　　　　　通过文件管理的web界面进行查看（就会发现文件已经上传成功）

　　　　　　　　　　　　　然后在测试HA的读取功能使用命令: bin/hdfs dfs -text /user/zuoyan/conf/core-site.xml

　　　　　　　　　　　　　　文件已经成功正常的被读取出来了

　　　　　　　　　　　　　　然后通过命令将 nn1 切换称 standby 将nn2 切换成 active　　

　　　　　　　　　　　　　　将节点切换成Standby的命令：bin/hdfs haadmin -transitionToStandby nn1

　　　　　　　　　　　　　　将节点切换成Active 的命令 : bin/hdfs haadmin -transitionToActive nn2

　　　　　　　　　　　　　　切换之后在用NameNode 1 去读取HDFS上的文件测试是否能正常读取文件

　　　　　　　　　　　　　　　　（切换之后已经正常的读取出来了，证明节点切换对集群是没有影响的）

　　　　　　　　　　　　　　完成到这样 HDFS的高可用已经初步搭建好了

【Hadoop 分布式部署十：配置HDFS 的HA、启动HA中的各个守护进程】的更多相关文章

【Hadoop 分布式部署十一: NameNode HA 自动故障转移】
问题描述: 上一篇就是NameNode 的HA 部署完成,但是存在问题,问题是如果主NameNode的节点宕机了,还是需要人工去使用命令来切换NameNode的Acitve 这样很不方便,所以 ...
CentOS6安装各种大数据软件第四章：Hadoop分布式集群配置
相关文章链接 CentOS6安装各种大数据软件第一章:各个软件版本介绍 CentOS6安装各种大数据软件第二章:Linux各个软件启动命令 CentOS6安装各种大数据软件第三章:Linux基础 ...
CentOS7 下 Hadoop 分布式部署
Hadoop 服务划分使用三台节点,集群部署规划如下服务\主机 hadoop1 hadoop2 hadoop3 HDFS NameNode DataNode DataNode SecondaryN ...
【Hadoop 分布式部署三：基于Hadoop 2.x 伪分布式部署进行修改配置文件】
1.规划好哪些服务运行在那个服务器上需要配置的配置文件 2. 修改配置文件,设置服务运行机器节点首先在 hadoop-senior 的这台主机上进行解压 hadoop2.5 按照 ...
ubuntu在虚拟机下的安装 ~~~ Hadoop的安装及配置 ~~~ Hdfs中eclipse的安装
前言 Hadoop是基于Java语言开发的,具有很好跨平台的特性.Hadoop的所要求系统环境适用于Windows,Linux,Mac系统,我们推荐选择使用Linux或Mac系统.而Linux系统则 ...
hadoop分布式部署（2014-3-8）
hadoop简介: (维基百科)Apache Hadoop是一款支持數據密集型分佈式應用并以Apache 2.0許可協議發佈的開源軟體框架.它支持在商品硬件構建的大型集群上運行的應用程序.Hadoop ...
Hadoop分布式集群配置
硬件环境: 安装一个Hadoop集群时,需要专门指定一个服务器作为主节点. 三台虚拟机搭建的集群:(搭建集群时主机名不能一样,主机名在/etc/hostname修改) master机器:集群的主节点, ...
【Hadoop 分布式部署九：分布式协作框架Zookeeper架构分布式安装部署】
1.首先将运行在本地上的 zookeeper 给停止掉 2.到/opt/softwares 目录下将 zookeeper解压到 /opt/app 目录下命令: tar -zxvf zoo ...
【Hadoop 分布式部署四：配置Hadoop 2.x 中主节点（NN和RM）到从节点的SSH无密码登录】
******************* 一定要使这三台机器的用户名相同,安装目录相同 ************* SSH 无密钥登录的简单介绍(之前再搭 ...

随机推荐

Sql 嵌套循环
DECLARE @i INT ,@j INT BEGIN PRINT 'satrt i:'+CAST(@i AS varchar) BEGIN PRINT 'j:'+CAST(@j AS varcha ...
泛型List、HashTable
从最开始接触的数组,到非泛型集合类(ArrayList.HashTable.Queue.Stack).泛型集合类(List<T>.Dictionary<T>.Queue< ...
mysql的sql执行计划详解
实际项目开发中,由于我们不知道实际查询的时候数据库里发生了什么事情,数据库软件是怎样扫描表.怎样使用索引的,因此,我们能感知到的就只有 sql语句运行的时间,在数据规模不大时,查询是瞬间的,因此,在写 ...
20165215 2017-2018-2 《Java程序设计》第八周学习总结
20165215 2017-2018-2 <Java程序设计>第八周学习总结教材学习内容总结进程与线程进程是程序的一次动态执行过程,它对应了从代码加载.执行至执行完毕的一个完整过程. ...
【Alpha版本】冲刺阶段——Day1
[Alpha版本]冲刺阶段--Day1 阅读目录 Alpha 阶段成员分工及任务量团队成员贡献值的计算规则明日任务今日贡献量站立式会议 TODOlist [Alpha 阶段成员分工及任务量] ...
Unable to open socket file: target process not responding or HotSpot VM not loaded
Unable to open socket file: target process not responding or HotSpot VM not loaded The -F option can ...
python02
# 字符串学习第二天 # 1.练习len与range for的使用 test=input("请输入") l=len(test) for i in range(0,l): print ...
推荐：全新Java开发思维导图
蓦然回首自己做开发已经十年了,这十年中我获得了很多,技术能力.培训.出国.大公司的经历,还有很多很好的朋友. 但再仔细一想,这十年中我至少浪费了五年时间,这五年可以足够让自己成长为一个优秀的程序员,可 ...
pyglet player sound
Player = pyglet.media.Player() # our event handling function def on_eos(): print("on player eos ...
await
单个的task await task 多个await asyncio.wait(tasks)

【Hadoop 分布式部署 十：配置HDFS 的HA、启动HA中的各个守护进程】

【Hadoop 分布式部署 十：配置HDFS 的HA、启动HA中的各个守护进程】的更多相关文章

随机推荐

热门专题

【Hadoop 分布式部署十：配置HDFS 的HA、启动HA中的各个守护进程】

【Hadoop 分布式部署十：配置HDFS 的HA、启动HA中的各个守护进程】的更多相关文章