Hadoop HA 高可用集群搭建

一、首先配置集群信息

 vi /etc/hosts

二、安装zookeeper

1、解压至/usr/hadoop/下

 tar -zxvf zookeeper-3.4..tar.gz -C /usr/hadoop/

2、进入/usr/hadoop/zookeeper-3.4.10/conf目录，将zoo_sample.cfg 复制为 zoo.cfg

cp /usr/hadoop/zookeeper-3.4./conf/zoo_sample.cfg  /usr/hadoop/zookeeper-3.4./conf/zoo.cfg

3、编辑zoo.cfg

4、新建dataDir目录

mkdir /usr/hadoop/zookeeper-3.4./dataDir/

5、向dataDir目录写入myid，mater为1，master2为2，slave1为3，对应着zoo.cfg的server.?

echo  > /usr/hadoop/zookeeper-3.4./dataDir/myid

6、将整个文件夹考入其他主机

 scp -r /usr/hadoop/zookeeper-3.4./ master2:/usr/hadoop/

 scp -r /usr/hadoop/zookeeper-3.4./ slave1:/usr/hadoop/

7、修改myid

 echo > /usr/hadoop/zookeeper-3.4./dataDir/myid 

 echo > /usr/hadoop/zookeeper-3.4./dataDir/myid

三、安装hadoop

1、修改hadoo-env.sh yarn-env.sh mapred-env.sh

上面是我的java 路径，改为你自己的

2、修改core-site.xml

<?xml version="1.0" encoding="UTF-8"?>

<?xml-stylesheet type="text/xsl" href="configuration.xsl"?>

<!--

  Licensed under the Apache License, Version 2.0 (the "License");

  you may not use this file except in compliance with the License.

  You may obtain a copy of the License at

    http://www.apache.org/licenses/LICENSE-2.0

  Unless required by applicable law or agreed to in writing, software

  distributed under the License is distributed on an "AS IS" BASIS,

  WITHOUT WARRANTIES OR CONDITIONS OF ANY KIND, either express or implied.

  See the License for the specific language governing permissions and

  limitations under the License. See accompanying LICENSE file.

-->

<!-- Put site-specific property overrides in this file. -->

<configuration>

 <property><!--hdfs namenode集群访问地址-->

    <name>fs.defaultFS</name>

    <value>hdfs://ns1</value>

  </property>

    <property>

        <name>ha.zookeeper.quorum</name>

        <value>master:2181,master2:2181,slave1:2181</value>

    </property>

  <property><!--HA模式下 fsimage 存储位置、tmp数据-->

    <name>hadoop.tmp.dir</name>

    <value>file:/usr/hadoop/hadoop-2.8.5/haData</value>

  </property>

</configuration>

3、修改hdfs-site.xml

 <?xml version="1.0" encoding="UTF-8"?>

 <?xml-stylesheet type="text/xsl" href="configuration.xsl"?>

 <!--

   Licensed under the Apache License, Version 2.0 (the "License");

   you may not use this file except in compliance with the License.

   You may obtain a copy of the License at

     http://www.apache.org/licenses/LICENSE-2.0

   Unless required by applicable law or agreed to in writing, software

   distributed under the License is distributed on an "AS IS" BASIS,

   WITHOUT WARRANTIES OR CONDITIONS OF ANY KIND, either express or implied.

   See the License for the specific language governing permissions and

   limitations under the License. See accompanying LICENSE file.

 -->

 <!-- Put site-specific property overrides in this file. -->

 <configuration>

         <!--HA-->

         <property><!--hdfs namenode集群别名，与core-site.xml中一致 -->

                 <name>dfs.nameservices</name>

                 <value>ns1</value>

         </property>

         <property><!-- namenodes下面有两个NameNode，分别是nn1，nn2 -->

                 <name>dfs.ha.namenodes.ns1</name>

                 <value>master,master2</value>

         </property>

         <property><!-- nn1的RPC通信地址 -->

                 <name>dfs.namenode.rpc-address.ns1.master</name>

                 <value>master:9000</value>

         </property>

         <property><!-- nn1的http通信地址 -->

                 <name>dfs.namenode.http-address.ns1.master</name>

                 <value>master:50070</value>

         </property>

         <property><!-- nn2的RPC通信地址 -->

                 <name>dfs.namenode.rpc-address.ns1.master2</name>

                 <value>master2:9000</value>

         </property>

         <property><!-- nn2的http通信地址 -->

                 <name>dfs.namenode.http-address.ns1.master2</name>

                 <value>master2:50070</value>

         </property>

         <property><!-- 配置JournalNode组的访问地址,格式qjournal://host:port/journalId。 journalId需要与“nameserviceID”一致 -->

                 <name>dfs.namenode.shared.edits.dir</name>

                 <value>qjournal://master:8485;master2:8485;slave1:8485/ns1</value>

         </property>

         <property><!-- 指定JournalNode在本地磁盘存放数据的位置 -->

                 <name>dfs.journalnode.edits.dir</name>

                 <value>/usr/hadoop/hadoop-2.8.5/haData/journalData</value>

         </property>

         <property><!-- 启用ZKFC，NameNode自动切换功能 -->

                 <name>dfs.ha.automatic-failover.enabled</name>

                 <value>true</value>

         </property>

         <property><!-- NameNode自动切换配置失败后的解决方案 -->

                 <name>dfs.client.failover.proxy.provider.ns1</name>

                 <value>org.apache.hadoop.hdfs.server.namenode.ha.ConfiguredFailoverProxyProvider</value>

         </property>

         <property><!-- Fecing隔离机制指定，多个方案间换行分割 -->

                 <name>dfs.ha.fencing.methods</name>

                 <value>

                         sshfence

                         shell(/bin/true)

                 </value>

         </property>

         <property><!-- sshfence隔离机制时需要ssh免登陆 -->

                 <name>dfs.ha.fencing.ssh.private-key-files</name>

                 <value>/root/.ssh/id_rsa</value>

         </property>

         <property><!-- 配置sshfence隔离机制超时时间 -->

                 <name>dfs.ha.fencing.ssh.connect-timeout</name>

                 <value>30000</value>

         </property>

         <property><!--指定 fsimage 元数据的存储位置-->

         <name>dfs.namenode.name.dir</name>

         <value>file:/usr/hadoop/hadoop-2.8.5/haData/dfs/name</value>

         </property>

         <property>

         <name>dfs.datanode.data.dir</name>

         <value>file:/usr/hadoop/hadoop-2.8.5/haData/dfs/data</value>

         </property>

 </configuration>

4、修改mapred-site.xml

 <?xml version="1.0"?>

 <?xml-stylesheet type="text/xsl" href="configuration.xsl"?>

 <!--

   Licensed under the Apache License, Version 2.0 (the "License");

   you may not use this file except in compliance with the License.

   You may obtain a copy of the License at

     http://www.apache.org/licenses/LICENSE-2.0

   Unless required by applicable law or agreed to in writing, software

   distributed under the License is distributed on an "AS IS" BASIS,

   WITHOUT WARRANTIES OR CONDITIONS OF ANY KIND, either express or implied.

   See the License for the specific language governing permissions and

   limitations under the License. See accompanying LICENSE file.

 -->

 <!-- Put site-specific property overrides in this file. -->

 <configuration>

 <!-- 指定mr框架为yarn方式 -->

     <property>

         <name>mapreduce.framework.name</name>

         <value>yarn</value>

     </property>

     <property>

         <name>mapreduce.jobhistory.address</name>

         <value>master:10020</value>

     </property>

     <property>

         <name>mapreduce.jobhistory.webapp.address</name>

         <value>master:19888</value>

     </property>

 </configuration>

5、修改yarn-site.xml

 <?xml version="1.0"?>

 <!--

   Licensed under the Apache License, Version 2.0 (the "License");

   you may not use this file except in compliance with the License.

   You may obtain a copy of the License at

     http://www.apache.org/licenses/LICENSE-2.0

   Unless required by applicable law or agreed to in writing, software

   distributed under the License is distributed on an "AS IS" BASIS,

   WITHOUT WARRANTIES OR CONDITIONS OF ANY KIND, either express or implied.

   See the License for the specific language governing permissions and

   limitations under the License. See accompanying LICENSE file.

 -->

 <configuration>

 <property><!-- 启用YARN HA -->

                 <name>yarn.resourcemanager.ha.enabled</name>

                 <value>true</value>

         </property>

         <property><!-- 指定YARN cluster id -->

                 <name>yarn.resourcemanager.cluster-id</name>

                 <value>yrmc1</value>

         </property>

         <property><!-- 指定ResourceManager的名字 -->

                 <name>yarn.resourcemanager.ha.rm-ids</name>

                 <value>rm1,rm2</value>

         </property>

         <property><!-- 分别指定ResourceManager的地址 -->

                 <name>yarn.resourcemanager.hostname.rm1</name>

                 <value>master</value>

         </property>

         <property>

                 <name>yarn.resourcemanager.hostname.rm2</name>

                 <value>master2</value>

         </property>

         <property>

                 <name>yarn.resourcemanager.zk-address</name>

                 <value>master:2181,master2:2181,slave1:2181</value>

         </property>

         <property>

                 <name>yarn.nodemanager.aux-services</name>

                 <value>mapreduce_shuffle</value>

         </property>

         <property>

                 <name>yarn.nodemanager.aux-services.mapreduce_shuffle.class</name>

                 <value>org.apache.hadoop.mapred.ShuffleHandler</value>

         </property>

    <property>

        <name>yarn.resourcemanager.recovery.enabled</name>

        <value>true</value>

     </property>

     <!--指定resourcemanager的状态信息存储在zookeeper集群，默认是存放在FileSystem里面。-->

     <property>

        <name>yarn.resourcemanager.store.class</name>

        <value>org.apache.hadoop.yarn.server.resourcemanager.recovery.ZKRMStateStore</value>

     </property>

 </configuration>

6、修改slaves

7、免密配置authorized_keys

（1）最好的免密配置就是在克隆之前免密自己，把自己的公钥放进authorized_keys里，这样以后克隆多台都不需要配置免密

（2）其次

　　　　ssh-keygen
　　　　　　一路回车
　　　　ssh-copy-id master2
　　　　ssh-copy-id slave1

8、拷贝hadoop到其他机器

scp -r /usr/hadoop/hadoop-2.8.5/ master2:/usr/hadoop/

scp -r /usr/hadoop/hadoop-2.8.5/ slave1:/usr/hadoop/

四、启动集群（第一次顺序必须严格执行）

1、为了方便起见将环境变量配置如下：

 export JAVA_HOME=/usr/java/jdk1..0_131

 export JRE_HOME=/usr/java/jdk1..0_131/jre

 export CLASSPATH=.:$JAVA_HOME/lib/dt.jar:$JAVA_HOME/lib/tools.jar:$JRE_HOME/lib

 export HADOOP_HOME=/usr/hadoop/hadoop-2.8.

 export HADOOP_PREFIX=$HADOOP_HOME

 export HADOOP_MAPRED_HOME=$HADOOP_HOME

 export HADOOP_COMMON_HOME=$HADOOP_HOME

 export HADOOP_HDFS_HOME=$HADOOP_HOME

 export YARN_HOME=$HADOOP_HOME

 export HADOOP_COMMON_LIB_NATIVE_DIR=$HADOOP_HOME/lib/native

 export ZOOKEEPER_HOME=/usr/hadoop/zookeeper-3.4.

 export PATH=$PATH:$JAVA_HOME/bin:$HADOOP_HOME/sbin:$HADOOP_HOME/bin:$ZOOKEEPER_HOME/bin

 export HADOOP_INSTALL=$HADOOP_HOME

2、启动zookeeper集群

在三台机器上全部启动

zkServer.sh start

查看三台机器选举情况

zkServer.sh status

一台loader，其余两天为flower ，其它情况为错，重新配置

3、在三台机器上启动 journalnode

 hadoop-daemon.sh start journalnode

查看进程，如没有进程将不能格式化

4、在master上进行格式化，状态为0为成功

不是第一次装Hadoop的需要把name 、data 删除，否则将启动不了进程

hdfs namenode -format

5、在master上单独启动namenode

hadoop-daemon.sh start namenode

6、在master2上同步master，状态为0成功

hdfs namenode -bootstrapStandby

7、关闭master上namenode

hadoop-daemon.sh stop namenode

8、在master上格式化ZK，格式化成功标志为，在任意一台登陆zkCli 查看 ls / 会有 hadoop ha 目录

hdfs zkfc -formatZK

9、在master上启动集群

start-dfs.sh

10、启动yarn集群

start-yarn.sh

*以后启动顺序，先启动zookeeper集群，然后在master上执行 start-all.sh 即可

五、查看状态

在浏览器上访问

Hadoop HA 高可用集群搭建的更多相关文章

Hadoop HA高可用集群搭建（Hadoop+Zookeeper+HBase）
声明:作者原创,转载注明出处. 作者:帅气陈吃苹果一.服务器环境主机名 IP 用户名密码安装目录 master188 192.168.29.188 hadoop hadoop /home/ha ...
Hadoop HA高可用集群搭建（2.7.2）
1.集群规划: 主机名 IP 安装的软件执行的进程 drguo1 192.168.80.149 j ...
Zookeeper（四）Hadoop HA高可用集群搭建
一.高可就集群搭建 1.集群规划 2.集群服务器准备 (1) 修改主机名(2) 修改 IP 地址(3) 添加主机名和 IP 映射(4) 同步服务器时间(5) 关闭防火墙(6) 配置免密登录(7) 安装 ...
Hadoop 3.1.2(HA)+Zookeeper3.4.13+Hbase1.4.9(HA)+Hive2.3.4+Spark2.4.0(HA)高可用集群搭建
目录目录 1.前言 1.1.什么是 Hadoop? 1.1.1.什么是 YARN? 1.2.什么是 Zookeeper? 1.3.什么是 Hbase? 1.4.什么是 Hive 1.5.什么是 Sp ...
Hadoop HA 高可用集群的搭建
hadoop部署服务器系统主机名 IP centos6.9 hadoop01 192.168.72.21 centos6.9 hadoop02 192.168.72.22 centos6.9 ha ...
HDFS-HA高可用集群搭建
HA高可用集群搭建 1.总体集群规划在hadoop102.hadoop103和hadoop104三个节点上部署Zookeeper. hadoop102 hadoop103 hadoop104 Nam ...
linux -- 基于zookeeper搭建yarn的HA高可用集群
linux -- 基于zookeeper搭建yarn的HA高可用集群实现方式:配置yarn-site.xml配置文件 <configuration> <property> & ...
hadoop高可用集群搭建小结
hadoop高可用集群搭建小结1.Zookeeper集群搭建2.格式化Zookeeper集群 (注:在Zookeeper集群建立hadoop-ha,amenode的元数据)3.开启Journalmno ...
centos HA高可用集群 heartbeat搭建 heartbeat测试主上停止heartbeat服务测试脑裂两边都禁用ping仲裁第三十二节课
centos HA高可用集群 heartbeat搭建 heartbeat测试主上停止heartbeat服务测试脑裂两边都禁用ping仲裁第三十二节课 heartbeat是Linu ...

随机推荐

c# webservice中访问http和https的wsdl，生成的配置节点的不同之处
http: https:
mysql 的增删改查
数据库的基本流程就是先看你的数据库中的库都是哪些:show databases; 然后再进入相应的库进行操作 : use+进入的库/表切换路径查看这个库内的所有的表: show tabales ...
C++ 重载重写重定义
重写:存在于类的继承,修饰符是virtual,函数的参数个数,顺序,类型,均相同. 重载:函数的参数列表,类型,顺序不相同. 重定义:对父类的函数进行屏蔽,参数列表可以不相同,没有virtual修饰
编写VBA宏生成页面
概述依据详细设计中表设计,借用excel宏编写VBA生成页面. 特色高定制.高效率.兼容所有生成要求.不依赖低耦合.任意Sheet适用缺陷不支持批量Sheet页生成 VBA源码 Sub lis ...
5 Dockerfile指令详解 && CMD 指令
CMD 指令的格式和 RUN 相似,也是两种格式: shell 格式: CMD <命令> exec 格式: CMD ["可执行文件", "参数1", ...
console 程序随系统启动及隐藏当前程序窗口
应业务需求,程序需要与系统启动而自动运行,故加入以下代码,保存成 .bat文件 ,双击执行即可 reg add "HKEY_CURRENT_USER\Software\Microsoft\W ...
BZOJ3175:[TJOI2013]攻击装置(二分图最大独立集)
Description 给定一个01矩阵,其中你可以在0的位置放置攻击装置.每一个攻击装置(x,y)都可以按照“日”字攻击其周围的 8个位置(x-1,y-2),(x-2,y-1),(x+1,y-2), ...
2763. [JLOI2011]飞行路线【分层图最短路】
Description Alice和Bob现在要乘飞机旅行,他们选择了一家相对便宜的航空公司.该航空公司一共在n个城市设有业务,设这些城市分别标记为0到n-1,一共有m种航线,每种航线连接两个城市,并 ...
Kali-linux攻击路由器
前面介绍的各种工具,都是通过直接破解密码,来连接到无线网络.由于在一个无线网络环境的所有设备中,路由器是最重要的设备之一.通常用户为了保护路由器的安全,通常会设置一个比较复杂的密码.甚至一些用户可能会 ...
SpringBoot实战(五)之Thymeleaf
Thymeleaf同jsp.volocity.freemarker等共同的职能是MVC模式中的视图展示层,即View. 当然了,SpringBoot中也可以用jsp,不过不推荐这种用法,比较推崇的就是 ...