安装zookeeper
下载zookeeper
编辑zookeeper配置文件
创建myid文件
启动zookeeper
配置HDFS HA
配置手动HA
配置自动HA
启动HDFS HA

namenode负责管理整个hdfs集群,如果namenode故障则集群将不可用.因此有必须实现namenode高可用.

hdfs的高可用原理参考:

HADOOP(二):hdfs 高可用原理

zookeeper简介:

zookeeper集群安装

安装zookeeper

下载zookeeper

下载zookeeper并解压到/opt

[zookeeper@hadoop1 opt]$ wget http://mirror.bit.edu.cn/apache/zookeeper/zookeeper-3.4.9/zookeeper-3.4.9.tar.gz

[zookeeper@hadoop1 opt]$ gunzip zookeeper-3.4.9.tar.gz

[zookeeper@hadoop1 opt]$ tar -xvf zookeeper-3.4.9.tar.gz

编辑zookeeper配置文件

[zookeeper@hadoop1 zookeeper-3.4.9]$ cd conf/

[zookeeper@hadoop1 conf]$ ls

configuration.xsl  log4j.properties  zoo_sample.cfg

[zookeeper@hadoop1 conf]$ cp zoo_sample.cfg zoo.cfg

[zookeeper@hadoop1 conf]$ vi zoo.cfg

tickTime=2000

dataDir=/opt/zookeeper-3.4.9/dataDir

dataLogDir=/opt/zookeeper-3.4.9/dataLogDir

clientPort=2181

initLimit=5

syncLimit=2

server.1=hadoop3:2888:3888

server.2=hadoop4:2888:3888

server.3=hadoop5:2888:3888

创建myid文件

在每个节点上写上节点的id,如节点1就写1.放在dataDir指定的目录下.

启动zookeeper

bin/zkServer.sh start

如果报错检查zookeeper.out

使用客户端连接到zookeeper:

[zookeeper@hadoop5 zookeeper-3.4.9]$ bin/zkCli.sh -server 127.0.0.1:2181

连进去表示zookeeper正常

配置HDFS HA

配置手动HA

HDFS HA中用，nameserivce ID来标识一个HDFS服务，为了标识每个NN，还要加上namenode id。

在hdfs-site.xml中：

1.设置集群的标识dfs.nameservice

<property>

  <name>dfs.nameservices</name>

  <value>mycluster</value>

</property>

这里修改为dockercluster

2.设置namenode名称 dfs.ha.namenodes.[nameservice ID]

<property>

  <name>dfs.ha.namenodes.mycluster</name>

  <value>nn1,nn2</value>

</property>

nn1 nn2为namenode的标识。

注意：当前只支持两个namenode的HA

3.设置namenode对外提供服务的RPC地址 dfs.namenode.rpc-address.[nameservice ID].[name node ID]

<property>

  <name>dfs.namenode.rpc-address.mycluster.nn1</name>

  <value>hadoop1:8020</value>

</property>

<property>

  <name>dfs.namenode.rpc-address.mycluster.nn2</name>

  <value>hadoop2:8020</value>

</property>

这个RPC地址实际就是 dfs.defaultFS地址

4.设置HDFS web页面地址 dfs.namenode.http-address.[nameservice ID].[name node ID]

<property>

  <name>dfs.namenode.http-address.mycluster.nn1</name>

  <value>hadoop1:50070</value>

</property>

<property>

  <name>dfs.namenode.http-address.mycluster.nn2</name>

  <value>hadoop2:50070</value>

</property>

如果启用的hdfs的安全机制，要设置 https-address

5.设置journal上edit log共享目录 dfs.namenode.shared.edits.dir

格式是：qjournal://host1:port1;host2:port2;host3:port3/journalId 所有节点上路径要保持一致

<property>

 <name>dfs.namenode.shared.edits.dir</name>

 <value>qjournal://hadoop3:8485;hadoop4:8485;hadoop5:8485/mycluster</value>

</property>

这里我们改成： qjournal://hadoop4:8485;hadoop5:8485;hadoop6:8485/dockercluster

6.设置实现集群HA的类 dfs.client.failover.proxy.provider.[nameservice ID]

<property>

  <name>dfs.client.failover.proxy.provider.mycluster</name>

 <value>org.apache.hadoop.hdfs.server.namenode.ha.ConfiguredFailoverProxyProvider</value>

</property>

当前仅支持这个类

7.设置切换时执行的程序 dfs.ha.fencing.methods

当namenode发生切换时，原来active的NN可能依然在写edit log，这时如果standby 也开始写edit log，元数据会"脑裂"。为了防止"脑裂"，必须要切换之前杀掉原来active 的NN，这个脚本就是实现这个目的。当前支持两中fencing.method：shell 和 sshfence。另外，可能自定义org.apache.hadoop.ha.NodeFence来实现自己的保护程序。

7.1.sshfence(默认)

通过SSH登录到原来active的NN，并使用fuser命令KILL掉NN进程。要使用SSH，必须配置rsa-key参数:dfs.ha.fencing.ssh.private-key-files

    <property>

      <name>dfs.ha.fencing.methods</name>

      <value>sshfence</value>

    </property>

    <property>

      <name>dfs.ha.fencing.ssh.private-key-files</name>

      <value>/home/hdfs/.ssh/id_rsa</value>

    </property>

也可以用其它用户登录，同样可以配置超时参数：

    <property>

      <name>dfs.ha.fencing.methods</name>

      <value>sshfence([[username][:port]])</value>

    </property>

    <property>

      <name>dfs.ha.fencing.ssh.connect-timeout</name>

      <value>30000</value>

    </property>

7.2.shell

自定义一个shell脚本业杀死NAMENODE

    <property>

      <name>dfs.ha.fencing.methods</name>

      <value>shell(/path/to/my/script.sh arg1 arg2 …)</value>

    </property>

shell脚本可以读取到当前已经配置的HDFS变量，将"."替换为"_" 即可。对于某些共用的条目，如dfs_namenode_rpc-address可以自动的指向特定节点如dfs.namenode.rpc-address.ns1.nn1。以下变量也可以使用：


$target_host
$target_port
$target_address
$target_namenodeid

示例：

    <property>

      <name>dfs.ha.fencing.methods</name>

      <value>shell(/path/to/my/script.sh --nameservice=$target_nameserviceid $target_host:$target_port)</value>

    </property>

如果shell返回0，表示执行成功。如果不为0，则继续执行其它的fencing.method.shell方式没有timeout.

这时里，我们也用ssh方式，比较简单，只需要生成key就行了.在NN1 NN2上执行：

[hdfs@hadoop1 ~]$ ssh-keygen -t rsa

Generating public/private rsa key pair.

Enter file in which to save the key (/home/hdfs/.ssh/id_rsa):

Enter passphrase (empty for no passphrase):

Enter same passphrase again:

Your identification has been saved in /home/hdfs/.ssh/id_rsa.

Your public key has been saved in /home/hdfs/.ssh/id_rsa.pub.

The key fingerprint is:

6b:de:13:b7:55:ba:43:1c:28:ef:2e:b8:b7:0a:e0:15 hdfs@hadoop1

The key's randomart image is:

+--[ RSA 2048]----+

|                 |

|                 |

|      E      .   |

8.journal节点守护进程自己的数据目录 dfs.journalnode.edits.dir

<property>

  <name>dfs.journalnode.edits.dir</name>

  <value>/opt/hadoop-2.8.0/journalEditDir</value>

</property>

9.在core-site.xml中设置hdfs 服务 fs.defaultFS

一旦使用了HDFS HA，那么fs.defaultFS就不能写成host:port文件，而要写成服务方式，写上nameservice id：

<property>

  <name>fs.defaultFS</name>

  <value>hdfs://mycluster</value>

</property>

这里改成hdfs://dockercluster

经过以上的配置,可以通过命令手动切换nemenode

配置自动HA

1.修改hdfs-site.xml

添加：

 <property>

   <name>dfs.ha.automatic-failover.enabled</name>

   <value>true</value>

 </property>

2.修改core-site.xml

添加zookeer的server列表：

 <property>

   <name>ha.zookeeper.quorum</name>

   <value>hadoop3:2181,hadoop4:2181,hadoop5:2181</value>

 </property>

启动HDFS HA

1.在zookeeper中初始化HA状态

在其中一台namenode上执行：

[hdfs]$ $HADOOP_PREFIX/bin/hdfs zkfc -formatZK

2.启动HDFS集群

1.启动所有journal节点`$HADOOP_HOME/sbin/hadoop-daemon.sh start journalnode`

2.执行journal 节点初始化`hdfs namenode -initializeSharedEdits`

3.启动原来的namenode `$HADOOP_HOME/sbin/hadoop-daemon.sh --config $HADOOP_CONF_DIR --script hdfs start namenode`

4.初始化standby,在standby上执行 `hdfs namenode -bootstrapStandby`,

5.启动standby `$HADOOP_HOME/sbin/hadoop-daemon.sh --config $HADOOP_CONF_DIR --script hdfs start namenode`

6.启动namenode自动HA进程zkfc,在每台namenode上执行:$HADOOP_PREFIX/sbin/hadoop-daemon.sh --script $HADOOP_PREFIX/bin/hdfs start zkfc

3.检查HA情况

可以看到两台机器一个是active一个是standby

4.验证自动HA

现在在hadoop1 kill active的namenode

发现hadoop2成了active,说明自动HA配置成功.

来自为知笔记(Wiz)

3.配置HDFS HA的更多相关文章

Hadoop 2、配置HDFS HA (高可用)
前提条件先搭建 http://www.cnblogs.com/raphael5200/p/5152004.html 的环境,然后在其基础上进行修改一.安装Zookeeper 由于环境有限,所以在仅 ...
部署hadoop2.7.2 集群基于zookeeper配置HDFS HA+Federation
转自:http://www.2cto.com/os/201605/510489.html hadoop1的核心组成是两部分,即HDFS和MapReduce.在hadoop2中变为HDFS和Yarn.新 ...
[转]HDFS HA 部署安装
1. HDFS 2.0 基本概念相比于 Hadoop 1.0,Hadoop 2.0 中的 HDFS 增加了两个重大特性,HA 和 Federaion.HA 即为 High Availability, ...
【Hadoop 分布式部署十：配置HDFS 的HA、启动HA中的各个守护进程】
官方参考配置地址 :http://hadoop.apache.org/docs/r2.5.2/hadoop-project-dist/hadoop-hdfs/HDFSHighAvailabili ...
第6章 HDFS HA配置
目录 6.1 hdfs-site.xml文件配置 6.2 core-site.xml文件配置 6.3 启动与测试 6.4 结合ZooKeeper进行自动故障转移在Hadoop 2.0.0之前,一个H ...
HAWQ配置之HDFS HA
一.在ambari管理界面启用HDFS HA 在ambari中这步很简单,在所有安装的服务都正常之后,在HDFS的服务界面中,点击下拉菜单“Actions”,选择启用HDFS HA项 “Enable ...
hadoop(二):hdfs HA原理及安装
早期的hadoop版本,NN是HDFS集群的单点故障点,每一个集群只有一个NN,如果这个机器或进程不可用,整个集群就无法使用.为了解决这个问题,出现了一堆针对HDFS HA的解决方案(如:Linux ...
hadoop2.610集群配置(包含HA和Hbase )
.修改Linux主机名2.修改IP3.修改主机名和IP的映射关系######注意######如果你们公司是租用的服务器或是使用的云主机(如华为用主机.阿里云主机等)/etc/hosts里面要配置的是内 ...
Hadoop 学习笔记（十） hadoop2.2.0 生产环境部署 HDFS HA Federation 含Yarn部署
其他的配置跟HDFS-HA部署方式完全一样.但JournalNOde的配置不一样>hadoop-cluster1中的nn1和nn2和hadoop-cluster2中的nn3和nn4可以公用同样的 ...

随机推荐

windows搭建本地IIS服务器+php安装+移动设备内网访问服务器
启动IIS服务 1. 打开 “控制面板” => "程序" => "启用或关闭Window功能": 2. 接着勾选相应设置: 3. 继续勾选对应目录下 ...
帝国CMS调用友情链接多种方法
今天织梦模板给大家讲解帝国CMS调用友情链接的常见方法: 1.帝国内置标签:phomelink [phomelink]每行显示数,显示总数,操作类型,分类id,是否显示原链接[/phomelink] ...
Hive(8)-常用查询函数
一. 空字段赋值 1. 函数说明 NVL:给值为NULL的数据赋值,它的格式是NVL( value,default_value).它的功能是如果value为NULL,则NVL函数返回default_v ...
大数据&人工智能&云计算
仅从技术上讲大数据.人工智能都包含工程.算法两方面内容: 一.大数据: 工程: 1)云计算,核心是怎么管理大量的计算机.存储.网络. 2)核心是如何管理数据:代表是分布式存储,HDFS 3)核心是如何 ...
【C】关键字void的用法
void有两种功能 [1]没有 [2]任意类型 void出现的位置不同会有不同的解释 [1]void func( void ) func左边的void,代表『没有返回值』 func右边的括弧里的voi ...
『Python基础-1 』编程语言Python的基础背景知识
#『Python基础-1 』编程语言Python的基础背景知识目录: 1.编程语言 1.1 什么是编程语言 1.2 编程语言的种类 1.3 常见的编程语言 1.4 编译型语言和解释型语言的对比 2 ...
go基础语法-指针
1.基础定义 golang的指针没有cpp等语言的指针复杂,具体表现在其不可用于运算.只有值传递语法:var variableName *int = memoryAddr var a = 2 var ...
java入门---基本数据类型之引用数据类型&数据类型转换
接着上一篇文章来,这次就先看看什么是引用数据类型?首先得满足以下条件: 在Java中,引用类型的变量非常类似于C/C++的指针.引用类型指向一个对象,指向对象的变量是引用变量.这些变量在声明时 ...
杭州优步uber司机第一组奖励政策
-8月9日更新- 优步杭州第一组: 定义为激活时间在2015/6/8之前的车主(以优步后台数据显示为准) 滴滴快车单单2.5倍,注册地址:http://www.udache.com/如何注册Uber司 ...
beego 点滴
在使用beego时遇到 need a primary key field 1 确保结构中的字段首字母大写 2 beego默认主键是id 如果主键定义的是其他字段比如userid 那么加上orm pk ...

3.配置HDFS HA