hadoop ha集群搭建

集群配置：

jdk1.8.0_161

hadoop-2.6.1

zookeeper-3.4.8

linux系统环境：Centos6.5

3台主机：master、slave01、slave02

Hadoop HA集群搭建（高可用）：

设置静态IP地址

为普通用户添加sudo权限

服务器网络设置：NAT模式

域名设置

主机名设置

SSH免登录配置

关闭防火墙

红色步骤主每台主机都要执行，参照上一篇伪分布式集群的搭建

环境变量（每台主机一样）：

配置文件：

配置core-site.xml

<configuration>
<property>

<name>fs.defaultFS</name>
<value>hdfs://ns1</value>
</property>

<property>
<name>hadoop.tmp.dir </name>
<value>/home/dummy/app/hadoop-2.6.1/hdpdata</value>
</property>

<property>
<name>ha.zookeeper.quorum</name>
<value>master:2181,slave01:2181,slave02:2181</value>
</property>
</configuration>

配置hdfs-site.xml

<configuration>

<property>
        <name>dfs.nameservices</name>
        <value>ns1</value>
</property>

<property>
        <name>dfs.ha.namenodes.ns1</name>
        <value>nn1,nn2</value>
</property>

<property>
        <name>dfs.namenode.rpc-address.ns1.nn1</name>
        <value>master:9000</value>
</property>

<property>
        <name>dfs.namenode.http-address.ns1.nn1</name>
        <value>master:50070</value>
</property>

<property>
<name>dfs.namenode.rpc-address.ns1.nn2</name>
<value>slave01:9000</value>
</property>

<property>
        <name>dfs.namenode.http-address.ns1.nn2</name>
        <value>slave01:50070</value>
</property>

<property>
        <name>dfs.namenode.shared.edits.dir</name>
        <value>qjournal://master:8485;slave01:8485;slave02:8485/ns1</value>
</property>

<property>
        <name>dfs.journalnode.edits.dir</name>
        <value>/home/dummy/app/hadoop-2.6.1/journaldata</value>
</property>

<property>
        <name>dfs.ha.automatic-failover.enabled</name>
        <value>true</value>
</property>

<property>
        <name>dfs.client.failover.proxy.provider.ns1</name>
        <value>org.apache.hadoop.hdfs.server.namenode.ha.ConfiguredFailoverPr
oxyProvider</value>
</property>

<property>
        <name>dfs.ha.fencing.methods</name>
        <value>
               sshfence
               shell(/bin/true)
        </value>
</property>

<property>
        <name>dfs.ha.fencing.ssh.private-key-files</name>
        <value>/home/dummy/.ssh/id_rsa</value>
</property>

<property>
        <name>dfs.ha.fencing.ssh.connect-timeout</name>
        <value>30000</value>
</property>

</configuration>

配置mapred-site.xml

<configuration>
<property>
<name>mapreduce.framework.name</name>
<value>yarn</value>
</property>
</configuration>

配置yarn-site.xml

<property>
<name>yarn.resourcemanager.hostname</name>
<value>master</value>
</property>

<property>
<name>yarn.nodemanager.aux-services</name>
<value>mapreduce_shuffle</value>
</property>

</configuration>

配置slaves

master
slave01
slave02

HA安装步骤

全新的集群的启动方式：（一定要按步骤执行）

最关键的步骤：把防火墙全部关闭

第一步：启动ZooKeeper集群

第二步:在其中一台修改core-site.xml和hdfs-site.xml的配置文件，修改好后，把它分发到其它的机器

第三步：启动hadoop-daemon.sh start journalnode（三台都启动）

第四步：格式化namenode，然后把格式化的namenode的目录分发到另外一台namenode，分发hdpdata即可

第五步：再到其中一台的namenode上执行命令hdfs zkfc -formatZK

第六步：启动集群

第七步:网页正常访问

非全新的集群的启动方式：

非全新集群模式指的是你之前可能运行过HA或者普通的集群，这个时候，如果是以前运行过HA，但是现在报错，

最简单的方式，先把ZK下面的data里面的数据全部删除，只保留myid，这个时候ZooKeeper就是一个全新的。

并且把hadoop下面的logs和格式化生产的目录全部删除，这个时候保证hadoop是一个全新的。

上面的所有的步骤都是为了保证你重新从一个全新的集群开始搭建HA，可以避免很多问题。

之后的安装参照上面的全新的集群的启动方式进行。

之后集群的启动就是：

每台机启动 zkServer.sh start

再在任意一条主机的hadopp/sbin 目录启动

start-all.sh

hadoop ha集群搭建的更多相关文章

hadoop HA集群搭建步骤
NameNode DataNode Zookeeper ZKFC JournalNode ResourceManager NodeManager node1 √ √ √ √ node2 ...
hadoop HA集群搭建（亲测）
1.hadoop-env.sh 2.core-site.xml <configuration>  <prop ...
大数据-hadoop HA集群搭建
一.安装hadoop.HA及配置journalnode 实现namenode HA 实现resourcemanager HA namenode节点之间通过journalnode同步元数据首先下载需要 ...
Hadoop HA集群的搭建
HA 集群搭建的难度主要在于配置文件的编写, 心细,心细,心细! ha模式下,secondary namenode节点不存在... 集群部署节点角色的规划(7节点)------------------ ...
基于zookeeper的高可用Hadoop HA集群安装
(1)hadoop2.7.1源码编译 http://aperise.iteye.com/blog/2246856 (2)hadoop2.7.1安装准备 http://aperise.iteye.com ...
hadoop2.8 ha 集群搭建
简介: 最近在看hadoop的一些知识,下面搭建一个ha (高可用)的hadoop完整分布式集群: hadoop的单机,伪分布式,分布式安装 hadoop2.8 集群 1 (伪分布式搭建 hadoop ...
Hadoop分布式集群搭建
layout: "post" title: "Hadoop分布式集群搭建" date: "2017-08-17 10:23" catalog ...
Hadoop+HBase 集群搭建
Hadoop+HBase 集群搭建 1. 环境准备说明:本次集群搭建使用系统版本Centos 7.5 ,软件版本 V3.1.1. 1.1 配置说明本次集群搭建共三台机器,具体说明下: 主机名 IP ...
全网最详细的Hadoop HA集群启动后，两个namenode都是active的解决办法（图文详解）
不多说,直接上干货! 这个问题,跟全网最详细的Hadoop HA集群启动后,两个namenode都是standby的解决办法(图文详解) 是大同小异. 欢迎大家,加入我的微信公众号:大数据躺过的坑 ...

随机推荐

linux下的tomcat开机自启动(亲测),更改静态ip
开机自启动Tomcat: 1.修改脚本文件rc.local:vim /etc/rc.d/rc.local 这个脚本是使用者自定的开机启动程序,可以在里面添加想在系统启动之后执行的脚本或者脚本执行命令 ...
Fiddler 抓包工具总结（转）
Fiddler 抓包工具总结阅读目录 1. Fiddler 抓包简介 1). 字段说明 2). Statistics 请求的性能数据分析 3). Inspectors 查看数据内容 4). Au ...
oracle 清空数据库缓存
oracle 清除数据库缓存: alter system flush shared_pool ; alter system flush BUFFER_CACHE ;
java基础概念整理综合及补充（jdk1.8）
2018 java基础笔记回顾摘要一 1,html 与注释:  注释不能嵌套代码都得有注释. 2,空格符: 3,css选择的优先级: id选择器 > ...
新增自定义聚合函数StrJoin
1.添加程序集Microsoft.SqlServer.Types CREATE ASSEMBLY [Microsoft.SqlServer.Types] AUTHORIZATION [sys] FRO ...
IE Proxy Swich - IE 代理切换工具
通过此工具可方便的切换计算机系统代理设置的开关,无需重启IE 来激活设置下载环境要求: 可能需要.NET 4.0 以上平台, 其他平台未测试截图与功能如下支持快捷方式参数我个人习惯是在桌面 ...
Coursera 算法二 week 3 Baseball Elimination
这周的作业不需要自己写算法,只需要调用库函数就行,但是有些难以理解,因此用了不少时间. import edu.princeton.cs.algs4.FlowEdge; import edu.princ ...
linux 命令——14 head (转）
head 与 tail 就像它的名字一样的浅显易懂,它是用来显示开头或结尾某个数量的文字区块,head 用来显示档案的开头至标准输出中,而 tail 想当然尔就是看档案的结尾. 1．命令格式: hea ...
UVA 215 Spreadsheet Calculator （模拟）
模拟题.每个单元格有表达式就dfs,如果有环那么就不能解析,可能会重复访问到不能解析的单元格,丢set里或者数组判下重复. 这种题首先框架要对,变量名不要取的太乱,细节比较多,知道的库函数越多越容易写 ...
123apps-免费网络应用
前言在Jianrry`s博客看见推荐这个网址,试用了一下感觉还不错.主要是完全免费!!就当备用吧网站介绍 123apps 网站地址:https://123apps.com/cn/ 旗下网站: PD ...

hadoop ha集群搭建

hadoop ha集群搭建的更多相关文章

随机推荐

热门专题