开篇：在本笔记系列的第一篇中，我们介绍了如何搭建伪分布与分布模式的Hadoop集群。现在，我们来了解一下在一个Hadoop分布式集群中，如何动态（不关机且正在运行的情况下）地添加一个Hadoop节点与下架一个Hadoop节点。

一、实验环境结构

　　本次试验，我们构建的集群是一个主节点，三个从节点的结构，其中三个从节点的性能配置各不相同，这里我们主要在虚拟机中的内存设置这三个从节点分别为：512MB、512MB与256MB。首先，我们暂时只设置两个从节点，另外一个作为动态添加节点的时候使用。主节点与从节点所扮演的角色如下所示：

　　主节点(1个，主机名：hadoop-master)：NameNode、JobTracker、SecondaryNameNode

　　从节点(3个，主机名：hadoop-slave1、hadoop-slave2、hadoop-slave3)：DataNode、TaskTracker

TIPS：当然，我们也可以将SecondaryNameNode作为一个独立的节点分离出去，只需要增加一台服务器，并在主节点中修改hadoop中的配置文件：masters，将新节点的主机名添加进去即可。

二、动态添加节点

　　在实际生产应用中，很多时候因为现有集群的性能问题需要增加服务器节点以提高整体性能（一般是增加从节点，在Hadoop2.x之后解决了主节点的单点问题，可以增加主节点以保持HA高可用性），这就涉及到动态添加节点的问题。还好，Hadoop早就提供了很好的解决方法，我们只需要如下几步就可以轻松地添加一个节点：

　　（1）准备工作：配置新节点的各种环境

　　主要包括：设置IP地址、主机名、绑定IP地址与主机名的映射、生成SSH与各节点之间的无密码登录、安装JDK与Hadoop、设置配置文件；当然，都可以通过复制解决；

　　（2）在主节点中的slaves配置文件中添加要新加入的节点的主机名hadoop-slave3（在hadoop目录下/conf/slaves）

　　（3）在新节点hadoop-slave3中，通过Hadoop Shell启动datanode与tasktracker进程：

　　这两句shell命令分别是：

　　hadoop-daemon.sh start datanode
　　hadoop-daemon.sh start tasktracker

　　（4）在主节点中通过Hadoop Shell刷新从节点列表，获取新加入的节点信息：hadoop dfsadmin -refreshNodes

　　（5）在主节点的Web接口中查看Live Nodes数量变为了3，代表动态添加从节点成功

三、动态下架节点

　　在实际生产应用中，也会存在某个节点或某些节点因为某种原因而停止服务或者宕机的情况，Hadoop会通知一定的感知机制得到这些停止服务的节点的信息，从而通过其他节点获取文件（前提是我们所设置的副本数量>=2，默认为3）。

　　（1）通过关闭hadoop-slave3的电源或者输入一个shell命令停止datanode进程：hadoop-daemon.sh stop datanode

　　->这里我们可以通过后者，这个shell命令来看看

　　（2）我们现在再通过主节点的Web接口来看看运行情况：

PS：停止hadoop-slave3的datanode进程后发现，NameNode的Web接口上hadoop-slave节点的LastContact字段的值会不断地增大。这是因为DataNode每次启动时都会向NameNode汇报，NameNode会记录下它的访问时间，然后NameNode用当前访问时间减去上次访问时间，就得出LastContact的值，也就是多长时间未访问。又由于实际环境中经常存在网络问题造成短暂掉线，所以NameNode会等待一段时间（默认等10分钟）之后，才会将它视为死节点。所以，为了防止数据丢失所以在实际中副本数一般会设为2以上（默认为3），当某个节点死掉以后，可以通过副本找回数据。

　　（3）重新启动hadoop-slave3的datanode进程：hadoop-daemon.sh start datanode

　　（4）现在再次通过主节点的Web接口来看看运行情况：变为了0

四、Hadoop中的安全模式

　　当Hadoop的NameNode节点启动时，会进入安全模式阶段。

　　（1）在此阶段，DataNode会向NameNode上传它们数据块的列表，让 NameNode得到块的位置信息，并对每个文件对应的数据块副本进行统计。当最小副本条件满足时，即一定比例的数据块都达到最小副本数，系统就会退出安全模式，而这需要一定的延迟时间。

　　（2）当最小副本条件未达到要求时，就会对副本数不足的数据块安排DataNode进行复制，直至达到最小副本数。而在安全模式下，系统会处于只读状态，NameNode不会处理任何块的复制和删除命令。

　　那么，如何判断HDFS是否处于安全模式呢？hadoop dfsadmin -safemode get

　　如何手动进入和离开安全模式呢？hadoop dfsadmin -safemode enter/leave

　　进入安全模式后，再向HDFS上传或修改文件会出现什么情况？一个提示“正在处于安全模式”的异常

　org.apache.hadoop.dfs.SafeModeException: Cannotdelete/user/hadoop/input. Name node is in safe mode.从字面上来理解：“Name nodeis in safe mode.”hadoop的namenode处于安全模式。

参考资料

（1）吴超，《Hadoop深入浅出》：http://www.superwu.cn

（2）Suddenly，《Hadoop日记Day19-分布式安装》：http://www.cnblogs.com/sunddenly/p/4011455.html

（3）michael_zhu，《Hadoop安全模式的理解》：http://blog.csdn.net/michael_zhu_2004/article/details/8268728

作者：周旭龙

出处：http://www.cnblogs.com/edisonchou/

本文版权归作者和博客园共有，欢迎转载，但未经作者同意必须保留此段声明，且在文章页面明显位置给出原文链接。

Hadoop学习笔记—13.分布式集群中节点的动态添加与下架的更多相关文章

Hadoop（五）分布式集群中HDFS系统的各种角色
NameNode 学习目标理解 namenode 的工作机制尤其是元数据管理机制,以增强对 HDFS 工作原理的理解,及培养 hadoop 集群运营中“性能调优”.“namenode”故障问题的分 ...
Hadoop学习之路（十二）分布式集群中HDFS系统的各种角色
NameNode 学习目标理解 namenode 的工作机制尤其是元数据管理机制,以增强对 HDFS 工作原理的理解,及培养 hadoop 集群运营中“性能调优”.“namenode”故障问题的分 ...
Redis学习笔记八：集群模式
作者:Grey 原文地址:Redis学习笔记八:集群模式前面提到的Redis学习笔记七:主从复制和哨兵只能解决Redis的单点压力大和单点故障问题,接下来要讲的Redis Cluster模式,主要是 ...
Hadoop学习笔记(3)——分布式环境搭建
Hadoop学习笔记(3) ——分布式环境搭建前面,我们已经在单机上把Hadoop运行起来了,但我们知道Hadoop支持分布式的,而它的优点就是在分布上突出的,所以我们得搭个环境模拟一下. 在这里, ...
ZooKeeper学习笔记一：集群搭建
作者:Grey 原文地址:ZooKeeper学习笔记一:集群搭建说明单机版的zk安装和运行参考:https://zookeeper.apache.org/doc/r3.6.3/zookeeperS ...
集群中节点（Node）与单机数据库的区别
集群中节点(Node)与单机数据库的区别: 区别项集群中节点(Node) 单机数据库只能使用0号数据库是都可以使用
redis 学习笔记(6)-cluster集群搭建
上次写redis的学习笔记还是2014年,一转眼已经快2年过去了,在段时间里,redis最大的变化之一就是cluster功能的正式发布,以前要搞redis集群,得借助一致性hash来自己搞shardi ...
Hadoop学习笔记【分布式文件系统学习笔记】
分布式文件系统介绍分布式文件系统:Hadoop Distributed File System,简称HDFS. 一.HDFS简介 Hadoop分布式文件系统(HDFS)被设计成适合运行在通用硬件(c ...
Hadoop 3.0完全分布式集群搭建方法（CentOS 7+Hadoop 3.2.0）
本文详细介绍搭建4个节点的完全分布式Hadoop集群的方法,Linux系统版本是CentOS 7,Hadoop版本是3.2.0,JDK版本是1.8. 一.准备环境 1. 在VMware worksta ...

随机推荐

CSS系列：在HTML中引入CSS的方法
HTML与CSS是两个作用不同的语言,它们同时对一个网页产生作用,因此必须将CSS与HTML链接在一起使用.在HTML中,引入CSS的方法主要有4种:行内式.内嵌式.导入式和链接式. 1. 行内式行 ...
RAC+asm通过rman恢复到单实例+asm
1.恢复参数文件,并修改参数文件参数文件指名几个最简单的就行,我的参数文件如下: 2.恢复控制文件,并启动数据库到mount 如果是把备份集从别的服务器拷贝到本地恢复的服务器的目录,使用下面的语句指 ...
[BI项目记]-BUG处理
BUG是在项目过程中以及运维过程中经常遇到的工作项.在处理每一个BUG的过程中,通过项目管理系统把BUG相应的内容纪录下来也是很重要的.这里将介绍如何通过TFS来完成BUG的处理工作. 首先看一下BU ...
7 Container With Most Water_Leetcode
Given n non-negative integers a1, a2, ..., an, where each represents a point at coordinate (i, ai). ...
Flash: An Efficient and Portable Web Server
Introduction This paper presents the design of a new Web server architecture called the asymmetric m ...
Mac下golang开发环境配置
go语言在开发效率和运行效率中的优势让很多人青睐,所以有倾向打算转向go语言的开发. 下面介绍在Mac OS X中golang的开发环境配置. 1.安装brew brew是一个mac下的由ruby开发 ...
shell（一）
#服务器之间拷贝数据 scp -r 本地文件目录系统用户名@IP:目标文件夹路径
form表单提交问题
1.提交后不能跳转到指定页面 jsp代码 <form class="form-horizontal" role="form"> <p clas ...
Oracle VM VirtualBox 安装CentOS 配置图形界面记录
su yum groupinstall "X Window System" -y yum groupinstall "Desktop" -y 最后运行#star ...
1、Spring In Action 4th笔记（1）
Spring In Action 4th笔记(1) 2016-12-28 1.Spring是一个框架,致力于减轻JEE的开发,它有4个特点: 1.1 基于POJO(Plain Ordinary Jav ...

Hadoop学习笔记—13.分布式集群中节点的动态添加与下架