adoop集群动态添加和删除节点
上篇博客我已经安装了Hadoop集群(hadoop集群的安装步骤和配置),现在写这个博客我将在之前的基础上进行节点的添加的删除。
首先将启动四台机器(一主三从)组成的hadoop集群,还是要提醒一句,在启动集群的时候一定要切换到hadoop用户下,并使用jps命令检查hadoop集群中的每台机器是否已经启动成功。
master机器:
- [root@master ~]# su - hadoop
- [hadoop@master ~]$ start-all.sh
- Warning: $HADOOP_HOME is deprecated.
- starting namenode, logging to/home/hadoop/hadoop/libexec/../logs/hadoop-hadoop-namenode-master.out
- slave1: starting datanode, logging to/home/hadoop/hadoop/libexec/../logs/hadoop-hadoop-datanode-slave1.out
- slave3: starting datanode, logging to/home/hadoop/hadoop/libexec/../logs/hadoop-hadoop-datanode-slave3.out
- slave2: starting datanode, logging to/home/hadoop/hadoop/libexec/../logs/hadoop-hadoop-datanode-slave2.out
- master: starting secondarynamenode, loggingto/home/hadoop/hadoop/libexec/../logs/hadoop-hadoop-secondarynamenode-master.out
- starting jobtracker, logging to/home/hadoop/hadoop/libexec/../logs/hadoop-hadoop-jobtracker-master.out
- slave2: starting tasktracker, logging to/home/hadoop/hadoop/libexec/../logs/hadoop-hadoop-tasktracker-slave2.out
- slave1: starting tasktracker, logging to/home/hadoop/hadoop/libexec/../logs/hadoop-hadoop-tasktracker-slave1.out
- slave3: starting tasktracker, logging to /home/hadoop/hadoop/libexec/../logs/hadoop-hadoop-tasktracker-slave3.out
- [hadoop@master ~]$ jps
- 1900 Jps
- 1662 SecondaryNameNode
- 1741 JobTracker
- 1512 NameNode
- [hadoop@master ~]$
slave1机器:
- [root@slave1 ~]# su - hadoop
- [hadoop@slave1 ~]$ jps
- 1476 DataNode
- 1562 TaskTracker
- 1620 Jps
slave2机器:
- [root@slave2 ~]# su - hadoop
- [hadoop@slave2 ~]$ jps
- 1474 DataNode
- 1630 Jps
- 1536 TaskTracker
slave3机器:
- [root@slave3 ~]# su - hadoop
- [hadoop@slave3 ~]$ jps
- 1474 DataNode
- 1651 Jps
- 1536 TaskTracker
四台机器的hadoop集群启动成功,在通过浏览器看一下集群的情况,如下面的图,mapreduce和namenode都是对应三个从服务器。
namenode:
mapreduce:
现在我就执行添加服务器的操作,其实这个很简单,首先我们要准备一台新的服务器,并且在新的服务器中安装好jdk环境以及hadoop,具体怎么安装就不说了,看上一篇博客。
修改所有机器的hosts文件和/home/hadoop/hadoop/conf下slaves文件,切换到hosts文件在文件的后面添加新节点的ip和机器名:192.168.56.204 slaves,再切换到hadoop用户,在slaves文件后面添加slave4,到此一台机器就配置完成,其他机器也是一样。新添加的节点中hosts文件和/home/hadoop/hadoop/conf下slaves文件内容和之前已经存在的节点配置一样,这里就不赘述了。
这里需要注意的是,需要在master机器中将.ssh目录下的公钥认证列表authorized_keys发送给slave4,这样启动hadoop集群的时候就不要输入slave4机器的密码了,方便启动操作,其实不发也可以,就是启动集群的时候数据密码麻烦一点。
配置都完成了,现在就在slave4机器中操作了。
切换到hadoop用户,进入hadoop的bin目录下执行下面的两个命令:
- [hadoop@slave4 bin]$ hadoop-daemon.sh startdatanode
- Warning: $HADOOP_HOME is deprecated.
- starting datanode, logging to/home/hadoop/hadoop/libexec/../logs/hadoop-hadoop-datanode-slave4.out
- [hadoop@slave4 bin]$
- [hadoop@slave4 bin]$
- [hadoop@slave4 bin]$ hadoop-daemon.sh starttasktracker
- Warning: $HADOOP_HOME is deprecated.
- starting tasktracker, logging to/home/hadoop/hadoop/libexec/../logs/hadoop-hadoop-tasktracker-slave4.out
使用jps检测是否启动成功:
- [hadoop@slave4 bin]$ jps
- 24581 Jps
- 24505 TaskTracker
- 24432 DataNode
- [hadoop@slave4 bin]$
然后我们通过浏览器访问namenode和mapreduce,看集群中是否添加了一个节点。
namenode:
mapreduce:
添加成功后我们就要考虑删除如何执行。其实并难。
首先关闭需要删除的节点:
- [hadoop@slave4 bin]$ hadoop-daemon.sh stopdatanode
- Warning: $HADOOP_HOME is deprecated.
- stopping datanode
- [hadoop@slave4 bin]$ hadoop-daemon.sh stoptasktracker
- Warning: $HADOOP_HOME is deprecated.
- stopping tasktracker
使用jps命令检查是否关闭成功。
- [hadoop@slave4 bin]$ jps
- 24649 Jps
- [hadoop@slave4 bin]$
其实此时通过浏览器查看已经少了一个节点,但是这种删除只是临时的,当集群关闭,再重新启动集群,这个临时删除的节点就会再次加到集群中。
接下来我就说一下如何在配置文件中配置,保证重启集群,不会再将删除的集群添加进去。
进入master机器中hadoop用户下hadoop解压目录下的conf目录:
将:将下面的这几行添加到hdfs-site.xml配置文件中即可。
- <property>
- <name>dfs.hosts.exclude</name>
- <value>/home/hadoop/hadoop/conf/excludes</value>
- </property>
然后在conf目录下创建一个excludes文件,将需要删除的节点机器名添加到文件中即可。
添加结束后刷新一下节点信息:
- [hadoop@master conf]$ hadoop dfsadmin –refreshNodes
刷新浏览器,查看namenode和mapreduce对应的节点数:
namenode:
mapreduce:
adoop集群动态添加和删除节点的更多相关文章
- Redis集群动态增加和删除节点
一.添加节点 1.首先将需要添加的节点启动: 这里启动redis6383.conf和redis6393.conf两个节点 查看原有节点: 3个主节点所对应的哈希槽(hash slo ...
- 使用Cloudrea Manager在CDH集群中添加kafka服务节点,更改borker.id配置后无法启动
需要保证meta.properties文件中的broker.id和cloudrea manager的web页面上kafka配置的broker.id一致,最好让server.properties中的br ...
- Hadoop概念学习系列之Hadoop集群动态增加新节点或删除已有某节点及复制策略导向 (四十三)
不多说,直接上干货! hadoop-2.6.0动态添加新节点 https://blog.csdn.net/baidu_25820069/article/details/52225216 Hadoop集 ...
- Elasticsearch集群管理之添加、删除节点
1.问题抛出 1.1 新增节点问题 我的群集具有黄色运行状况,因为它只有一个节点,因此副本保持未分配状态,我想要添加一个节点,该怎么弄? 1.2 删除节点问题 假设集群中有5个节点,我必须在运行时删除 ...
- Redis 集群环境添加节点失败问题
最近在给公司网管系统Redis集群环境添加节点时候遇到一个问题,提示新增的Node不为空: [root@node00 src]# ./redis-trib.rb add-node --slave -- ...
- 在Hadoop集群中添加机器和删除机器
本文转自:http://www.cnblogs.com/gpcuster/archive/2011/04/12/2013411.html 无论是在Hadoop集群中添加机器和删除机器,都无需停机,整个 ...
- 向CDH5集群中添加新的主机节点
向CDH5集群中添加新的主机节点 步骤一:首先得在新的主机环境中安装JDK,关闭防火墙.修改selinux.NTP时钟与主机同步.修改hosts.与主机配置ssh免密码登录.保证安装好了perl和py ...
- 在页面上绘制一张表格,使用 DOM 节点的动态添加和删除向表格中插入数据,点击表格每行后的“删除”超链接
查看本章节 查看作业目录 需求说明: 在页面上绘制一张表格,使用 DOM 节点的动态添加和删除向表格中插入数据,点击表格每行后的"删除"超链接,使用 DOM 节点的删除操作将对应的 ...
- Hyperledger Fabric节点的动态添加和删除
前言 在Hyperledger Fabric组织的动态添加和删除中,我们已经完成了在运行着的网络中动态添加和删除组织.本文将在其基础上,详细介绍了如何在 soft 组织上添加新的 peer2 节点,并 ...
随机推荐
- pt-online-schema-change 脚本化
mysql在线更改表可用工具 pt-online-schema-change 更改,或者用gh-ost更改.pt-online-schema-change 在原表创建索引,跟踪新插入的数据.gh-os ...
- (九)Pycharm异常、模块
异常: 当Python检测到一个错误时,解释器就无法继续执行了,反而出现了一些错误的提示,这就是所谓的"异常" 捕获异常: 格式:try+执行代码······ ...
- mysql的数据操作和内置功能总结
一.数据的增删改查 1.插入数据 a.插入完整数据(顺序插入) INSERT INTO 表名(字段1,字段2,字段3…字段n) VALUES(值1,值2,值3…值n); INSERT INTO 表名 ...
- 【ntp时间校准配置】
Ntp(网络时间协议)是一种可以通过TCP/IP网络传播,其架构模式可分为C/S(客户端/服务器),PTP(对等),broatcast(广播), mutilbrocast(组播),无论在任何系统或设备 ...
- 使用CSS3制作首页登录界面实例
响应式设计 在这个页面中,使用下面3点来完成响应式设计 1.最大宽度 .设定了一个 max-width 的最大宽度,以便在大屏幕时兼容.: 2.margin : 30px auto; 使其保持时刻居中 ...
- linux中安装node
1.去官网下载和自己系统匹配的文件: 英文网址:https://nodejs.org/en/download/ 中文网址:http://nodejs.cn/download/ 通过 uname -a ...
- ajax提交时 富文本CKEDITOR 获取不到内容
ckeditor数据向content(页面用以替换的编辑框)的同步 问题: 我们发现,在数据通过ajaxSubmit提交的过程中,并不能将最新的数据进行提交.换句话说,最新的数据无法被jQuery.f ...
- 模块导入应用settings的字符串
看django源码,感觉他的settings好高大上然后自己试试 以上是文件目录 email.py中代码 class Email: def send(self): print('发送email') M ...
- Druid单机环境安装指南
1.下载单机环境必备工具 下载druid-0.10.1-bin.tar.gz和tranquility-distribution-0.8.2.tgz插件 http://druid.io/download ...
- 各种数据库分页语句整理以及Oracle数据库中的ROWNUM和ORDER BY的区别
.oracle数据库分页 select * from (select a.*,rownum rc from 表名 where rownum<=endrow) a where a.rc>=s ...