hdfs 删除和新增节点

最近发现hdfs的一个问题，每当集群开启的时候，有一个节点上的可用空间就一直在减少，并且速度很快，发现是data目录下的dncp_block_verification.log.curr文件在一直变大，查了日志没有发现什么可疑的原因，只在datanode的日志上发现有几条日志如下非常可疑：

-- ::, INFO org.apache.hadoop.hdfs.server.datanode.fsdataset.impl.FsDatasetAsyncDiskService: Deleted BP--

92.168.1.50- blk_1073748736_7916 file /home/hadoop/hdfsdisk/data/current/BP--192.168.1.50-/curren

t/finalized/subdir0/subdir27/blk_1073748736

-- ::, INFO org.apache.hadoop.hdfs.server.datanode.fsdataset.impl.FsDatasetAsyncDiskService: Deleted BP--

92.168.1.50- blk_1073846979_106183 file /home/hadoop/hdfsdisk/data/current/BP--192.168.1.50-/curr

ent/finalized/subdir1/subdir154/blk_1073846979

好像是namenode发出的删除请求，但是不知道在删除什么

由于暂时没有找出故障原因，所以打算将这个节点删除，然后将节点再添加回来，具体步骤如下：

1. 平滑删除节点

1.1 修改hdfd-site.xml文件

首先集群是开启的，然后添加代码如下：

<property>

    <name>dfs.hosts.exclude</name>

    <value>/home/hadoop/hadoop-2.6./etc/hadoop/excludes</value>

    <description> Names a file that contains a list of hosts that are not permitted to connect to the namenode.  The full pathnam

e of the file must be specified If the value is empty, no hosts are excluded. </description>

</property>

其中/home/hadoop/hadoop-2.6.0/etc/hadoop/excludes文件中为要删除的机器hostname，示例如下：

slave8.spark

slave9.spark

1.2 然后执行命令刷新hdfs节点：

hadoop dfsadmin  -refreshNodes
更新hdfs节点状态，由于存在副本的原因，在后台会有块的移动

    1.3 运行命令查看hdfs报告

    hadoop dfsadmin -report
    会显示如下状态：

Live datanodes ():

Name: 192.168.1.58: (slave8.spark)

Hostname: slave8.spark

Decommission Status : Decommission in progress

Configured Capacity:  (836.66 GB)

DFS Used:  (786.12 GB)

Non DFS Used:  (44.39 GB)

DFS Remaining:  (6.15 GB)

DFS Used%: 93.96%

DFS Remaining%: 0.74%

Configured Cache Capacity:  ( B)

Cache Used:  ( B)

Cache Remaining:  ( B)

Cache Used%: 100.00%

Cache Remaining%: 0.00%

Xceivers:

Last contact: Sun Nov  :: CST

说明该节点已经被移除，其实应该等到在hdfs内部块移动结束之后再结束集群，但是我没有等到，直接在显示如上状态后就关闭了集群，然后将slaves中的该节点hostname删除后启动了集群，启动后hdfs又开始了移动块，但是很慢，会等很长时间，但是如果集群一直要用无法关闭集群的话，这个过程是很重要的。

2. 添加节点

添加新节点时需要在slaves配置文件中新增即将添加的节点，然后再进行集群平衡操作，如果不想进行平衡操作也可以（不推荐），这样做只是导致了集群中每个节点已占用空间大小不一致，添加节点也有两种方式，平滑添加和非平滑添加，具体操作如下：

2.1 平滑添加，需要停止namenode
1.停止namenode
2.修改slaves文件
3.启动namenode
4.执行hadoop balance命令平衡集群节点

2.2非平滑添加datanode，不需要停止namenode
1.修改slaves文件，添加需要增加的节点
2.启动datanode，hadoop-daemon.sh start datanode
3.执行hadoop balance命令平衡集群节点

执行节点平衡命令为balance命令，使用示例如下：start-balancer.sh -threshold 8，具体详细使用方法请查阅。

hdfs 删除和新增节点的更多相关文章

redis 集群新增节点，slots槽分配，删除节点， [ERR] Calling MIGRATE ERR Syntax error, try CLIENT (LIST | KILL | GET...
redis reshard 重新分槽(slots) https://github.com/antirez/redis/issues/5029 redis 官方已确认该bug redis 集群重新(re ...
hadoop 集群加入一个新的存储节点和删除一个计算节点需要刷新集群状态命令
加入一个新的存储节点和删除一个计算节点需要刷新集群状态命令方式1:静态添加datanode,停止namenode方式 1.停止namenode 2.修改slaves文件,并更新到各个节点3.启动na ...
实验-hadoop新增节点
关于hadoop新增节点网上的说法都有些差别,自己来实践一把 1.建立一个namenode一个datanode的集群 master:192.168.126.130 slave1:192.168.126 ...
CDH5.16.1集群新增节点
如果是全新安装集群的话,可以参考<Ubuntu 16.04上搭建CDH5.16.1集群> 下面是集群新增节点步骤: 1.已经存在一个集群,有两个节点 192.168.100.19 hado ...
k8s节点简介、移除节点、新增节点
简介 Node是Pod真正运行的主机,可以是物理机也可以是虚拟机. Node本质上不是Kubernetes来创建的, Kubernetes只是管理Node上的资源. 为了管理Pod,每个Node节点上 ...
k8s系列--node(k8s节点介绍，新增节点，移除节点）
一.简介 Node是Pod真正运行的主机,可以是物理机也可以是虚拟机. Node本质上不是Kubernetes来创建的, Kubernetes只是管理Node上的资源. 为了管理Pod,每个Node节 ...
[LeetCode] Delete Node in a Linked List 删除链表的节点
Write a function to delete a node (except the tail) in a singly linked list, given only access to th ...
试验删除RAC(ORA10G)节点
1.环境概述 2.删除一个节点本实验中以删除第二个节点为示例. 2.1删除数据库实例在第一个节点上(存活的节点)上使用DBCA删除第二个节点的实例. 执行完以上操作可以看下crs_stat –t ...
[CareerCup] 2.3 Delete Node in a Linked List 删除链表的节点
2.3 Implement an algorithm to delete a node in the middle of a singly linked list, given only access ...

随机推荐

python 函数map()、filter()、reduce()
map()函数将一个列表进行遍历,对每一个字符串进行处理: 例如: num_list = ["我","是","哈哈","太 ...
记一次菜鸡的低级折腾--WordPress get Webshell(后台文件编辑插马)
挺简单的一个测试站,开始思路错了,一直去网上找WordPress的漏洞,看有没有什么能利用的,未果,因为这个测试站有些地方并不完善,有的漏洞利用不了,菜鸡的我连弱口令都没猜对,没知识就是这么悲哀. 下 ...
我的Python学习笔记之文件操作
一,Python的文件类型有两种 1.文本文件 2.二进制文件文件的操作: 1.打开文件,获取文件的控制权 2.读写文件 3.关闭文件,释放文件的控制权,如果不释放控制权,那么其他程序就不能访问此文 ...
RTL8711AM
官方文档主要修改为了实现log服务 1,在log_service.h 取消注释 #ifndef LOG_SERVICE_H #define LOG_SERVICE_H #include " ...
tools.windows.bat#批处理
关于%~ %~I - 删除任何引号("),扩展 %I %~fI - 将 %I 扩展到一个完全合格的路径名 %~dI - 仅将 %I 扩展到一个驱动器号 %~pI - 仅将 %I 扩展到一个路 ...
Android实现三级联动下拉框下拉列表spinner
原文出处:http://www.cnblogs.com/zjjne/archive/2013/10/03/3350107.html 主要实现办法:动态加载各级下拉值的适配器在监听本级下拉框,当本级下 ...
怎样设置使IntelliJ IDEA智能提示忽略大小写?
打开设置(CTRL+ALT+S)打开editor,找到“Code Completion”->点击Match case前面的框不勾选即可.如下图:
2019年第十届蓝桥杯【C++省赛B组】
试题 A: 组队本题总分:5 分作为篮球队教练,你需要从以下名单中选出 1 号位至 5 号位各一名球员,组成球队的首发阵容.每位球员担任 1 号位至 5 号位时的评分如下表所示.请你计算首发阵容 ...
Excel中神奇的vlookup函数之基础应用
1.问题: 如下示例,需要将右边的表格匹配上对应工号的销售额. 这属于vlookup函数最基础的单条件匹配应用,左边表称为A表.右边表称为B表. 2.vlookup函数套路介绍 vlookup ...
浅谈Spring 5的响应式编程
这篇使用Spring 5进行响应式编程的入门文章展示了你现在可以使用的一些新的non-blocking, asynchronous.感谢优锐课老师给予的指导! 近年来,由于响应式编程能够以声明性的方式 ...

hdfs 删除和新增节点

hdfs 删除和新增节点的更多相关文章

随机推荐

热门专题