hadoop Non DFS Used是什么

首先我们先来了解一下Non DFS User是什么？

Non DFS User的意思是：非hadoop文件系统所使用的空间，比如说本身的linux系统使用的，或者存放的其它文件

它的计算公式：

non dfs used = configured capacity - remaining space - reserved space

如果给datanode配置了预留磁盘空间参数的话，可以用下面的公式计算

Non DFS used = ( Total Disk Space - Reserved Space) - Remaining Space - DFS Used

我们来看个例子：

如果有100G磁盘，设置dfs.datanode.du.reserved这个值为30G，在该磁盘上系统和其他文件使用了40G，

DFS使用了10GB。如果执行df -h,可以看到有效空间是50G.

在HDFS web 界面上，会看到

non dfs user=100(total)-30(reserved)-10(dfs used)-50(remaing)=10G.

所以实际上，你初始预留了30G给non dfs使用，70G给hdfs.然而，实际出来的non dfs使用超过了30G并且吃掉了属于hdfs的10g空间。

“non dfs used”应该这样子定义“how much configured dfs capacity are occupied by non dfs use”.

译为：配置的dfs的空间有多少被不是hdfs的文件占用了

结论是：

如果没有配置dfs.datanode.du.reserved，默认值是0，也就是磁盘的所以空间都给dfs，更好理解non dfs used了，就是给dfs配置的空间有多少被系统、系统进程使用了

在hadoop集群内部使用率是如此高

可用用‘lsof|grep delete’,该命令可以帮你确认哪些已经打开的文件被删除了。有时候，hadoop的进程（例如hive/yarn/mapred/hdfs等）也会引用这些已经删除的文件。这些引用也会占用磁盘空间。

可以用这个命令

du -hsx * | sort -rh | head -10

查看排行10的最大文件夹或是文件。

hadoop Non DFS Used是什么的更多相关文章

hadoop的dfs工具类一个【原创】
开始没搞定插件问题,就弄了个dsf操作类,后面搞定了插件问题,这玩意也就聊胜于无了,还是丢这里算了. 首先是一个配置,ztool.hadoop.properties hadoop.home.dir=G ...
Hadoop： HDFS 格式化时，出现 “ERROR namenode.NameNode: java.io.IOException: Cannot create directory /usr/hadoop/tmp/dfs/name/current”
原因是没有设置 /usr/hadoop/tmp 的权限没有设置, 将之改为: chown –R hadoop:hadoop /usr/hadoop/tmp 查看:
Java之使用Hadoop探索大数据的世界
什么是大数据 PB = 1024tb 7123913827189tb Reids 无共享 HDFS 优点 :特别适合存储大型文件 TFS hdfs 架构 NameNode: 整个hadoop总管,只有 ...
HADOOP安装指南-Ubuntu15.10和hadoop2.7.2
Ubuntu15.10中安装hadoop2.7.2安装手册太初目录 1. Hadoop单点模式... 2 1.1 安装步骤... 2 0.环境和版本... 2 1.在ubu ...
hadoop伪分布式平台搭建（centos 6.3）
最近要写一个数据量较大的程序,所以想搭建一个hbase平台试试.搭建hbase伪分布式平台,需要先搭建hadoop平台.本文主要介绍伪分布式平台搭建过程. 目录: 一.前言二.环境搭建三.命令测试 ...
安装hadoop集群服务器(hadoop1.2.1)
摘要:hadoop,一个分布式系统基础架构,可以充分利用集群的威力进行高速运算和存储.本文主要介绍hadoop的安装与集群服务器的配置. 准备文件: ▪ VMware11.0.0 ▪ Cen ...
Hadoop 集群搭建
Hadoop 集群搭建 2016-09-24 杜亦舒目标在3台服务器上搭建 Hadoop2.7.3 集群,然后测试验证,要能够向 HDFS 上传文件,并成功运行 mapreduce 示例程序搭建 ...
转载：Hadoop安装教程_单机/伪分布式配置_Hadoop2.6.0/Ubuntu14.04
原文 http://www.powerxing.com/install-hadoop/ 当开始着手实践 Hadoop 时,安装 Hadoop 往往会成为新手的一道门槛.尽管安装其实很简单,书上有写到, ...
hadoop单机
Hadoop安装教程——单机模式博客分类: 大数据 Hadoop是MapReduce的开源实现,网上有很多相关的文章,但是很多不全,有的有点乱,本人Ubuntu小白,Hadoop初学者,根据别人的资 ...

随机推荐

Unity之配置转换工具
本人写的配置转换工具,可将策划的配置excel文件一键转换为unity的asset文件或lua代码: 转换请注明出处:http://www.cnblogs.com/jietian331/p/86252 ...
Archlinux软件包管理pacman基本使用说明
熟悉APT和YUM包管理的应该都知道,这两个包管理的使用命令都是采用"主命令+参数"的格式,比如"sudo apt-get install --reinstall pac ...
专题8：javascript中事件
一.事件流 1.1 事件冒泡冒泡型事件:事件按照从最特定的事件目标到最不特定的事件目标的顺序逐一触发: 注意:各个浏览器在处理<html>标记级别的事件时顺序有出入,因此无论任何情况,都 ...
使用go语言数据库
1.下载并导入数据库驱动包(注意配置环境变量.数据库.go.以及ENV) 这里选择了Go-MySQL-Driver这个实现.地址是:https://github.com/go-sql-driver/m ...
json字符串转Java List 简单方法
JSONArray jsonArr = JSONArray.fromObject(jsonStr); List<Map<String,Object>> listMap = (L ...
autotools源文件相同/不同目录下
关于Autotools 我们前面的章节中已经讲到了Makefile的使用(点击进入查看文章).我们知道在Linux下面如果编译一个比较大型的项目,我们可以通过Makefile的方式来完成. 但是,我们 ...
D5 LCA 最近公共祖先
第一题: POJ 1330 Nearest Common Ancestors POJ 1330 这个题可不是以1为根节点,不看题就会一直wa呀: 加一个找根节点的措施: #include<alg ...
urllib3
urllib3是一个功能强大.条理清晰.用于http客户端的python库,相对于urllib它所有的特点如下: 线程安全连接池客户端SSL/TLS验证使用多部分编码上传文件 Helpers用于 ...
angular --- s3core移动端项目
因为记性不好的原因做个草稿笔记 app.js中 var myApp = angular.module('myApp',['ui.router','oc.lazyLoad','ngAnimate','数 ...
springboot2.0 最大上传文件大小遇到的错误Failed to bind properties under 'spring.servlet.multipart.max-file-size'
错误: 解决: 把100Mb改为100MB

hadoop Non DFS Used是什么

hadoop Non DFS Used是什么的更多相关文章

随机推荐

热门专题