hadoop常用的操作命令
1.显示hdfs上test目录下的所有文件列表
hadoop fs -ls /test/
2.查看hdfs中的文件内容
hadoop fs -cat /daas/bstl/term/rawdt/20150805_9 | less
3.在hdfs上创建目录
hadoop fs -mkdir /test/datatest //创建datatest
4.从hdfs上复制文件到另外的一个目录下
hadoop fs -cp /test/cp1.txt /test1/ //将cp1.txt从test目录下复制到test1目录下
5.从本地上传文件到hdfs上
例如本地有文件:test.txt
hadoop fs -put test.txt /test/data/ //将test.txt 用put命令上传至hdfs中的data目录下
6.从hdfs上将文件下载到本地
例如hdfs上有文件test.txt
hadoop fs -get /test/data/test.txt
7.用超级用户给用户加权限
hadoop fs -chown lyb:lyb /test/lyb
8.查看hdfs文件夹的占用内存
hadoop fs -du -s -h /test/datatest/flume
9.删除hdfs上的文件
hadoop fs -rm /test/data/test.txt //删除test.txt文件
hadoop fs -rmr /test/data/ //删除data目录
hadoop fs -rmr /test/data/* //删除data目录下所有的文件
10.hdfs上把文件的前十条数据取出并下载到本地,并重命名为txt文件
hadoop fs -text /daas/bstl/dpifix/sichuan/20151104/FixedDPI.2015110423.1446652074136.lzo_deflate |head -n 10 >> /tmp/sichuan3.txt
11.查看hdfs上文件内容的条数
hadoop fs -ls /test/datatest/test.txt | wc -l
12.统计某一类文件的占用的大小:
示例:
(1)以G为单位显示:
hadoop fs -ls /daas/bstl/dpifix/sichuan/20151104 |grep 2015110409 |awk 'BEGIN {size=0;} {size=size+$5;} END{print "[end]size is ", size/1024/1024/1024,"G"}'
(2)以M为单位显示:
hadoop fs -ls /daas/bstl/dpifix/sichuan/20151104 |grep 2015110409 |awk 'BEGIN {size=0;} {size=size+$5;} END{print "[end]size is ", size/1024/1024,"M"}'
12.hadoop job 管理命令
(1)列出Jobtracer上所有的作业
hadoop job -list
(2)使用hadoop job -kill杀掉指定的jobid
hadoop job -kill job_id
(3)组合以上两条命令就可以实现kill掉指定用户的job
for i in `hadoop job -list | grep -w username| awk '{print $1}' | grep job_`; do hadoop job -kill $i; done
13.彻底删除文件命令:
hadoop fs -rm -r -skipTrash
hadoop常用的操作命令的更多相关文章
- 记录 git 常用的操作命令总结
记录 git 常用的操作命令总结 2016-12-15 16:44:04 作为一名开发者,熟悉使用 git 代码管理工具是一项必备的基本技能.git 相较 SVN 而言,其优点不言而喻.git 的功能 ...
- dos常用文件操作命令
1.DIR 含义: 显示指定目录下的文件和子目录列表 类型: 内部命令 格式: DIR[drive:][path][filename][/p][/w][/A[[:]attributes]][/O[[: ...
- hadoop 常用配置项【转】
hadoop 常用配置项[转] core-site.xml name value Description fs.default.name hdfs://hadoopmaster:9000 定义 ...
- 【Hadoop篇】--Hadoop常用命令总结
一.前述 分享一篇hadoop的常用命令的总结,将常用的Hadoop命令总结如下. 二.具体 1.启动hadoop所有进程start-all.sh等价于start-dfs.sh + start-yar ...
- Hadoop常用命令总结
一.前述 分享一篇hadoop的常用命令的总结,将常用的Hadoop命令总结如下. 二.具体 1.启动hadoop所有进程start-all.sh等价于start-dfs.sh + start-yar ...
- CentOS运维常用管理操作命令
自己整理的整理Linux常用运维和linux常用管理操作命令,当然不是非常详细和丰富,但是也基本上够用了吧.欢迎留言补充更多的Linux常用运维和linux常用管理操作命令.不断完善中.... 备份m ...
- Hadoop常用操作
Hadoop常用操作 1.Hadoop安装 略 2.Hadoop配置 略 3.Hadoop多目录配置 namenode和datanode节点下都可以进行多个目录的配置,但是意义不同.namenode的 ...
- git中常用的操作命令有哪些?常用操作命令归纳
git中常用的操作命令有哪些?本篇文章就给到大家归纳了一些git中常用操作命令.有一定的参考价值,有需要的朋友可以参考一下,希望对你有所帮助. git开始 全局配置:配置用户名和e-mail地址 1 ...
- 大数据之路week06--day07(Hadoop常用命令)
一.前述 分享一篇hadoop的常用命令的总结,将常用的Hadoop命令总结如下. 二.具体 1.启动hadoop所有进程start-all.sh等价于start-dfs.sh + start-yar ...
随机推荐
- Python学习--03变量类型
变量赋值 Python中的变量不需要声明,变量的赋值操作既是变量声明和定义的过程. 每个变量在内存中创建,都包括变量的标识,名称和数据这些信息. 每个变量在使用前都必须赋值,变量赋值以后该变量才会被创 ...
- mongodb全套配置
1,下载&安装 MongoDB 提供了centos yum安装方式. 参考:http://docs.mongodb.org/manual/tutorial/install-mongodb-on ...
- CRL快速开发框架系列教程二(基于Lambda表达式查询)
本系列目录 CRL快速开发框架系列教程一(Code First数据表不需再关心) CRL快速开发框架系列教程二(基于Lambda表达式查询) CRL快速开发框架系列教程三(更新数据) CRL快速开发框 ...
- PHP继承
继承是PHP5面象对象程序设计的重要特性之一,它是指建立一个新的派生类,从一个或多个先前定义的类中继承数据和函数,而且可以重新定义或加进新数据和 函数,从而建立了类的层次或等级. 继承性是子类自动共享 ...
- linux su和sudo命令的区别
一. 使用 su 命令临时切换用户身份 1.su 的适用条件和威力 su命令就是切换用户的工具,怎么理解呢?比如我们以普通用户beinan登录的,但要添加用户任务,执行useradd ,beinan用 ...
- 代码的坏味道(12)——平行继承体系(Parallel Inheritance Hierarchies)
坏味道--平行继承体系(Parallel Inheritance Hierarchies) 平行继承体系(Parallel Inheritance Hierarchies) 其实是 霰弹式修改(Sho ...
- 利用Python进行数据分析(9) pandas基础: 汇总统计和计算
pandas 对象拥有一些常用的数学和统计方法. 例如,sum() 方法,进行列小计: sum() 方法传入 axis=1 指定为横向汇总,即行小计: idxmax() 获取最大值对应的索 ...
- Java判断字符串是否是数值
判断一个字符串是否是数值,可以用正则表达式来判断.更简单的方法是把字符串转换成Float或者Double,然后捕捉NumberFormatException错误,如果有错误,就说明不是一个数值,如果没 ...
- Java 内存区域与内存溢出
内存区域 Java 虚拟机在执行 Java 程序的过程中会把他所管理的内存划分为若干个不同的数据区域.Java 虚拟机规范将 JVM 所管理的内存分为以下几个运行时数据区:程序计数器.Java 虚拟机 ...
- Eclipse(一)
Eclipse的初步学习