一、查看一堆文件共有多少行

查看file1/file2目录下所有文件总共多少行

hadoop fs -text file1/file2/* | wc -l

二、正则表达式

hadoop fs -text file1/file2/* | grep ','

匹配file1/file2/*文件中含逗号','的内容。

二、deflate文件

  1、查看:(hdfs处理之后一种压缩文件),可以采用hadoop fs -text +文件名查看

  2、解压:(解压一个文件)解压Hadoop的file1/file2目录下file_a文件到本地file_b文件中:

hadoop fs -text file1/file2/file_a.deflate> file_b

      (解压所有文件到本地一个文件)

hadoop fs -text file1/file2/*> file_b 

三、从Hadoop上下载文件到本地当前目录下

【若报错:input/output,查看目录有没有写对,以及本地当前目录是否有权限写入,如果没有,修改文件权限】

hadoop fs -get hadoop_file1/file_2 

四、检查文件存不存在test

 test
使用方法:hadoop fs -test -[ezd] URI
选项:-e 检查文件是否存在。如果存在则返回0。-z 检查文件是否是0字节。如果是则返回0。-d 如果路径是个目录,则返回1,否则返回0。
示例:
hadoop fs -test -e filename

shell命令的返回值用 $? 表示;还需要执行 echo $?; 查看

五、统计目录下文件大小

-du 统计目录下文件大小 ;  -du -s 汇总目录下文件大小,单位字节  ; -du -h ,显示目录下各个文件的大小。

 -du -s -h  /user/hive/warehouse/table_test
# 汇总该表所占据的存储空间,显示单位

六、两个集群之间的分布式拷贝:distcp

distcpfromlycc $REMOTE_DIR $HDFS_BASE_DIR

注意:lycc的远程路径是绝对路径,Hadoop 的hdfs路径也是绝对路径,不然会报什么不是挂载点错误

七、hadoop上命令行查看lzo、gz、bz文件

https://sukbeta.github.io/hadoop-lzo-gz-bz2/

HDFS上的文件可能是压缩的,所以用cat不能直接查看。hadoop上默认支持lzo、gz、bz2、snappy压缩格式。

我们用命令行查看HDFS上压缩文件,也是可以的。

lzo文件

  • 查看 HDFS 上 lzo 文件的命令
hadoop fs -cat /Data/Logs/--/--22_log.lzo | lzop -dc | head -

或

hadoop fs -cat /Data/Logs/--/--22_log.lzo | lzop -dc | head -     lzop 会接受输入流然后解压输出流给head显示第一行

gzip 文件

  • 查看 HDFS 上 gzip 文件的命令
hadoop fs -cat /shining/temp.txt.gz | gzip -d

hadoop fs -cat /shining/temp.txt.gz | zcat

bz2 文件

  • 查看 HDFS 上 bz2 文件的命令
hadoop fs -cat /temp/b.bz2 | bzip2 -d

text 命令

Hadoop text 命令可以查看HDFS上的文本、压缩文件

hadoop fs -text /temp/b.bz2

hadoop fs -text /temp/test_hive.txt.gz

hadoop fs -text /temp/l.lzo

hadoop fs -text /tmp/out1/part-r-
 

Hadoop 使用小命令(2)的更多相关文章

  1. 如何利用Hadoop存储小文件

    **************************************************************************************************** ...

  2. Hadoop常见重要命令行操作及命令作用

    关于Hadoop [root@master ~]# hadoop --help Usage: hadoop [--config confdir] COMMANDwhere COMMAND is one ...

  3. Hadoop 之Hbase命令

    一.常用命令:(hbase shell 进入终端) 1.创建表: create 'users','user_id','address','info' 表users,有三个列族user_id,addre ...

  4. Hadoop之Storm命令

    Hadoop之Storm命令 1.storm核心概念 stream--->一列火车 tuple--->一节车厢 数据--->乘客 spout--->始发站 bolt---> ...

  5. [转]hadoop hdfs常用命令

    FROM : http://www.2cto.com/database/201303/198460.html hadoop hdfs常用命令   hadoop常用命令:  hadoop fs  查看H ...

  6. Linux下提权常用小命令

    有些新手朋友在拿到一个webshell后如果看到服务器是Linux或Unix操作系统的就直接放弃提权,认为Linux或Unix下的提权很难,不是大家能做的,其实Linux下的提权并没有很多人想象的那么 ...

  7. hadoop 安装、命令

    hadoop安装步骤: 安装java 安装hadoop 下载地址:http://apache.claz.org/hadoop/common/ (说明:该网址current文件夹下,是最新版) hado ...

  8. 介绍hadoop中的hadoop和hdfs命令

    有些hive安装文档提到了hdfs dfs -mkdir ,也就是说hdfs也是可以用的,但在2.8.0中已经不那么处理了,之所以还可以使用,是为了向下兼容. 本文简要介绍一下有关的命令,以便对had ...

  9. Hadoop的常用命令

    注:hadoop的使用命令包含 hadoop fs 开头 or hdfs dfs开头 等多种形式来操作. 这里以hadoo fs的形式来介绍在这些命令 1.列出根目录下所有的目录或文件 hadoop ...

随机推荐

  1. spring mvc源码-》MultipartReques类-》主要是对文件上传进行的处理,在上传文件时,编码格式为enctype="multipart/form-data"格式,以二进制形式提交数据,提交方式为post方式。

    spring mvc源码->MultipartReques类-> MultipartReques类主要是对文件上传进行的处理,在上传文件时,编码格式为enctype="multi ...

  2. MVC.Net:压缩/保存图片缩略图

    通常用户上传的图片需要压缩或者生成缩略图.用System.Web.Helpers.WebImage的Resize方法可以很方便的实现这一功能.示例代码如下: /// <summary> / ...

  3. swift2.0学习之拓展

    拓展:和oc的拓展方法功能差点儿相同.就是给已经存在的类,结构体.枚举,协议类型添加新的方法 拓展语法: 用extensionkeyword声明: extension SomeType { // ne ...

  4. monitor weblogic server ,Very simple to use, weblogic监控、巡检、故障简单小工具

        1. 开发了一个简单的监视weblogic执行情况的小程序.各位朋友下载下来试试,不用登陆console就能够知道server的执行状况,包含了jvm.线程.jdbc.状态jms等:另一个更简 ...

  5. ext4文件系统制作 - make_ext4fs 参数介绍【转】

    本文转载自:http://blog.csdn.net/u011784994/article/details/53816976 make_ext4fs用于Android平台上制作ext4文件系统的镜像. ...

  6. Linux下使用popen()执行shell命令【转】

    本文转载自:https://my.oschina.net/u/727148/blog/262987 函数原型: #include “stdio.h” FILE popen( const char co ...

  7. 2017 Multi-University Training Contest - Team 2&&hdu 6047 Maximum Sequence

    Maximum Sequence Time Limit: 4000/2000 MS (Java/Others)    Memory Limit: 32768/32768 K (Java/Others) ...

  8. Angularjs+Bootstrap实现分页指令

    本插件的开发目的主要给前端同学使用,本人是专注于后台开发的,对css样式不熟悉,但逼于前端要求做一个共公组件方便日常开发,所以这个插件在样式上可能不适合大部分人,喜欢的拿走吧,不喜欢的也请别喷.  一 ...

  9. 网上订餐系统的SQL SERVER 2005数据库连接

  10. 2019手机号码JS正则表达式

    前端的正则表达式验证往往是最繁多最复杂的,所以整理了一些最近自己常用的正则表达式,希望能对大家有所帮助! /* 合法uri */ export function validateURL(textval ...