hadoop支持命令行操作HDFS文件系统,并且支持shell-like命令与HDFS文件系统交互,对于大多数程序猿/媛来说,shell-like命令行操作都是比较熟悉的,其实这也是Hadoop的极大便利之一,至少对于想熟悉乃至尽快熟练操作HDFS的人来说。

由于平时在工作中经常用到Hadoop Shell命令来操作HDFS上的文件,有时候因为Hadoop Shell命令不熟悉,需要重新查找;或者需要某个命令的参数;再或者需要知晓相似命令的差异;于是便有了本文,对于Hadoop Shell命令的总结,方便自己以后得工作,也算是对类似工作的总结。

  1. hadoop fs FsShell
  2. Usage: java FsShell
  3. [-ls <path>]
  4. [-lsr <path>]
  5. [-df [<path>]]
  6. [-du <path>]
  7. [-dus <path>]
  8. [-count[-q] <path>]
  9. [-mv <src> <dst>]
  10. [-cp <src> <dst>]
  11. [-rm [-skipTrash] <path>]
  12. [-rmr [-skipTrash] <path>]
  13. [-expunge]
  14. [-put <localsrc> ... <dst>]
  15. [-copyFromLocal <localsrc> ... <dst>]
  16. [-moveFromLocal <localsrc> ... <dst>]
  17. [-get [-ignoreCrc] [-crc] <src> <localdst>]
  18. [-getmerge <src> <localdst> [addnl]]
  19. [-cat <src>]
  20. [-text <src>]
  21. [-copyToLocal [-ignoreCrc] [-crc] <src> <localdst>]
  22. [-moveToLocal [-crc] <src> <localdst>]
  23. [-mkdir <path>]
  24. [-setrep [-R] [-w] <rep> <path/file>]
  25. [-touchz <path>]
  26. [-test -[ezd] <path>]
  27. [-stat [format] <path>]
  28. [-snapshot <path>]
  29. [-tail [-f] <file>]
  30. [-chmod [-R] <MODE[,MODE]... | OCTALMODE> PATH...]
  31. [-chown [-R] [OWNER][:[GROUP]] PATH...]
  32. [-chgrp [-R] GROUP PATH...]
  33. [-help [cmd]]

下面详细解释一下命令的操作,这些命令和Unix下的命令差不多,有些看了就明白其含义了。

  1. hadoop fs -ls <path>

返回文件path的统计信息,信息包括:
permissions number_of_replicas userid groupid filesize modification_date modification_time filename

  1. hadoop fs -lsr <path>

这个是ls的recursive版本,类似于ls -R命令和ls的区别。

  1. hadoop fs -du URI

显示文件的大小。

  1. hadoop fs -dus URI

类似于du -s:显示文件及其子目录的总体大小。

  1. hadoop fs -df <path>

显示Hadoop所使用的文件系统的大小。

  1. hadoop fs -count [-q] <path>

显示path 下的目录数量,文件大小等信息。默认情况下显示一下信息:
DIR_COUNT, FILE_COUNT, CONTENT_SIZE FILE_NAME

添加-q信息后,输出的信息更多:

QUOTA, REMAINING_QUATA, SPACE_QUOTA, REMAINING_SPACE_QUOTA, DIR_COUNT, FILE_COUNT, CONTENT_SIZE, FILE_NAME

  1. hadoop fs -mv <src> <dst>

从src移动到dst,允许多个源移动到同一个dst,dst必须是目录。

  1. hadoop fs -cp <src> ... <dst>

拷贝多个源到dst,限制是dst必须是目录。

  1. hadoop fs -rm [-skipTrash] <path>

删除文件,不能删除目录
-skipTrash:直接删除文件,不再往.Trash里面放。

  1. hadoop fs -rmr [-skipTrash] <path>

这个能够迭代删除目录及其下面的文件
-skipTrash:直接删除文件,不再往.Trash里面放。

  1. hadoop fs -expunge

清空Trash,Trash的概念详见http://hadoop.apache.org/docs/r1.0.4/hdfs_design.html,参考下Trash的含义

  1. When a file is deleted by a user or an application, it is not immediately removed from HDFS. Instead, HDFS first renames it to a file in the /trash directory. The file can be restored quickly as long as it remains in /trash. A file remains in /trash for a configurable amount of time. After the expiry of its life in /trash, the NameNode deletes the file from the HDFS namespace. The deletion of a file causes the blocks associated with the file to be freed. Note that there could be an appreciable time delay between the time a file is deleted by a user and the time of the corresponding increase in free space in HDFS.
  2.  
  3. A user can Undelete a file after deleting it as long as it remains in the /trash directory. If a user wants to undelete a file that he/she has deleted, he/she can navigate the /trash directory and retrieve the file. The /trash directory contains only the latest copy of the file that was deleted. The /trash directory is just like any other directory with one special feature: HDFS applies specified policies to automatically delete files from this directory. The current default policy is to delete files from /trash that are more than 6 hours old. In the future, this policy will be configurable through a well defined interface.

文件传输:

  1. hadoop fs -put <localsrc> ... <dst>

复制单个、或者多个本地FS的目录或者文件到目标文件系统。

  1. hadoop fs -copyFromLocal <localsrc> ... <dst>

和put命令类似,唯一的限制是src必须是本地的文件。

  1. hadoop fs -moveFromLocal <localsrc> ... <dst>

和put命令类似,这个命令会在localsrc执行完成后,删除本地的文件,注意是删除本地的文件。

  1. hadoop fs -get [-ignoreCrc] <localsrc> ... <dst>

拷贝FS上的src到本地的dst目录
-ignoreCrc:拷贝时忽略crc检验,如果想拷贝CRCs,需要添加-crc参数。

  1. hadoop fs -getmerge <src> <localdst> [addnl]

src是源目录,localdst是本地目标文件,将源目录的所有文件连接成本地目标文件。addnl是可选的,用于指定在每个文件结尾添加一个换行符。

  1. hadoop fs -cat <src>

将src的内容输出到stdout,和Unix下面的cat功能类似。

  1. hadoop fs -text <src>

把src文件按照text输出,zip或者TextRecordInputStream格式的也可以按照text输出。

  1. hadoop fs -copyToLocal [-ignoreCrc] [-crc] <src> <localdst>

和get命令类似,唯一的限制是dst必须是本地文件系统的文件。

  1. hadoop fs -moveToLocal [-crc] <src> <localdst>

输出:'-moveToLocal' is not implemented yet,还没有实现。

  1. hadoop fs -mkdir <path>

创建path文件夹,如果path的父目录不存在,会迭代创建,类似于mkdir -p命令。

  1. hadoop fs -setrep [-R] <rep> <path/file>

修改HDFS文件或者目录的Replication数目,对于重要的文件,需要增加副本数目,确保不会丢失或者损坏。
-R参数表示迭代更新,目录下面的副本数目同时更新。

  1. hadoop fs -touchz <path>

创建一个大小为0的文件。

  1. hadoop fs -test -[ezd] <path>

测试文件的目录属性,-e:测试文件是否存在;-z:文件大小是否为0;-d:测试是否是目录。

  1. hadoop fs -stat [format] <path>

返回目录的统计信息。

  1. hadoop fs -tail [-f] <file>

显示文件的最后1kb信息,-f参数和Unix下面的参数一样。

  1. hadoop fs -chmod [-R] <MODE[,MODE]... | OCTALMODE> PATH...
  2. hadoop fs -chown [-R] [OWNER][:[GROUP]] PATH...
  3. hadoop fs -chgrp [-R] GROUP PATH...

这三个是权限操作命令,和Unix命令下的功能类似。

Hadoop Shell命令还是比较简单的,只是其中的差别必须等到用的时候才能体会,本文只是做个备忘,将工作中常用的命令整理下。

转自:http://isilic.iteye.com/blog/1770036

Hadoop Shell命令大全的更多相关文章

  1. redis shell命令大全

    redis shell命令大全(转自http://blog.mkfree.com/posts/5105432f975ad0eb7d135964) 作者:oyhk   2013-1-28 3:11:35 ...

  2. Windows常用shell命令大全

    Windows常用shell命令大全 基于鼠标操作的后果就是OS界面外观发生改变, 就得多花学习成本.更主要的是基于界面引导Path与命令行直达速度是难以比拟的.另外Geek很大一部分是键盘控,而非鼠 ...

  3. Windows常用shell命令大全(转)

    [Windows常用shell命令大全] 基于鼠标操作的后果就是OS界面外观发生改变, 就得多花学习成本.更主要的是基于界面引导Path与命令行直达速度是难以比拟的.另外Geek很大一部分是键盘控,而 ...

  4. tasker支持的shell 命令大全

    参考 http://www.notenoughtech.com/tasker/tasker-run-shell-commands/   罗列所有系统配置项 settings list system s ...

  5. Hadoop Shell命令字典(可收藏)

    可以带着下面问题来阅读: 1.chmod与chown的区别是什麽?2.cat将路径指定文件的内容输出到哪里?3.cp能否是不同之间复制?4.hdfs如何查看文件大小?5.hdfs如何合并文件?6.如何 ...

  6. Android系统在超级终端下必会的命令大全(adb shell命令大全)

    . 显示系统中全部Android平台: android list targets . 显示系统中全部AVD(模拟器): android list avd . 创建AVD(模拟器): android c ...

  7. Hadoop Shell命令(基于linux操作系统上传下载文件到hdfs文件系统基本命令学习)

    Apache-->hadoop的官网文档命令学习:http://hadoop.apache.org/docs/r1.0.4/cn/hdfs_shell.html FS Shell 调用文件系统( ...

  8. Hadoop shell命令

    1.FS Shell 调用文件系统(FS)shell命令应使用bin/hadoop fs <args>的形式.所有的的FS shell命令使用URI路径作为参数.URI格式是scheme: ...

  9. hadoop Shell命令详解

    调用文件系统(FS)Shell命令应使用bin/hadoop fs <args>的形式.所有的的FS shell命令使用URI路径作为参数.URI路径详解点击这里. 1.cat说明:将路径 ...

随机推荐

  1. Git 子模块 - submodule

    有种情况我们经常会遇到:某个工作中的项目需要包含并使用另一个项目. 也许是第三方库,或者你 独立开发的,用于多个父项目的库. 现在问题来了:你想要把它们当做两个独立的项目,同时又想在 一个项目中使用另 ...

  2. 移动端之Android开发的几种方式的初步体验

    目前越来越多的移动端混合开发方式,下面列举的大多数我都略微的尝试过,就初步的认识写个简单的心得: 开发方式 开发环境 是否需要AndroidSDK 支持跨平台 开发语言&技能 MUI Win+ ...

  3. SQL Server镜像自动生成脚本

    SQL Server镜像自动生成脚本 镜像的搭建非常繁琐,花了一点时间写了这个脚本,方便大家搭建镜像 执行完这个镜像脚本之后,最好在每台机器都绑定一下hosts文件,不然的话,镜像可能会不work 1 ...

  4. DB1:数据库的创建和文件的修改

    在SQL Server中,使用Create Database创建数据库,使用Alter Database命令,能够修改数据库的数据文件和日志文件. 一,创建数据库 1,在创建数据库时,最佳实践是: 创 ...

  5. 11、Struts2 的文件上传和下载

    文件上传 表单准备 要想使用 HTML 表单上传一个或多个文件 须把 HTML 表单的 enctype 属性设置为 multipart/form-data 须把 HTML 表单的method 属性设置 ...

  6. 基于AOP的MVC拦截异常让代码更优美

    与asp.net 打交道很多年,如今天微软的优秀框架越来越多,其中微软在基于mvc的思想架构,也推出了自己的一套asp.net mvc 框架,如果你亲身体验过它,会情不自禁的说‘漂亮’.回过头来,‘漂 ...

  7. Linux之搭建自己的根文件系统

    Hi!大家好,我是CrazyCatJack.又和大家见面了.今天给大家带来的是构建Linux下的根文件系统.希望大家看过之后都能构建出符合自己需求的根文件系统^_^ 1.内容概述 1.构造过程 今天给 ...

  8. CSS——关于z-index及层叠上下文(stacking context)

    以下内容根据CSS规范翻译. z-index 'z-index'Value: auto | <integer> | inheritInitial: autoApplies to: posi ...

  9. BPM流程中心解决方案分享

    一.需求分析 在过去办公自动化的浪潮中,很多企业已经实施了OA流程,但随着客户的发展和对流程管理的越来越重视, 客户对流程应用需求越来越深 入,您可能面临以下需求: 1.流程功能不能满足需求,包括流程 ...

  10. Oracle-BPM安装详解

    H3 BPM安装包括两个部分,基础工作包括安装IIS..net Freamwork基础框架.安装完成之后,主要配置安装包括数据库,H3 BPM 程序.下面详细介绍Oracle与H3 BPM对接安装的整 ...