hadoop2.5.2学习及实践笔记(五)—— HDFS shell命令行常见操作
附:HDFS shell guide文档地址
http://hadoop.apache.org/docs/r2.5.2/hadoop-project-dist/hadoop-common/FileSystemShell.html
启动HDFS后,输入hadoop fs命令,即可显示HDFS常用命令的用法
[hadoop@localhost hadoop-2.5.]$ hadoop fs
Usage: hadoop fs [generic options]
[-appendToFile <localsrc> ... <dst>]
[-cat [-ignoreCrc] <src> ...]
[-checksum <src> ...]
[-chgrp [-R] GROUP PATH...]
[-chmod [-R] <MODE[,MODE]... | OCTALMODE> PATH...]
[-chown [-R] [OWNER][:[GROUP]] PATH...]
[-copyFromLocal [-f] [-p] <localsrc> ... <dst>]
[-copyToLocal [-p] [-ignoreCrc] [-crc] <src> ... <localdst>]
[-count [-q] <path> ...]
[-cp [-f] [-p | -p[topax]] <src> ... <dst>]
[-createSnapshot <snapshotDir> [<snapshotName>]]
[-deleteSnapshot <snapshotDir> <snapshotName>]
[-df [-h] [<path> ...]]
[-du [-s] [-h] <path> ...]
[-expunge]
[-get [-p] [-ignoreCrc] [-crc] <src> ... <localdst>]
[-getfacl [-R] <path>]
[-getfattr [-R] {-n name | -d} [-e en] <path>]
[-getmerge [-nl] <src> <localdst>]
[-help [cmd ...]]
[-ls [-d] [-h] [-R] [<path> ...]]
[-mkdir [-p] <path> ...]
[-moveFromLocal <localsrc> ... <dst>]
[-moveToLocal <src> <localdst>]
[-mv <src> ... <dst>]
[-put [-f] [-p] <localsrc> ... <dst>]
[-renameSnapshot <snapshotDir> <oldName> <newName>]
[-rm [-f] [-r|-R] [-skipTrash] <src> ...]
[-rmdir [--ignore-fail-on-non-empty] <dir> ...]
[-setfacl [-R] [{-b|-k} {-m|-x <acl_spec>} <path>]|[--set <acl_spec> <path>]]
[-setfattr {-n name [-v value] | -x name} <path>]
[-setrep [-R] [-w] <rep> <path> ...]
[-stat [format] <path> ...]
[-tail [-f] <file>]
[-test -[defsz] <path>]
[-text [-ignoreCrc] <src> ...]
[-touchz <path> ...]
[-usage [cmd ...]] Generic options supported are
-conf <configuration file> specify an application configuration file
-D <property=value> use value for given property
-fs <local|namenode:port> specify a namenode
-jt <local|jobtracker:port> specify a job tracker
-files <comma separated list of files> specify comma separated files to be copied to the map reduce cluster
-libjars <comma separated list of jars> specify comma separated jar files to include in the classpath.
-archives <comma separated list of archives> specify comma separated archives to be unarchived on the compute machines. The general command line syntax is
bin/hadoop command [genericOptions] [commandOptions]
>帮助相关命令
- usage
查看命令的用法,例查看ls的用法
[hadoop@localhost hadoop-2.5.]$ hadoop fs -usage ls
Usage: hadoop fs [generic options] -ls [-d] [-h] [-R] [<path> ...]
- help
查看命令的详细帮助,例查看ls命令的帮助:
[hadoop@localhost hadoop-2.5.]$ hadoop fs -help ls
-ls [-d] [-h] [-R] [<path> ...] :
List the contents that match the specified file pattern. If path is not
specified, the contents of /user/<currentUser> will be listed. Directory entries
are of the form:
permissions - userId groupId sizeOfDirectory(in bytes)
modificationDate(yyyy-MM-dd HH:mm) directoryName and file entries are of the form:
permissions numberOfReplicas userId groupId sizeOfFile(in bytes)
modificationDate(yyyy-MM-dd HH:mm) fileName -d Directories are listed as plain files.
-h Formats the sizes of files in a human-readable fashion rather than a number
of bytes.
-R Recursively list the contents of directories.
>查看相关命令
- ls
查看文件或目录,下例中:hdfs://localhost:9000是fs.defaultFS配置的值,hdfs://localhost:9000/即表示HDFS文件系统中根目录,如果使用的是HDFS文件系统, 可以简写为/。
[hadoop@localhost hadoop-2.5.]$ hadoop fs -ls hdfs://localhost:9000/
Found items
drwxr-xr-x - hadoop supergroup -- : hdfs://localhost:9000/input
-rw-r--r-- hadoop supergroup -- : hdfs://localhost:9000/input1.txt
drwxr-xr-x - hadoop supergroup -- : hdfs://localhost:9000/output [hadoop@localhost hadoop-2.5.]$ hadoop fs -ls /
Found items
drwxr-xr-x - hadoop supergroup -- : /input
-rw-r--r-- hadoop supergroup -- : /input1.txt
drwxr-xr-x - hadoop supergroup -- : /output
选项-R:连同子目录的文件一起列出,例:
[hadoop@localhost hadoop-2.5.]$ hadoop fs -ls -R /
drwxr-xr-x - hadoop supergroup -- : /input
-rw-r--r-- 1 hadoop supergroup 14 2015-03-27 19:19 /input/input1.txt --子目录下的文件也被列出
-rw-r--r-- 1 hadoop supergroup 32 2015-03-27 19:19 /input/input2.txt
-rw-r--r-- hadoop supergroup -- : /input1.txt
drwxr-xr-x - hadoop supergroup -- : /output
- cat
显示文件内容
[hadoop@localhost hadoop-2.5.]$ hadoop fs -cat /input1.txt
hello hadoop!
hello hadoop!
- text
将给定的文件以文本的格式输出,允许的格式zip、TextRecordInputStream、Avro。当文件为文本文件时,等同于cat。例:
[hadoop@localhost hadoop-2.5.]$ hadoop fs -text /input1.txt
hello hadoop!
- tail
显示文件最后1KB的内容
选项-f:当文件内容增加时显示追加的内容
- checksum
显示文件的校验和信息。因为需要和存储文件每个块的datanode互相通信,因此对大量的文件使用此命令效率可能会低
[hadoop@localhost hadoop-2.5.]$ hadoop fs -checksum /input.zip
/input.zip MD5-of-0MD5-of-0CRC32 00000000000000000000000070bc8f4b72a86921468bf8e8441dce51
>文件及目录相关命令
- touchz
创建一个空文件,如果存在指定名称的非空文件,则返回错误
[hadoop@localhost hadoop-2.5.]$ hadoop fs -ls /
Found items
drwxr-xr-x - hadoop supergroup -- : /input
-rw-r--r-- hadoop supergroup -- : /input1.zip
drwxr-xr-x - hadoop supergroup -- : /output
[hadoop@localhost hadoop-2.5.]$ hadoop fs -touchz /input1.zip
touchz: `/input1.zip': Not a zero-length file --非空时给出错误提示
[hadoop@localhost hadoop-2.5.]$ hadoop fs -touchz /input.zip
[hadoop@localhost hadoop-2.5.]$ hadoop fs -ls /
Found items
drwxr-xr-x - hadoop supergroup -- : /input
-rw-r--r-- 1 hadoop supergroup 0 2015-04-02 08:43 /input.zip --创建成功
-rw-r--r-- hadoop supergroup -- : /input1.zip
drwxr-xr-x - hadoop supergroup -- : /output
- appendToFile
向现有文件中追加内容,例:
[hadoop@localhost hadoop-2.5.]$ hadoop fs -text /input1.txt
hello hadoop!
[hadoop@localhost hadoop-2.5.]$ hadoop fs -appendToFile ~/Desktop/input1.txt /input1.txt
[hadoop@localhost hadoop-2.5.2]$ hadoop fs -text /input1.txt
hello hadoop!
hello hadoop! --查看追加后的文件内容
- put
从本地文件系统上传文件到HDFS
[hadoop@localhost hadoop-2.5.]$ hadoop fs -put ~/Desktop/input1.txt /
[hadoop@localhost hadoop-2.5.]$ hadoop fs -text /input1.txt --查看上传后的文件内容
hello hadoop!
选项-f:如果文件已经存在,覆盖已有文件
[hadoop@localhost hadoop-2.5.]$ hadoop fs -put ~/Desktop/input1.txt /
put: `/input1.txt': File exists --文件已存在时给出错误提示
[hadoop@localhost hadoop-2.5.]$ hadoop fs -put -f ~/Desktop/input1.txt /
[hadoop@localhost hadoop-2.5.2]$ --使用-f选项后没有再报错
选项-p:保留原文件的访问、修改时间,用户和组,权限属性
[hadoop@localhost hadoop-2.5.]$ ll ~/input1.txt
-rw-r--r--. 1 hadoop hadoops 28 Mar 31 08:59 /home/hadoop/input1.txt --本地文件属性
[hadoop@localhost hadoop-2.5.2]$ chmod 777 ~/input1.txt --修改权限为rwxrwxrwx
[hadoop@localhost hadoop-2.5.]$ hadoop fs -put ~/input1.txt /
[hadoop@localhost hadoop-2.5.]$ hadoop fs -ls /input1.txt
-rw-r--r-- 1 hadoop supergroup 28 2015-04-02 05:19 /input1.txt --不使用-p选项,上传后文件属性
[hadoop@localhost hadoop-2.5.]$ hadoop fs -put -f -p ~/input1.txt /
[hadoop@localhost hadoop-2.5.]$ hadoop fs -ls /input1.txt
-rwxrwxrwx 1 hadoop hadoops 28 2015-03-31 08:59 /input1.txt --使用-p选项,上传后文件属性
- get
从HDFS上下载文件到本地,与put不同,没有覆盖本地已有文件的选项
[hadoop@localhost hadoop-2.5.]$ hadoop fs -get /input1.txt ~
[hadoop@localhost hadoop-2.5.]$ cat ~/input1.txt --查看本地下载的文件
hello hadoop!
hellp hadoop!
- getmerge
将指定的HDFS中原目录下的文件合并成一个文件并下载到本地,源文件保留
[hadoop@localhost hadoop-2.5.]$ hadoop fs -text /input/input1.txt
hello hadoop! --input1.txt内容
[hadoop@localhost hadoop-2.5.]$ hadoop fs -text /input/input2.txt
welcome to the world of hadoop! --input2.txt内容
[hadoop@localhost hadoop-2.5.]$ hadoop fs -getmerge /input/ ~/merge.txt
[hadoop@localhost hadoop-2.5.]$ cat ~/merge.txt
hello hadoop! --合并后本地文件的内容
welcome to the world of hadoop!
选项-nl:在每个文件的最后增加一个新行
[hadoop@localhost hadoop-2.5.]$ hadoop fs -getmerge -nl /input/ ~/merge.txt
[hadoop@localhost hadoop-2.5.]$ cat ~/merge.txt
hello hadoop!
--input1.txt增加的新行
welcome to the world of hadoop!
--input2.txt增加的新行
[hadoop@localhost hadoop-2.5.]$
- copyFromLocal
从本地文件系统上传文件到HDFS,与put命令相同
- copyToLocal
从HDFS下载文件到本地文件系统,与get命令相同
- moveFromLocal
与put命令相同,只是上传成功后本地文件会被删除
- moveToLocal
该命令还未实现
- mv
同linux的mv命令,移动或重命名文件
[hadoop@localhost hadoop-2.5.]$ hadoop fs -ls /
Found items
drwxr-xr-x - hadoop supergroup -- : /input
-rw-r--r-- 1 hadoop supergroup 184 2015-03-31 08:14 /input.zip
-rwxrwxrwx hadoop hadoops -- : /input1.txt
drwxr-xr-x - hadoop supergroup -- : /output
drwxr-xr-x - hadoop supergroup -- : /text
[hadoop@localhost hadoop-2.5.]$ hadoop fs -mv /input.zip /input1.zip
[hadoop@localhost hadoop-2.5.]$ hadoop fs -ls /
Found items
drwxr-xr-x - hadoop supergroup -- : /input
-rwxrwxrwx hadoop hadoops -- : /input1.txt
-rw-r--r-- 1 hadoop supergroup 184 2015-03-31 08:14 /input1.zip --重命名
drwxr-xr-x - hadoop supergroup -- : /output
drwxr-xr-x - hadoop supergroup -- : /text
[hadoop@localhost hadoop-2.5.]$ hadoop fs -mv /input1.zip /text/
[hadoop@localhost hadoop-2.5.]$ hadoop fs -ls -R /
drwxr-xr-x - hadoop supergroup -- : /input
-rw-r--r-- hadoop supergroup -- : /input/input1.txt
-rw-r--r-- hadoop supergroup -- : /input/input2.txt
-rwxrwxrwx hadoop hadoops -- : /input1.txt
drwxr-xr-x - hadoop supergroup -- : /output
drwxr-xr-x - hadoop supergroup -- : /text
-rw-r--r-- 1 hadoop supergroup 184 2015-03-31 08:14 /text/input1.zip --移动文件
- cp
复制文件
[hadoop@localhost hadoop-2.5.]$ hadoop fs -ls -R /
drwxr-xr-x - hadoop supergroup -- : /input
-rw-r--r-- hadoop supergroup -- : /input/input1.txt
-rw-r--r-- hadoop supergroup -- : /input/input2.txt
-rwxrwxrwx hadoop hadoops -- : /input1.txt
-rw-r--r-- hadoop supergroup -- : /input1.zip
drwxr-xr-x - hadoop supergroup -- : /output
drwxr-xr-x - hadoop supergroup -- : /text
[hadoop@localhost hadoop-2.5.]$ hadoop fs -cp /input1.txt /input.txt
[hadoop@localhost hadoop-2.5.]$ hadoop fs -ls -R /
drwxr-xr-x - hadoop supergroup -- : /input
-rw-r--r-- hadoop supergroup -- : /input/input1.txt
-rw-r--r-- hadoop supergroup -- : /input/input2.txt
-rw-r--r-- 1 hadoop supergroup 28 2015-04-02 07:31 /input.txt --新复制文件
-rwxrwxrwx hadoop hadoops -- : /input1.txt
-rw-r--r-- hadoop supergroup -- : /input1.zip
drwxr-xr-x - hadoop supergroup -- : /output
drwxr-xr-x - hadoop supergroup -- : /text
选项-f:如果文件已存在,覆盖已有文件
[hadoop@localhost hadoop-2.5.]$ hadoop fs -cp /input1.txt /input.txt
cp: `/input.txt': File exists --文件已存在时给出错误提示
[hadoop@localhost hadoop-2.5.]$ hadoop fs -cp -f /input1.txt /input.txt
[hadoop@localhost hadoop-2.5.]$
- mkdir
创建文件夹
[hadoop@localhost hadoop-2.5.]$ hadoop fs -mkdir /text
[hadoop@localhost hadoop-2.5.]$ hadoop fs -ls /
Found items
drwxr-xr-x - hadoop supergroup -- : /input
-rw-r--r-- hadoop supergroup -- : /input.zip
-rw-r--r-- hadoop supergroup -- : /input1.txt
drwxr-xr-x - hadoop supergroup -- : /output
drwxr-xr-x - hadoop supergroup -- : /text
选项-p:如果上层目录不存在,递归建立所需目录
[hadoop@localhost hadoop-2.5.]$ hadoop fs -mkdir /text1/text2
mkdir: `/text1/text2': No such file or directory --上层目录不存在,给出错误提示
[hadoop@localhost hadoop-2.5.]$ hadoop fs -mkdir -p /text1/text2
[hadoop@localhost hadoop-2.5.]$ hadoop fs -ls -R /
drwxr-xr-x - hadoop supergroup -- : /input
-rw-r--r-- hadoop supergroup -- : /input/input1.txt
-rw-r--r-- hadoop supergroup -- : /input/input2.txt
-rw-r--r-- hadoop supergroup -- : /input.zip
-rw-r--r-- hadoop supergroup -- : /input1.txt
drwxr-xr-x - hadoop supergroup -- : /output
drwxr-xr-x - hadoop supergroup -- : /text
drwxr-xr-x - hadoop supergroup -- : /text1
drwxr-xr-x - hadoop supergroup 0 2015-03-31 08:26 /text1/text2 --使用-p选项,创建成功
- rm
删除文件
[hadoop@localhost hadoop-2.5.]$ hadoop fs -rm /input.zip
// :: INFO fs.TrashPolicyDefault: Namenode trash configuration: Deletion interval = minutes, Emptier interval = minutes.
Deleted /input.zip
选项-r:递归的删除,可以删除非空目录
[hadoop@localhost hadoop-2.5.]$ hadoop fs -rm /text
rm: `/text': Is a directory --删除文件夹时,给出错误提示
[hadoop@localhost hadoop-2.5.2]$ hadoop fs -rm -r /text --使用-r选项,文件夹及文件夹下文件删除成功
// :: INFO fs.TrashPolicyDefault: Namenode trash configuration: Deletion interval = minutes, Emptier interval = minutes.
Deleted /text
- rmdir
删除空目录
[hadoop@localhost hadoop-2.5.]$ hadoop fs -ls -R /
drwxr-xr-x - hadoop supergroup -- : /input
-rw-r--r-- hadoop supergroup -- : /input/input1.txt
-rw-r--r-- hadoop supergroup -- : /input/input2.txt
-rw-r--r-- hadoop supergroup -- : /input1.zip
drwxr-xr-x - hadoop supergroup -- : /output
-rwxrwxrwx hadoop hadoops -- : /output/input1.txt
[hadoop@localhost hadoop-2.5.]$ hadoop fs -rmdir /output
rmdir: `/output': Directory is not empty --不能删除非空目录
选项--ignore-fail-on-non-empty:忽略非空删除失败时的提示
[hadoop@localhost hadoop-2.5.]$ hadoop fs -rmdir --ignore-fail-on-non-empty /output
[hadoop@localhost hadoop-2.5.]$ hadoop fs -ls -R /
drwxr-xr-x - hadoop supergroup -- : /input
-rw-r--r-- hadoop supergroup -- : /input/input1.txt
-rw-r--r-- hadoop supergroup -- : /input/input2.txt
-rw-r--r-- hadoop supergroup -- : /input1.zip
drwxr-xr-x - hadoop supergroup 0 2015-04-02 08:34 /output --不给出错误提示,但文件未删除
-rwxrwxrwx 1 hadoop hadoops 28 2015-03-31 08:59 /output/input1.txt
- setrep
改变一个文件的副本数
[hadoop@localhost hadoop-2.5.]$ hadoop fs -stat %r /input.zip
--原副本数
[hadoop@localhost hadoop-2.5.]$ hadoop fs -setrep /input.zip
Replication set: /input.zip
[hadoop@localhost hadoop-2.5.]$ hadoop fs -stat %r /input.zip
--改变后副本数
选项-w:命令等待副本数调整完成
[hadoop@localhost hadoop-2.5.]$ hadoop fs -setrep -w /input.zip
Replication set: /input.zip
Waiting for /input.zip ... done
[hadoop@localhost hadoop-2.5.]$ hadoop fs -stat %r /input.zip
- expunge
清空回收站
[hadoop@localhost hadoop-2.5.]$ hadoop fs -expunge
// :: INFO fs.TrashPolicyDefault: Namenode trash configuration: Deletion interval = minutes, Emptier interval = minutes.
- chgrp
修改文件用户组
[hadoop@localhost hadoop-2.5.]$ hadoop fs -ls -R /
drwxr-xr-x - hadoop supergroup -- : /input
-rw-r--r-- hadoop supergroup -- : /input/input1.txt
-rw-r--r-- hadoop supergroup -- : /input/input2.txt
-rw-r--r-- hadoop supergroup -- : /input.zip
-rw-r--r-- hadoop supergroup -- : /input1.zip
drwxr-xr-x - hadoop supergroup 0 2015-04-02 08:34 /output --文件原用户组
-rwxrwxrwx 1 hadoop hadoops 28 2015-03-31 08:59 /output/input1.txt
[hadoop@localhost hadoop-2.5.]$ hadoop fs -chgrp test /output
[hadoop@localhost hadoop-2.5.]$ hadoop fs -ls -R /
drwxr-xr-x - hadoop supergroup -- : /input
-rw-r--r-- hadoop supergroup -- : /input/input1.txt
-rw-r--r-- hadoop supergroup -- : /input/input2.txt
-rw-r--r-- hadoop supergroup -- : /input.zip
-rw-r--r-- hadoop supergroup -- : /input1.zip
drwxr-xr-x - hadoop test 0 2015-04-02 08:34 /output --修改后的用户组(未建立test组,仍可成功)
-rwxrwxrwx 1 hadoop hadoops 28 2015-03-31 08:59 /output/input1.txt --目录下文件的用户组未修改
选项-R:递归修,如果是目录,则递归的修改其下的文件及目录
[hadoop@localhost hadoop-2.5.]$ hadoop fs -chgrp -R testgrp /output
[hadoop@localhost hadoop-2.5.]$ hadoop fs -ls -R /
drwxr-xr-x - hadoop supergroup -- : /input
-rw-r--r-- hadoop supergroup -- : /input/input1.txt
-rw-r--r-- hadoop supergroup -- : /input/input2.txt
-rw-r--r-- hadoop supergroup -- : /input.zip
-rw-r--r-- hadoop supergroup -- : /input1.zip
drwxr-xr-x - hadoop testgrp 0 2015-04-02 08:34 /output --目录及其下文件都被更改
-rwxrwxrwx 1 hadoop testgrp 28 2015-03-31 08:59 /output/input1.txt
- chmod
修改文件权限,权限模式同linux shell命令中的模式
[hadoop@localhost hadoop-2.5.]$ hadoop fs -ls -R /
drwxr-xr-x - hadoop supergroup -- : /input
-rw-r--r-- hadoop supergroup -- : /input/input1.txt
-rw-r--r-- hadoop supergroup -- : /input/input2.txt
-rw-r--r-- hadoop supergroup -- : /input.zip
-rw-r--r-- hadoop supergroup -- : /input1.zip
drwxr-xr-x - hadoop supergroup 0 2015-04-02 08:34 /output --文件原权限
-rwxrwxrwx 1 hadoop supergroup 28 2015-03-31 08:59 /output/input1.txt
[hadoop@localhost hadoop-2.5.]$ hadoop fs -chmod /output
[hadoop@localhost hadoop-2.5.]$ hadoop fs -ls -R /
drwxr-xr-x - hadoop supergroup -- : /input
-rw-r--r-- hadoop supergroup -- : /input/input1.txt
-rw-r--r-- hadoop supergroup -- : /input/input2.txt
-rw-r--r-- hadoop supergroup -- : /input.zip
-rw-r--r-- hadoop supergroup -- : /input1.zip
drwxr-xr-- - hadoop supergroup 0 2015-04-02 08:34 /output --修改后的权限
-rwxrwxrwx 1 hadoop supergroup 28 2015-03-31 08:59 /output/input1.txt --目录下文件的权限未修改
[hadoop@localhost hadoop-2.5.]$ hadoop fs -chmod -R /output
[hadoop@localhost hadoop-2.5.]$ hadoop fs -ls -R /
drwxr-xr-x - hadoop supergroup -- : /input
-rw-r--r-- hadoop supergroup -- : /input/input1.txt
-rw-r--r-- hadoop supergroup -- : /input/input2.txt
-rw-r--r-- hadoop supergroup -- : /input.zip
-rw-r--r-- hadoop supergroup -- : /input1.zip
drwxrwxr-x - hadoop supergroup 0 2015-04-02 08:34 /output --目录及其下文件都被更改
-rwxrwxr-x 1 hadoop supergroup 28 2015-03-31 08:59 /output/input1.txt
- chown
修改文件的用户或组
[hadoop@localhost hadoop-2.5.]$ hadoop fs -ls -R /
drwxr-xr-x - hadoop supergroup -- : /input
-rw-r--r-- hadoop supergroup -- : /input/input1.txt
-rw-r--r-- hadoop supergroup -- : /input/input2.txt
-rw-r--r-- hadoop supergroup -- : /input.zip
-rw-r--r-- hadoop supergroup -- : /input1.zip
drwxrwxr-x - hadoop supergroup 0 2015-04-02 08:34 /output --文件原用户和组
-rwxrwxr-x 1 hadoop supergroup 28 2015-03-31 08:59 /output/input1.txt
[hadoop@localhost hadoop-2.5.]$ hadoop fs -chown test /output
[hadoop@localhost hadoop-2.5.]$ hadoop fs -ls -R /
drwxr-xr-x - hadoop supergroup -- : /input
-rw-r--r-- hadoop supergroup -- : /input/input1.txt
-rw-r--r-- hadoop supergroup -- : /input/input2.txt
-rw-r--r-- hadoop supergroup -- : /input.zip
-rw-r--r-- hadoop supergroup -- : /input1.zip
drwxrwxr-x - test supergroup 0 2015-04-02 08:34 /output --修改后的用户(未建立test用户,仍可成功)
-rwxrwxr-x 1 hadoop supergroup 28 2015-03-31 08:59 /output/input1.txt --目录下文件的用户未修改
选项-R:递归修改,如果是目录,则递归的修改其下的文件及目录
[hadoop@localhost hadoop-2.5.]$ hadoop fs -chown -R testown:testgrp /output
[hadoop@localhost hadoop-2.5.]$ hadoop fs -ls -R /
drwxr-xr-x - hadoop supergroup -- : /input
-rw-r--r-- hadoop supergroup -- : /input/input1.txt
-rw-r--r-- hadoop supergroup -- : /input/input2.txt
-rw-r--r-- hadoop supergroup -- : /input.zip
-rw-r--r-- hadoop supergroup -- : /input1.zip
drwxrwxr-x - testown testgrp 0 2015-04-02 08:34 /output --目录及其下文件都被更改
-rwxrwxr-x 1 testown testgrp 28 2015-03-31 08:59 /output/input1.txt
- getfacl
显示访问控制列表ACLs(Access Control Lists)
[hadoop@localhost bin]$ hadoop fs -getfacl /input.zip
# file: /input.zip
# owner: hadoop
# group: supergroup
user::rw-
group::r--
other::r--
选项-R:递归显示
[hadoop@localhost bin]$ hadoop fs -getfacl -R /input
# file: /input
# owner: hadoop
# group: supergroup
user::rwx
group::r-x
other::r-x # file: /input/input1.txt
# owner: hadoop
# group: supergroup
user::rw-
group::r--
other::r-- # file: /input/input2.txt
# owner: hadoop
# group: supergroup
user::rw-
group::r--
other::r--
- setfacl
设置访问控制列表,acls默认未开启,直接使用该命令会报错
[hadoop@localhost bin]$ hadoop fs -setfacl -b /output/input1.txt
setfacl: The ACL operation has been rejected. Support for ACLs has been disabled by setting dfs.namenode.acls.enabled to false.
开启acls,配置hdfs-site.xml
[hadoop@localhost hadoop-2.5.]$ vi etc/hadoop/hdfs-site.xml
<property>
<name>dfs.namenode.acls.enabled</name>
<value>true</value>
</property>
选项-m:修改acls
[hadoop@localhost hadoop-2.5.]$ hadoop fs -getfacl /output/input1.txt
# file: /output/input1.txt
# owner: testown
# group: testgrp
user::rwx
group::rwx
other::r-x
[hadoop@localhost hadoop-2.5.]$ hadoop fs -setfacl -m user::rw-,user:hadoop:rw-,group::r--,other::r-- /output/input1.txt
[hadoop@localhost hadoop-2.5.]$ hadoop fs -getfacl /output/input1.txt
# file: /output/input1.txt
# owner: testown
# group: testgrp
user::rw-
user:hadoop:rw-
group::r--
mask::rw-
other::r--
选项-x:删除指定规则
[hadoop@localhost hadoop-2.5.]$ hadoop fs -setfacl -m user::rw-,user:hadoop:rw-,group::r--,other::r-- /output/input1.txt
[hadoop@localhost hadoop-2.5.]$ hadoop fs -getfacl /output/input1.txt
# file: /output/input1.txt
# owner: testown
# group: testgrp
user::rw-
user:hadoop:rw-
group::r--
mask::rw-
other::r--
[hadoop@localhost hadoop-2.5.]$ hadoop fs -setfacl -x user:hadoop /output/input1.txt
[hadoop@localhost hadoop-2.5.]$ hadoop fs -getfacl /output/input1.txt
# file: /output/input1.txt
# owner: testown
# group: testgrp
user::rw-
group::r--
mask::r--
other::r--
以下选项未做实验
选项-b:基本的acl规则(所有者,群组,其他)被保留,其他规则全部删除.
选项-k:删除缺省规则
- setfattr
设置扩展属性的名称和值
选项-n:属性名称 选项-v:属性值
[hadoop@localhost hadoop-2.5.]$ hadoop fs -getfattr -d /input.zip
# file: /input.zip
[hadoop@localhost hadoop-2.5.]$ hadoop fs -setfattr -n user.web -v www.baidu.com /input.zip
[hadoop@localhost hadoop-2.5.]$ hadoop fs -getfattr -d /input.zip
# file: /input.zip
user.web="www.baidu.com"
选项-x:删除扩展属性
[hadoop@localhost hadoop-2.5.]$ hadoop fs -getfattr -d /input.zip
# file: /input.zip
user.web="www.baidu.com"
[hadoop@localhost hadoop-2.5.]$ hadoop fs -setfattr -x user.web /input.zip
[hadoop@localhost hadoop-2.5.]$ hadoop fs -getfattr -d /input.zip
# file: /input.zip
- getfattr
显示扩展属性的名称和值
[hadoop@localhost hadoop-2.5.]$ hadoop fs -getfattr -d /input.zip
# file: /input.zip
user.web="www.baidu.com"
user.web2="www.google.com"
选项-n:显示指定名称的属性值
[hadoop@localhost hadoop-2.5.]$ hadoop fs -getfattr -n user.web /input.zip# file: /input.zip
user.web="www.baidu.com"
>统计相关命令
- count
显示指定文件或目录的:DIR_COUNT、FILE_COUNT、CONTENT_SIZE、 FILE_NAME,分别表示:子目录个数(如果指定路径是目录,则包含该目录本身)、文件个数、使用字节个数,以及文件或目录名。
[hadoop@localhost hadoop-2.5.]$ hadoop fs -ls -R /
drwxr-xr-x - hadoop supergroup -- : /input
-rw-r--r-- hadoop supergroup -- : /input/input1.txt
-rw-r--r-- hadoop supergroup -- : /input/input2.txt
-rw-r--r-- hadoop supergroup -- : /input.txt
-rwxrwxrwx hadoop hadoops -- : /input1.txt
-rw-r--r-- hadoop supergroup -- : /input1.zip
drwxr-xr-x - hadoop supergroup -- : /output
drwxr-xr-x - hadoop supergroup -- : /text
[hadoop@localhost hadoop-2.5.]$ hadoop fs -count /
/
选项-q:显示配额信息(在多人共用的情况下,可以通过限制用户写入目录,并设置目录的quota ,防止不小心就把所有的空间用完造成别人无法存取的情况)。配额信息包括:QUOTA、REMAINING_QUOTA、SPACE_QUOTA、REMAINING_SPACE_QUOTA,分别表示某个目录下档案及目录的总数、剩余目录或文档数量、目录下空间的大小、目录下剩余空间。
计算公式:
QUOTA – (DIR_COUNT + FILE_COUNT) = REMAINING_QUOTA;
SPACE_QUOTA – CONTENT_SIZE = REMAINING_SPACE_QUOTA。
none和inf表示未配置。
[hadoop@localhost hadoop-2.5.]$ hadoop fs -count -q /
none inf /
- du
显示文件大小,如果指定目录,会显示该目录中每个文件的大小
[hadoop@localhost hadoop-2.5.]$ hadoop fs -ls -R /
drwxr-xr-x - hadoop supergroup -- : /input
-rw-r--r-- hadoop supergroup -- : /input/input1.txt
-rw-r--r-- hadoop supergroup -- : /input/input2.txt
-rw-r--r-- hadoop supergroup -- : /input.txt
-rwxrwxrwx hadoop hadoops -- : /input1.txt
-rw-r--r-- hadoop supergroup -- : /input1.zip
drwxr-xr-x - hadoop supergroup -- : /output
drwxr-xr-x - hadoop supergroup -- : /text
[hadoop@localhost hadoop-2.5.]$ hadoop fs -du /
/input
/input.txt
/input1.txt
/input1.zip
/output
/text
选项-s:显示总的统计信息,而不是显示每个文件的信息
[hadoop@localhost hadoop-2.5.]$ hadoop fs -du -s /
/
- df
检查文件系统的磁盘空间占用情况
[hadoop@localhost hadoop-2.5.]$ hadoop fs -df /
Filesystem Size Used Available Use%
hdfs://localhost:9000 18713219072 73728 8864460800 0%
- stat
显示文件统计信息。
格式: %b - 文件所占的块数; %g - 文件所属的用户组 ;%n - 文件名; %o - 文件块大小;%r - 备份数 ;%u - 文件所属用户;%y - 文件修改时间
[hadoop@localhost hadoop-2.5.]$ hadoop fs -stat %b,%g,%n,%o,%r,%u,%y /input.zip
,supergroup,input.zip,,,hadoop,-- ::
>快照命令
- createSnapshot
创建快照,
附:官方文档 http://hadoop.apache.org/docs/r2.5.2/hadoop-project-dist/hadoop-hdfs/HdfsSnapshots.html
snapshot(快照)是一个全部文件系统、或者某个目录在某一时刻的镜像。创建动作仅仅是在目录对应的Inode上加个快照的标签,不会涉及到数据块的拷贝操作,也不会对读写性能有影响,但是会占用namenode一定的额外内存来存放快照中被修改的文件和目录的元信息
[hadoop@localhost hadoop-2.5.]$ hadoop fs -ls -R /output
-rwxrwxr-x testown testgrp -- : /output/input1.txt
[hadoop@localhost hadoop-2.5.]$ hadoop fs -createSnapshot /output s1
createSnapshot: Directory is not a snapshottable directory: /output --直接创建给出错误
[hadoop@localhost hadoop-2.5.]$ hdfs dfsadmin -allowSnapshot /output --对开启某一目录的快照功能
Allowing snaphot on /output succeeded
[hadoop@localhost hadoop-2.5.]$ hadoop fs -createSnapshot /output s1 --创建快照
Created snapshot /output/.snapshot/s1
[hadoop@localhost hadoop-2.5.]$ hadoop fs -ls -R /output
-rwxrwxr-x testown testgrp -- : /output/input1.txt
[hadoop@localhost hadoop-2.5.]$ hadoop fs -ls /output/.snapshot/s1
Found items
-rwxrwxr-x testown testgrp -- : /output/.snapshot/s1/input1.txt --查看快照
- renameSnapshot
重命名快照
[hadoop@localhost hadoop-2.5.]$ hadoop fs -ls /output/.snapshot/s1Found items
-rwxrwxr-x 1 testown testgrp 28 2015-03-31 08:59 /output/.snapshot/s1/input1.txt --原快照
[hadoop@localhost hadoop-2.5.]$ hadoop fs -renameSnapshot /output/ s1 s2[hadoop@localhost hadoop-2.5.]$ hadoop fs -ls /output/.snapshot/s2
Found items
-rwxrwxr-x 1 testown testgrp 28 2015-03-31 08:59 /output/.snapshot/s2/input1.txt --新快照
- deleteSnapshot
删除快照
[hadoop@localhost hadoop-2.5.]$ hadoop fs -ls /output/.snapshot/s2
Found items
-rwxrwxr-x testown testgrp -- : /output/.snapshot/s2/input1.txt
[hadoop@localhost hadoop-2.5.]$ hadoop fs -deleteSnapshot /output/ s2
[hadoop@localhost hadoop-2.5.]$ hadoop fs -ls /output/.snapshot/s2
ls: `/output/.snapshot/s2': No such file or directory
hadoop2.5.2学习及实践笔记(五)—— HDFS shell命令行常见操作的更多相关文章
- hadoop2.5.2学习及实践笔记(二)—— 编译源代码及导入源码至eclipse
生产环境中hadoop一般会选择64位版本,官方下载的hadoop安装包中的native库是32位的,因此运行64位版本时,需要自己编译64位的native库,并替换掉自带native库. 源码包下的 ...
- hadoop2.5.2学习及实践笔记(四)—— namenode启动过程源码概览
对namenode启动时的相关操作及相关类有一个大体了解,后续深入研究时,再对本文进行补充 >实现类 HDFS启动脚本为$HADOOP_HOME/sbin/start-dfs.sh,查看star ...
- hadoop2.5.2学习及实践笔记(六)—— Hadoop文件系统及其java接口
文件系统概述 org.apache.hadoop.fs.FileSystem是hadoop的抽象文件系统,为不同的数据访问提供了统一的接口,并提供了大量具体文件系统的实现,满足hadoop上各种数据访 ...
- hadoop2.5.2学习及实践笔记(三)—— HDFS概念及体系结构
注:文中涉及的文件路径或配置文件中属性名称是针对hadoop2.X系列,相对于之前版本,可能有改动. 附: HDFS用户指南官方介绍: http://hadoop.apache.org/docs/r2 ...
- hadoop2.5.2学习及实践笔记(一)—— 伪分布式学习环境搭建
软件 工具:vmware 10 系统:centOS 6.5 64位 Apache Hadoop: 2.5.2 64位 Jdk: 1.7.0_75 64位 安装规划 /opt/softwares ...
- Pytest 学习(二十五)- allure 命令行参数【转】
先看看 allure 命令的帮助文档 cmd 敲 allure -h allure 命令的语法格式 allure [options] [command] [command options] optio ...
- Hadoop学习记录(2)|HDFS shell命令|体系结构
HDFS的shell 调用文件系统(FS)shell命令使用hadoop fs的形式 所有的FS shell命令使用URI路径作为参数. URI格式是scheme://authority/path.H ...
- hadoop 学习(三)之hdfs shell命令
1.HDFS shell 1.0查看帮助 hadoop fs -help <cmd> 1.1上传 hadoop fs -put <linux上文件> <hdfs上的路 ...
- 学习笔记:CentOS7学习之二十五:shell中色彩处理和awk使用技巧
目录 学习笔记:CentOS7学习之二十五:shell中色彩处理和awk使用技巧 25.1 Shell中的色彩处理 25.2 awk基本应用 25.2.1 概念 25.2.2实例演示 25.3 awk ...
随机推荐
- ThinkPHP5.1完全开发手册.CHM离线版下载
ThinkPHP5.1完全开发手册.CHM离线版下载 ThinkPHP5.1完全开发手册离线版.CHM下载地址 百度云:链接: https://pan.baidu.com/s/1b4jKJN-8UyI ...
- Quote Helper
using System; using Microsoft.Xrm.Sdk; using Microsoft.Crm.Sdk.Messages; using Microsoft.Xrm.Sdk.Que ...
- hadoop生态搭建(3节点)-08.kafka配置
如果之前没有安装jdk和zookeeper,安装了的请直接跳过 # https://www.oracle.com/technetwork/java/javase/downloads/java-arch ...
- Linux-3.5-Exynos4412驱动分层分离
linux-3.5/Documentation/driver-model/bus.txt 先写一个简单的例子,是为了给学习platform做准备. dev.h #ifndef JASON_DEV_H_ ...
- django配置虚拟环境-1
目录 安装python 使用venv虚拟环境 使用Virtualenv虚拟环境 ### Windows安装 方案一 方案二 Linux安装 其他命令 安装django 安装python https:/ ...
- 如何将github项目上传至gitlab
一.修改远程分支关联 删除远程分支关联 将指向github的远程分支关联关系删除 git remote rm origin 添加新的远程分支关联 新的remote地址指向gitlab相应地址 git ...
- Scala学习笔记(四)—— 数组
定长数组Array 定义定长数组用Array,有如下几种方法: 初始化一个长度为8的定长数组,其所有元素默认值均为0 scala> new Array[Int](8) res0: Array[I ...
- 数据库 MySQL part4
存储引擎 什么是存储引擎? mysql中建的库是文件夹,建的表是文件.文件有不同的类型,数据库中的表也有不同的类型,表的类型不同,会对应mysql不同的存取机制,表类型又称为存储引擎. 存储引擎说白了 ...
- SDWebImage的原理 和 实现机制 --- tableView 滑动卡的问题
一.原理 1)当我门需要获取网络图片的时候,我们首先需要的便是URl没有URl什么都没有,获得URL后我们SDWebImage实现的并不是直接去请求网路,而是检查图片缓存中有没有和URl相关的图片,如 ...
- Ceres优化
Ceres Solver是谷歌2010就开始用于解决优化问题的C++库,2014年开源.在Google地图,Tango项目,以及著名的SLAM系统OKVIS和Cartographer的优化模块中均使用 ...