HDFS Basic Operation
1、如何启动一个命令行的hadoop客户端
任何一个Hadoop集群中的节点,只要有hadoop安装包,就可以通过# hadoop fs来启动
2、Hadoop基本命令格式
# hadoop fs -cmd <args>
3、上传文件到HDFS 集群
hadoop fs -put
# hadoop fs -put 本地文件 hdfs文件 # hdfs文件的父目录一定要存在,否则不执行
# hadoop fs -put 本地文件/目录 hdfs目录 # hdfs目录一定要存在,否则不执行
# hadoop fs -put - hdfs文件 # - 表示从键盘读取输入, 保存到hdfs文件,ctrl+d结束,hdfs文件不能存在,否则不执行
hadoop fs -moveFromLocal
# hadoop fs -moveFromLocal <local src> ….. <hdfs dst>
和put命令类似,命令执行后源文件从本地删除,也可以从键盘读取输入
hadoop fs -copyFromLocal
# hadoop fs -copyFromLocal <local src>…. <hdfs dst>
4、 从HDFS集群下载文件
hadoop fs -get <hdfs file> <local file or dir>
# local file不能和hdfs file重名,否则提示文件已存在,不重名才下载
# localfile不写则下载到本地的当前目录,生成同名文件
hadoop fs -get <hdfs file> …….. <local dir>
下载多个hdfs文件到本地目录
注意:如果不是root用户,要使用本用户的本地目录,权限问题
hadoop fs -copyToLocal <hdfs src>…..<local dst>
5、 查看HDFS集群文件目录 hadoop fs -ls /
# hadoop fs -ls / 列出根目录下的目录和文件
# hadoop fs -ls -R / -R,recursively
6、 创建HDFS下的目录 hadoop fs -mkdir
# hadoop fs –mkdir <hdfs path> # 一级一级创建,父目录不存在会报错
# hadoop fs -mkdir -p <hdfs path> # 递归创建多级目录,从外到内
7、 删除HDFS下的目录或文件 hadoop fs –rm –r
# hadoop fs -rm <hdfs file>…… # 每次可以删除多个文件
# hadoop fs –rm –r <hdfs dir> ……. # 每次可以删除多个目录
# hadoop fs -rmr <hdfs dir>…….. # -rmr = -rm -r
8 、HDFS内的文件拷贝 hadoop fs -cp
# hadoop fs –cp <hdfs src> <hdfs dst>
目标文件不能存在,否则命令不执行(给源文件重命名并保存)
# hadoop fs –cp <hdfs file or dir> <hdfs dir>
目标目录要存在,否则不执行
9、 HDFS中的文件移动 hadoop fs -mv
# hadoop fs -mv <hdfs file> <hdfs file>
目标文件不能存在(文件重命名并保存,源文件不存在)
# hadoop fs –mv <hdfs file or dir> …… <hdfs dir>
源文件多个,目标必须是目录,且必须存在
10、 HDFS中的文件统计
hadoop fs -count
# hadoop fs –count <hdfs path>
统计路径下的:目录个数、文件个数、文件总计大小
hadoop fs -du
# hadoop fs –du <hdfs path>
每个文件夹和文件的大小, -du disk usage
# hadoop fs –du –h <hdfs path>
每个文件夹和文件的大小,-h human readable
# hadoop fs –du –s <hdfs path>
所有文件的和的大小, -s, summary
11、 HDFS文件以文本格式输出 hadoop fs –text
# hadoop fs –text <hdfs file>
将文本文件或某些格式的非文本文件,通过文本格式输出到console
12、 修改HDFS文件副本数 hadoop fs – setrep 2
# hadoop fs –setrep –R 2 <hdfs path>
将指定目录下的文件做递归修改,-R recursively, 2修改后的副本数
13、 HDFS多个文件排序合并到本地文件 hadoop fs -getmerge
# hadoop fs –getmerge <hdfs dir> <local file>
将hdfs指定目录下的所有文件排序后合并输出到指定本地文件,文件不存在则自动创建,存在则覆盖写入
# hadoop fs –getmerge –nl <hdfs dir> <local file>
合并到local file中的不同hdfs文件之间会空出一行
HDFS Basic Operation的更多相关文章
- matlab basic operation command
Matlab basic operation: >> 5+6 ans = 11 >> 3*4 ans = 12 >> 2^6 ans = 64 >> 1 ...
- 【MongoDB】The basic operation of Index in MongoDB
In the past four blogs, we attached importance to the index, including description and comparison wi ...
- Hadoop HDFS Basic JAVA API
org.apache.hadoop.fs.FileSystem 是HDFS的文件系统抽象,在分布式系统中管理HDFS文件和目录.文件内容存储在由多个相同大小的块(如64M)构成的datanode节 ...
- Javascript Basic Operation Extraction
1. logic operation : '&&' and '||' .For this two logic operations,its' results are inconcl ...
- Basic Operation about Linux
1. 永久开启/关闭防火墙 在linux中防火墙是一个名叫iptables的工具 开启: chkconfig iptables on 关闭: chkconfig iptables off 即时生效,重 ...
- mysql basic operation,mysql总结
mysql> select * from wifi_data where dev_id like "0023-AABBCCCCBBAA" ; 1.显示数据库列表.show d ...
- mysql basic operation,mysql总结,对mysql经常使用语句的详细总结,MySQL学习笔记
mysql> select * from wifi_data where dev_id like "0023-AABBCCCCBBAA" ; 1.显示数据库列表.show d ...
- 【HDFS API编程】从本地拷贝文件,从本地拷贝大文件,拷贝HDFS文件到本地
接着之前继续API操作的学习 CopyFromLocalFile: 顾名思义,从本地文件拷贝 /** * 使用Java API操作HDFS文件系统 * 关键点: * 1)create Configur ...
- internal table operation
1: the basic operation *&---------------------------------------------------------------------* ...
随机推荐
- 201521123078 《java程序设计》第十周学习总结
1. 本周学习总结 1.1 以你喜欢的方式(思维导图或其他)归纳总结异常与多线程相关内容. 创建线程:定义Thread的子类可以实现Runable接口 线程的控制:线程暂停Thread.sleep() ...
- 第二部分----CSS的基础语法
PART-1 CSS的基础常识 一.什么是CSS? W3C标准中,倡导有3:其一为内容与表现分离,其二为内容与行为分离,其三为内容结构的语义化.其倡导中第一条的"表现"指的便可以说 ...
- 才趟过的一个坑,css造成的Validform表单提交按钮点击无效
最近入手的一个项目,在开发的过程中,遇到了一个以前没遇到过的问题,废了半天的功夫才弄懂原因,留下足迹,警醒后人,下面开始讲故事啦! 在一个昏天暗地的上午,我一个人照常坐在办公室安静的工作中!项目编码已 ...
- sed命令基础
sed是一种流编辑器,它是文本处理中非常中的工具,能够完美的配合正则表达式使用,功能不同凡响.处理时,把当前处理的行存储在临时缓冲区中,称为"模式空间"(pattern space ...
- pygame 弹力球及其变速的实现
期望: 1.球体接触到框体后反弹 2.设置速度按键,按下后改变球体速度.颜色状态 具体实现: import pygame from pygame.locals import * import sys, ...
- mysql数据库-中文乱码问题解决方案
来自:http://www.2cto.com/database/201108/101151.html MySQL会出现中文乱码的原因不外乎下列几点: .server本身设定问题,例如还停留在latin ...
- Shiro初识与总结
1.1简介 Apache Shiro是一个强大且易用的Java安全框架,执行身份验证.授权.密码学和会话管理.使用Shiro的易于理解的API,您可以快速.轻松地获得任何应用程序,从最小的移动应用程序 ...
- OC——多态
书接上文,上文提到继承一个很大用途的是为了更好的实现多态,现在我们就来看看OC的多态. 多态:顾名思义就是好多种状态,以前学C#时候印象最深刻的例子是好多个类共同实现同一个接口,然后把这些类的对象都装 ...
- 【个人笔记】《知了堂》mysql表连接
为什么使用表连接 什么是表连接? 如果数据来自多个表,那么可以采用链接查询的方式来实现.因此表连接就是多个表连接合在一起实现查询效果 表连接的原理 表连接采用的是笛卡尔乘积,称之为横向连接. 笛卡尔乘 ...
- 学习ExtJS的grid布局
这是之前学习ExtJS布局的时候我导师让我重点熟悉的内容.之后会发一个最近写的结合MVC项目的grid布局的案例. 上一篇关于ExtJS的学习资料什么的都已经更在上一篇了,这里只是对一些代码的记录. ...