大数据学习之HDFS基本API操作（上）06

 package it.dawn.HDFSPra;

 import java.io.FileNotFoundException;

 import java.io.IOException;

 import java.net.URI;

 import java.net.URISyntaxException;

 import java.util.Arrays;

 import org.apache.hadoop.conf.Configuration;

 import org.apache.hadoop.fs.FileStatus;

 import org.apache.hadoop.fs.FileSystem;

 import org.apache.hadoop.fs.LocatedFileStatus;

 import org.apache.hadoop.fs.Path;

 import org.apache.hadoop.fs.RemoteIterator;

 import org.junit.Before;

 import org.junit.Test;

 /**

  * @version 1.0

  * @author Dawn

  * @since 2019年4月27日22:42:32

  *

  * 注意：1.需要配置hadoop环境

  *         2.需要编译好的winutil包

  */

 public class HdfsClientDemo01 {

     public static FileSystem fs=null;

     public static String hdfs="hdfs://192.168.40.11:9000";

     //初始化加载

     @Before

     public void init() throws IOException, InterruptedException, URISyntaxException

     {

         System.setProperty("hadoop.home.dir", "E:\\hadoop2.7.3\\hadoop-2.7.3");

         // 1.加载配置

         Configuration conf= new Configuration();

         // 2.设置副本数 默认3块

         conf.set("dfs.replication", "2");

         // 3.设置块大小 默认128m

         conf.set("dfs.blocksize", "64m");

         // 4.构造客户端

         fs=FileSystem.get(new URI(hdfs), conf, "root");

     }

     /*

      * 上传文件

      * hdfs dfs -put /文件名 /hdfs目录

      */

     @Test

     public void hdfsUpData() throws IllegalArgumentException, IOException

     {

         //上传文件

         fs.copyFromLocalFile(new Path("f:/temp/xxx.txt"), new Path("/"));

         //2.关闭资源

         fs.close();

     }

     /*

      * 下载文件

      * hdfs dfs -get /hdfs文件 /文件目录

      */

     @Test

     public void hdfsDownload() throws IllegalArgumentException, IOException {

         //下载文件

         fs.copyToLocalFile(new Path("/xxx.txt"), new Path("f:/"));

         fs.close();

     }

     /*

      * 1:在hdfs中创建文件夹

      * hdfs dfs -mkdir /文件名

      */

     @Test

     public void hdfsMkdir() throws IllegalArgumentException, IOException

     {

         //1.调用创建文件夹方法

         fs.mkdirs(new Path("/dawn/ss"));

         System.out.println("创建成功");

         //2.关闭资源

         fs.close();

     }

     /*

      * 2:在hdfs中 移动/修改 文件

      * 相当于Ctrl+x

      */

     @Test

     public void hdfsRename() throws IllegalArgumentException, IOException

     {

         //1.调用移动并修改

         fs.rename(new Path("/test/a.txt"), new Path("/dawn/renamea.txt"));

         //2.关闭资源

         fs.close();

     }

     /*

      * 3：在hdfs中删除文件夹

      * hdfs dfs -rm -r /

      */

     @Test

     public void hdfsRm() throws IllegalArgumentException, IOException

     {

         //fs.delete(new Path("/hunterhenshuai"));

         //1.调用删除文件方法 参数1：删除的路径 参数2：是否递归删除

         fs.delete(new Path("/test"), true);

         fs.close();

     }

     /*

      * 4:查询hdfs下制定的目录信息

      */

     @Test

     public void hdfsLs() throws FileNotFoundException, IllegalArgumentException, IOException

     {

         //1.调用方法 返回远程迭代器

         RemoteIterator<LocatedFileStatus> iter=fs.listFiles(new Path("/dawn"), true);

         //2.取迭代器数据

         while(iter.hasNext())

         {

             //拿数据

             LocatedFileStatus status=iter.next();

             System.out.println("文件路径为："+status.getPath());

             System.out.println("块大小为："+status.getBlockSize() / (1024*1024) );

             System.out.println("文件长度："+ status.getLen());

             System.out.println("副本数量为："+status.getReplication());

             System.out.println("块信息为："+Arrays.asList(status.getBlockLocations()));

             System.out.println("============================>");

         }

         //3.关闭资源

         fs.close();

     }

     /*

      * 5：判断文件还是文件夹

      */

     @Test

     public void findIsFOrD() throws FileNotFoundException, IllegalArgumentException, IOException {

         //1.展示状态信息

         FileStatus[] listStatus = fs.listStatus(new Path("/"));

         //2.遍历所有文件

         for(FileStatus ls:listStatus) {

             if(ls.isFile()) {

                 //文件

                 System.out.println("文件----f----" +ls.getPath().getName());

             }else {

                 //文件夹

                 System.out.println("文件夹----d----" +ls.getPath().getName());

             }

         }

     }

 }

大数据学习之HDFS基本API操作（上）06的更多相关文章

大数据学习之HDFS基本API操作（下）06
hdfs文件流操作方法一: package it.dawn.HDFSPra; import java.io.BufferedReader; import java.io.FileInputStream ...
大数据学习之HDFS基本命令操作05
1)hdfs的客户端 1.网页形式->测试用 http://192.168.40.11:50070/dfshealth.html#tab-overview 2.命令行形式->测试用 3.企 ...
大数据学习之hdfs集群安装部署04
1-> 集群的准备工作 1)关闭防火墙(进行远程连接) systemctl stop firewalld systemctl -disable firewalld 2)永久修改设置主机名 vi ...
大数据学习笔记——HDFS写入过程源码分析(1)
HDFS写入过程方法调用逻辑 & 源码注释解读前一篇介绍HDFS模块的博客中,我们重点从实践角度介绍了各种API如何使用以及IDEA的基本安装和配置步骤,而从这一篇开始,将会正式整理HDFS ...
大数据学习笔记——HDFS写入过程源码分析(2)
HDFS写入过程注释解读 & 源码分析此篇博客承接上一篇未讲完的内容,将会着重分析一下在Namenode获取到元数据后,具体是如何向datanode节点写入真实的数据的 1. 框架图展示在 ...
大数据学习笔记——HDFS理论知识之编辑日志与镜像文件
HDFS文件系统——编辑日志和镜像文件详细介绍我们知道,启动Hadoop之后,在主节点下会产生Namenode,即名称节点进程,该节点的目录下会保存一份元数据,用来记录文件的索引,而在从节点上即Da ...
大数据学习之HDFS的工作机制07
1:namenode+secondaryNameNode工作机制 2:datanode工作机制 3:HDFS中的通信(代理对象RPC) 下面用代码来实现基本的原理 1:服务端代码 package it ...
大数据学习笔记——Hadoop编程实战之HDFS
HDFS基本API的应用(包含IDEA的基本设置) 在上一篇博客中,本人详细地整理了如何从0搭建一个HA模式下的分布式Hadoop平台,那么,在上一篇的基础上,我们终于可以进行编程实操了,同样,在编程 ...
大数据学习路线，来qun里分享干货，
一.Linux lucene: 全文检索引擎的架构 solr: 基于lucene的全文搜索服务器,实现了可配置.可扩展并对查询性能进行了优化,并且提供了一个完善的功能管理界面. 推荐一个大数据学习群 ...

随机推荐

Java基础 -- 深入理解Java类型信息(Class对象)与反射机制
一 RTTI概念认识Claa对象之前,先来了解一个概念,RTTI(Run-Time Type Identification)运行时类型识别,对于这个词一直是 C++ 中的概念,至于Java中出现RT ...
php5.4、5.5、5.6高版本中htmlspecialchars兼容性处理
在使用php5.4以上版本以上时会有一个函数可能会报错如下 Warning: htmlspecialchars(): charset `gbk' not supported, assuming ut ...
IIS8的SNI功能实现同一服务器多HTTPS站点
名词解释: SNI指是一项用于改善SSL/TLS的技术,在SSLv3/TLSv1中被启用.它允许客户端在发起SSL握手请求时(具体说来,是客户端发出SSL请求中的ClientHello阶段),就提交请 ...
mysql 严格模式 Strict Mode说明（text 字段不能加默认或者不能加null值得修改方法）
mysql 严格模式 Strict Mode说明 1.开启与关闭Strict Mode方法找到mysql安装目录下的my.cnf(windows系统则是my.ini)文件在sql_mode中加入ST ...
kubernetes之管理容器的计算资源
资源类型 CPU 和 memory 都是资源类型.资源类型具有基本单位.CPU 的单位是 core,memory 的单位是 byte.这些都统称为计算资源. CPU含义: CPU 资源的限制和请求以 ...
【sql server】“因为数据库正在使用，所以无法获得对数据库的独占访问权” 解决方案汇总
#事故现场: 在尝试还原数据库时,出现如下错误: #方案一:设置数据库在单用户模式下工作: 1.数据库上右键“属性”: 2.“选项”->“限制访问”,选择“SINGLE_USER” 3.还原数据 ...
hadoop记录-hadoop常用
1.hdfs目录配额 #设置配额目录hdfs dfsadmin -setSpaceQuota 10T /user/hive/warehouser/tmp查看配额目录信息hdfs dfs -count ...
深入理解line-height与vertical-align——前端布局常用属性
line-height.font-size.vertical-align是设置行内元素布局的关键属性.这三个属性是相互依赖的关系,改变行间距离.设置垂直对齐等都需要它们的通力合作.下面将主要介绍lin ...
kaldi通用底层矩阵运算库——CBLAS
matrix/cblas-wrappers.h 该头文件对CBLAS与CLAPACK的接口进行了简单的封装(将不同数据类型的多个接口封装为一个). 比如 cblas_scopy和cblas_dcopy ...
css3写出飘雪花特效
大冬天的,飘雪花的特效,你可能要用上了吧.通常情况下用jQuery写飘雪花的特效,但用css3写,其实特别简单,新手一看就懂,那就告别jQuery,用css3轻松搞定飘雪花特效吧! 点击查看特效演示 ...

大数据学习之HDFS基本API操作（上）06

大数据学习之HDFS基本API操作（上）06的更多相关文章

随机推荐

热门专题