大数据学习——hdfs客户端操作

package cn.itcast.hdfs;

import org.apache.commons.io.IOUtils;

import org.apache.hadoop.conf.Configuration;

import org.apache.hadoop.fs.*;

import org.junit.Before;

import org.junit.Test;

import java.io.File;

import java.io.FileNotFoundException;

import java.io.FileOutputStream;

import java.io.IOException;

import java.net.URI;

public class HdfsClient {

    FileSystem fs = null;

    @Before

    public void init() throws Exception {

        // 构造一个配置参数对象，设置一个参数：我们要访问的hdfs的URI

        // 从而FileSystem.get()方法就知道应该是去构造一个访问hdfs文件系统的客户端，以及hdfs的访问地址

        // new Configuration();的时候，它就会去加载jar包中的hdfs-default.xml

        // 然后再加载classpath下的hdfs-site.xml

        // conf.set("fs.defaultFS", "hdfs://mini1:9000");

        /**

         * 参数优先级： 1、客户端代码中设置的值 2、classpath下的用户自定义配置文件 3、然后是服务器的默认配置

         */

        /*conf.set("dfs.replication", "2");

        conf.set("dfs.block.size", "64m");*/

        // 获取一个hdfs的访问客户端，根据参数，这个实例应该是DistributedFileSystem的实例

        // fs = FileSystem.get(conf);

        // 如果这样去获取，那conf里面就可以不要配"fs.defaultFS"参数，而且，这个客户端的身份标识已经是root用户

        Configuration conf = new Configuration();

        fs = FileSystem.get(new URI("hdfs://mini1:9000"), conf, "root");

    }

    /**

     * 往hdfs上传文件

     */

    @Test

    public void testAddFileToHdfs() throws Exception {

        //要上传的文件所在的本地路径

        //要上传到hdfs的目标路径*/

        Path src = new Path("e:/hello1.txt");

        Path dst = new Path("/");

        fs.copyFromLocalFile(src, dst);

        fs.close();

    }

    /**

     * 从hdfs中复制文件到本地文件系统

     *

     * @throws IOException

     * @throws IllegalArgumentException

     */

    @Test

    public void testDownloadFileToLocal() throws IllegalArgumentException, IOException {

        fs.copyToLocalFile(false, new Path("/hello1.txt"), new Path("e:/"), true);

        fs.close();

    }

    /**

     * 通过流的形式从hdfs下载数据

     * @throws Exception

     */

    @SuppressWarnings("resource")

    @Test

    public void testDownloadFileToLocal2() throws Exception {

        FSDataInputStream in = fs.open(new Path("/hello1.txt"));

        FileOutputStream out = new FileOutputStream(new File("e:/1.txt"));

        IOUtils.copy(in, out);

        fs.close();

    }

    /**

     * 目录操作

     *

     * @throws IllegalArgumentException

     * @throws IOException

     */

    @Test

    public void testMkdirAndDeleteAndRename() throws IllegalArgumentException, IOException {

        // 创建目录

//        fs.mkdirs(new Path("/nihao/henhao/yeah"));

//        // 删除文件夹 ，如果是非空文件夹，参数2必须给值true

//        fs.delete(new Path("/nihao/henhao"), true);

//

//        // 重命名文件或文件夹

        fs.rename(new Path("/nihao"), new Path("/ni"));

    }

    /**

     * 查看目录信息，只显示文件

     *

     * @throws IOException

     * @throws IllegalArgumentException

     * @throws FileNotFoundException

     */

    @Test

    public void testListFiles() throws FileNotFoundException, IllegalArgumentException, IOException {

        // 思考：为什么返回迭代器，而不是List之类的容器

        RemoteIterator<LocatedFileStatus> listFiles = fs.listFiles(new Path("/"), true);

        while (listFiles.hasNext()) {

            LocatedFileStatus fileStatus = listFiles.next();

            System.out.println(fileStatus.getPath().getName());

            System.out.println(fileStatus.getBlockSize());

            System.out.println(fileStatus.getPermission());

            System.out.println(fileStatus.getLen());

            BlockLocation[] blockLocations = fileStatus.getBlockLocations();

            for (BlockLocation bl : blockLocations) {

                System.out.println("block-length:" + bl.getLength() + "--" + "block-offset:" + bl.getOffset());

                String[] hosts = bl.getHosts();

                for (String host : hosts) {

                    System.out.println(host);

                }

            }

            System.out.println("--------------为allen打印的分割线--------------");

        }

    }

    /**

     * 查看文件及文件夹信息

     *

     * @throws IOException

     * @throws IllegalArgumentException

     * @throws FileNotFoundException

     */

    @Test

    public void testListAll() throws FileNotFoundException, IllegalArgumentException, IOException {

        FileStatus[] listStatus = fs.listStatus(new Path("/"));

        String flag = "";

        for (FileStatus fstatus : listStatus) {

            if (fstatus.isFile()) {

                flag = "f-- ";

            } else {

                flag = "d-- ";

            }

            System.out.println(flag + fstatus.getPath().getName());

            System.out.println(fstatus.getPermission());

        }

    }

}

大数据学习——hdfs客户端操作的更多相关文章

大数据学习——hdfs客户端流式操作代码的实现
package cn.itcast.bigdata.hdfs.diceng; import org.apache.hadoop.conf.Configuration; import org.apach ...
大数据Hadoop——HDFS Shell操作
一.查询目录下的文件 1.查询根目录下的文件 Hadoop fs -ls / 2.查询文件夹下的文件 Hadoop fs -ls /input 二.创建文件夹 hadoop fs -mkdir /文件 ...
大数据学习——HDFS的shell
-help 功能:输出这个命令参数手册 -ls 功能:显示目录信息示例: hadoop fs -ls hdfs://hadoop-server01:9000/ 备注:这些参数中,所有的hdfs路径都 ...
大数据学习——hdfs集群启动
第一种方式: 1 格式化namecode(是对namecode进行格式化) hdfs namenode -format(或者是hadoop namenode -format) 进入 cd /root/ ...
大数据学习笔记之Hadoop（二）：HDFS文件系统
文章目录一 HDFS概念 1.1 概念 1.2 组成 1.3 HDFS 文件块大小二 HFDS命令行操作三 HDFS客户端操作 3.1 eclipse环境准备 3.1.1 jar包准备 3.2 ...
大数据学习day31------spark11-------1. Redis的安装和启动，2 redis客户端 3.Redis的数据类型 4. kafka（安装和常用命令）5.kafka java客户端
1. Redis Redis是目前一个非常优秀的key-value存储系统(内存的NoSQL数据库).和Memcached类似,它支持存储的value类型相对更多,包括string(字符串).list ...
大数据学习笔记——Hadoop编程实战之HDFS
HDFS基本API的应用(包含IDEA的基本设置) 在上一篇博客中,本人详细地整理了如何从0搭建一个HA模式下的分布式Hadoop平台,那么,在上一篇的基础上,我们终于可以进行编程实操了,同样,在编程 ...
大数据学习系列之七 ----- Hadoop+Spark+Zookeeper+HBase+Hive集群搭建图文详解
引言在之前的大数据学习系列中,搭建了Hadoop+Spark+HBase+Hive 环境以及一些测试.其实要说的话,我开始学习大数据的时候,搭建的就是集群,并不是单机模式和伪分布式.至于为什么先写单 ...
大数据学习系列之—HBASE
hadoop生态系统 zookeeper负责协调 hbase必须依赖zookeeper flume 日志工具 sqoop 负责 hdfs dbms 数据转换数据到关系型数据库转换大数据学习群119 ...

随机推荐

WOJ1019 所有的M数
题目链接: WOJ1019 题目分析: 单调栈维护,读一个进来,如果前面的比它大就弹出来,然后压栈里(反正它在最右边) 压进栈里输出它前面那个数就好了 O(n)扫一遍就能过真的水得不能再水的题了-- ...
P1847 轰炸II
题目背景本题为轰炸数据加强版题目描述一个城市遭到了M次轰炸,每次都炸了一个每条边都与边界平行的矩形在轰炸后,有N个关键点,指挥官想知道,它们有没有受到过轰炸,如果有,被炸了几次,最后一次是第几 ...
迭代器———更锋利的C#代码小记(3)
直接使用yield return关键字通过类似返回值的方式灵活地构造迭代器 public class EmployeeCollection :IEnumerable<Employee> { ...
Android一键锁屏APP
题记: 这个app完全是拾人牙慧,作为练手用的,其实没有什么原创的东西.当然,博客还是我自己写的,记录下来,对自己也算是一种成长吧. 转载请注明原文地址: http://www.cnblogs.com ...
ubuntu下nginx+PHP-FPM安装配置
安装nginx apt-get install nginx 配置nginx 位置: /etc/nginx/nginx.conf ,其中包含了 include /etc/nginx/conf.d/*. ...
win7创建无线（WIFI）cmd命令
1.创建无限热点:netsh wlan set hostednetwork mode=allow ssid=name key=12345678. 2.承载网络:netsh wlan start(关闭s ...
BZOJ 1012： [JSOI2008]最大数maxnumber
★★ 输入文件:bzoj_1012.in 输出文件:bzoj_1012.out 简单对比时间限制:3 s 内存限制:162 MB [题目描述] 现在请求你维护一个数列,要求提供以下两种 ...
iOS端架构、基本组成与使用说明
一. app整体描述 app的描述:需求文档+接口文档+程序架构. 说明:新入手的开发人员必须拿到这三个说明文档才能整体了解app功能. 二.app架构描述 1.架构视图 2.分层结构说明 [1] a ...
lodash中文说明文档
lodash中文说明文档 https://www.css88.com/doc/lodash/
PHP18 PHP与AJAX
学习要点 JavaScript实现Ajax jQuery实现Ajax JSON PHP的JSON函数 JavaScript处理JSON数据 JavaScript实现Ajax 什么是Ajax 搜狗地图 ...

大数据学习——hdfs客户端操作

大数据学习——hdfs客户端操作的更多相关文章

随机推荐

热门专题