HDFS Java API 常用操作

package com.luogankun.hadoop.hdfs.api;

import java.io.BufferedInputStream;

import java.io.File;

import java.io.FileInputStream;

import java.io.InputStream;

import java.net.URI;

import org.apache.hadoop.conf.Configuration;

import org.apache.hadoop.fs.BlockLocation;

import org.apache.hadoop.fs.FSDataOutputStream;

import org.apache.hadoop.fs.FileStatus;

import org.apache.hadoop.fs.FileSystem;

import org.apache.hadoop.fs.Path;

import org.apache.hadoop.io.IOUtils;

import org.apache.hadoop.util.Progressable;

import org.junit.After;

import org.junit.Before;

import org.junit.Test;

/**

 * HDFS Java API操作

 * @author luogk

 *

 */

public class HDFSApp {

    public static final String HDFS_PATH = "hdfs://hadoop000:8020";

    Configuration configuration = null;

    FileSystem fileSystem = null;

    @Before

    public void setUp() throws Exception{

        System.out.println("HDFSApp.setUp()");

        configuration = new Configuration();

        fileSystem = FileSystem.get(new URI(HDFS_PATH), configuration);

    }

    /**

     * 创建目录

     */

    @Test

    public void mkdir() throws Exception {

        fileSystem.mkdirs(new Path("/hdfsapi/test"));

    }

    /**

     * 创建文件

     */

    @Test

    public void create() throws Exception  {

        FSDataOutputStream output = fileSystem.create(new Path("/hdfsapi/test/a.txt"));

        output.write("hello world".getBytes());

        output.flush();

        output.close();

    }

    /**

     * 重命名

     */

    @Test

    public void rename() throws Exception  {

        Path oldPath = new Path("/hdfsapi/test/a.txt");

        Path newPath = new Path("/hdfsapi/test/b.txt");

        System.out.println(fileSystem.rename(oldPath, newPath));

    }

    /**

     * 上传本地文件到HDFS

     */

    @Test

    public void copyFromLocalFile() throws Exception  {

        Path src = new Path("d:/case2.sql");

        Path dist = new Path("/hdfsapi/test/");

        fileSystem.copyFromLocalFile(src, dist);

    }

    /**

     * 上传本地文件到HDFS

     */

    @Test

    public void copyBytes() throws Exception  {

        InputStream in = new BufferedInputStream(new FileInputStream(new File("D:/software/apache/spark/spark-1.1.0-SNAPSHOT-bin-2.3.0-cdh5.0.0.tgz")));

        FSDataOutputStream out = fileSystem.create(new Path("/hdfsapi/test/spark.tgz"), new Progressable() {

            @Override

            public void progress() {

                System.out.print("."); //带进度提示信息

            }

        });

        IOUtils.copyBytes(in, out, 4096);

    }

    /**

     * 查看某个目录下的所有文件

     */

    @Test

    public void listFiles() throws Exception  {

        FileStatus[] listStatus = fileSystem.listStatus(new Path("/hdfsapi/test"));

        for (FileStatus fileStatus : listStatus) {

            String isDir = fileStatus.isDirectory()?"文件夹":"文件";  //文件/文件夹

            String permission = fileStatus.getPermission().toString(); //权限

            short replication = fileStatus.getReplication(); //副本系数

            long len = fileStatus.getLen(); //长度

            String path = fileStatus.getPath().toString(); //路径

            System.out.println(isDir+"\t"+permission+"\t"+replication+"\t"+len+"\t"+path);

        }

    }

    /**

     * 查看文件块信息

     */

    @Test

    public void getFileBlockLocations() throws Exception  {

        FileStatus fileStatus = fileSystem.getFileStatus(new Path("/hdfsapi/test/spark.tgz"));

        BlockLocation[] blocks = fileSystem.getFileBlockLocations(fileStatus, 0, fileStatus.getLen());

        for(BlockLocation block : blocks) {

            for(String host : block.getHosts()){

                System.out.println(host);

            }

        }

    }

    @After

    public void tearDown() throws Exception{

        fileSystem = null;

        configuration = null;

        System.out.println("HDFSApp.tearDown()");

    }

}

HDFS Java API 常用操作的更多相关文章

HDFS shell操作及HDFS Java API编程
HDFS shell操作及HDFS Java API编程 1.熟悉Hadoop文件结构. 2.进行HDFS shell操作. 3.掌握通过Hadoop Java API对HDFS操作. 4.了解Had ...
hadoop hdfs java api操作
package com.duking.util; import java.io.IOException; import java.util.Date; import org.apache.hadoop ...
Hadoop基础-HDFS的API常见操作
Hadoop基础-HDFS的API常见操作作者:尹正杰版权声明:原创作品,谢绝转载!否则将追究法律责任. 本文主要是记录一写我在学习HDFS时的一些琐碎的学习笔记, 方便自己以后查看.在调用API ...
HDFS Java API 的基本使用
一. 简介二.API的使用 2.1 FileSystem 2.2 创建目录 2.3 创建指定权限的目录 2.4 创建文件,并写入内容 ...
Hadoop 学习之路（七）—— HDFS Java API
一. 简介想要使用HDFS API,需要导入依赖hadoop-client.如果是CDH版本的Hadoop,还需要额外指明其仓库地址: <?xml version="1.0" ...
Hadoop 系列（七）—— HDFS Java API
一. 简介想要使用 HDFS API,需要导入依赖 hadoop-client.如果是 CDH 版本的 Hadoop,还需要额外指明其仓库地址: <?xml version="1.0 ...
Phoenix简介概述，Phoenix的Java API 相关操作优秀案例
Phoenix简介概述,Phoenix的Java API 相关操作优秀案例一.Phoenix概述简介二.Phoenix实例一:Java API操作 2.1 phoenix.properties 2 ...
Java API 常用类（一）
Java API 常用类 super类详解 "super"关键字代表父类对象.通过使用super关键字,可以访问父类的属性或方法,也可以在子类构造方法中调用父类的构造方法,以便初始 ...
Elasticsearch java api 常用查询方法QueryBuilder构造举例
转载:http://m.blog.csdn.net/u012546526/article/details/74184769 Elasticsearch java api 常用查询方法QueryBuil ...

随机推荐

openstack(liberty):部署实验平台（一，基础网络环境搭建）
openstack项目的研究,到今天,算是要进入真实环境了,要部署实验平台了.不再用devstack了.也就是说,要独立controller,compute,storage和network了.要做这个 ...
[原]Linux系统管理使用技巧总结
一.磁盘管理 1.查看磁盘空间大小 df可以查看一级文件夹大小.使用比例.档案系统及其挂入点,但对文件却无能为力. du可以查看文件及文件夹的大小.如果不带其他参数(-h表示human-readabl ...
【Log4j】 log4j.properties 使用
一.参数意义说明输出级别的种类 ERROR.WARN.INFO.DEBUG ERROR 为严重错误主要是程序的错误 WARN 为一般警告,比如session丢失 INFO 为一般要显示的信息,比如 ...
Python 定制类与其对象的创建和应用
1.创建新类Athlete,创建两个唯一的对象实例sarah james,他们会继承Athlete类的特性 >>> class Athlete: def __init__(self, ...
Python 迭代删除重复项，集合删除重复项
1. 迭代删除重复项:先排序列表项,然后通过新迭代(not in)去除重复项,分片打印 def sanitize(time_string): if '-' in time_string: splitt ...
C#调用MySql
1.要连接MySql数据库必须首先下载MySql官方的连接.net的文件,文件下载地址为http://dev.mysql.com/downloads/connector/net/6.6.html#do ...
"aa".equals(name)这种写法为什么就可以避免空指针
public static void main(String[] args) { String name=null; if("aa".equals(name))//这种情形,不出现 ...
c#无限级分类
data: [ { text: '节点1', icon: myaccount, children: [ { text: '节点1.1', icon: archives }, { text: '节点1. ...
正则表达式(BREs,EREs,PREs)差异比较
我想各位也和我一样,再linux下使用grep,egrep, awk , sed, vi的搜索时,会经常搞不太清楚,哪此特殊字符得使用转义字符'\' .. 哪些不需要, grep与egrep的差异 ...
一个 IT 青年北漂四年的感悟
转载自:http://www.codeceo.com/article/it-man-beijing-4-years.html 工作这几年,每年都会有朋友离开北京,每次朋友跟我告别的时候总是让我有很多感 ...

HDFS Java API 常用操作

HDFS Java API 常用操作的更多相关文章

随机推荐

热门专题