大数据学习之HDFS基本API操作（下）06

　　　　　　　　　　　　　　　　　　hdfs文件流操作方法一：

package it.dawn.HDFSPra;

import java.io.BufferedReader;

import java.io.FileInputStream;

import java.io.IOException;

import java.io.InputStreamReader;

import java.net.URI;

import java.net.URISyntaxException;

import org.apache.hadoop.conf.Configuration;

import org.apache.hadoop.fs.FSDataInputStream;

import org.apache.hadoop.fs.FSDataOutputStream;

import org.apache.hadoop.fs.FileSystem;

import org.apache.hadoop.fs.Path;

import org.apache.zookeeper.common.IOUtils;

import org.junit.Before;

import org.junit.Test;

/**

 * @version 1.0

 * @author Dawn

 * @date 2019年4月28日22:28:53

 * @return hdfs的读写操作。顺便练习一下java的IO操作

 */

public class HdfsReadData02 {

    public static FileSystem fs=null;

    public static String hdfs="hdfs://bigdata11:9000";

    @Before

    public void init() throws IOException, InterruptedException, URISyntaxException {

        //其实这一句我也不是很清楚。不加这个有个异常，我看起来感觉很恶心。不过没有影响。大家加不加都没问题

        System.setProperty("hadoop.home.dir", "E:\\hadoop2.7.3\\hadoop-2.7.3");

        //1 加载配置

        Configuration conf=new Configuration();

        //2 构造客服端

        fs=FileSystem.get(new URI(hdfs), conf, "root");

    }

    //读数据方式1

    @Test

    public void testReadData1() throws IllegalArgumentException, IOException {

        //1 拿到流

        //其实和这个没啥差别fs.copyToLocalFile(new Path("/xxx.txt"), new Path("f:/"));

        FSDataInputStream in=fs.open(new Path("/xxx.txt"));

        byte[] buf=new byte[1024];

        in.read(buf);

        //打印出来

        System.out.println(new String(buf));

        //记得关闭流

        in.close();

        fs.close();

    }

    //读数据方式2 （加了一个缓冲流而已）

    @Test

    public void testReadData2() throws IllegalArgumentException, IOException {

        //1 拿到流

        FSDataInputStream in=fs.open(new Path("/xxx.txt"));

        //2.缓冲流

        BufferedReader br=new BufferedReader(new InputStreamReader(in, "UTF-8"));

        //3.按行读取

        String line=null;

        //4:一行一行的读数据

        while((line=br.readLine()) != null) {

            //打印出来

            System.out.println(line);

        }

        //5.关闭资源

        br.close();

        in.close();

        fs.close();

    }

    /*

     * 读取hdfs中指定偏移量

     */

    @Test

    public void testRandomRead() throws IllegalArgumentException, IOException {

        //1：拿到流

        FSDataInputStream in= fs.open(new Path("/xxx.txt"));

        in.seek(3);

        byte[] b=new byte[5];

        in.read(b);

        System.out.println(new String(b));

        in.close();

        fs.close();

    }

    /**

     * 在hdfs中写数据 直接对存在的文件进行写操作

     * fs.creat(hdfsFilename,false)

     * @param Path f

     * @param boolean overwrite

     */

    @Test

    public void testWriteData() throws IllegalArgumentException, IOException {

        //拿到输出流

        FSDataOutputStream out=fs.create(new Path("/dawn.txt"),false);//第二个参数。是否覆盖

        //2.输入流

        FileInputStream in=new FileInputStream("f:/temp/a.txt");//其实我觉得new一个File好一点

        byte[] buf=new byte[1024];

        int read=0;

        while((read=in.read(buf)) != -1) { //the total number of bytes read into the buffer, or -1 if there is no more data because the end of the file has been reached.

            out.write(buf,0,read);

        }

        in.close();

        out.close();

        fs.close();

    }

    /*

     * 在hdfs中写数据 写一个新的数据

     */

    @Test

    public void testWriteData1() throws IllegalArgumentException, IOException {

        //1.创建输出流

        FSDataOutputStream out=fs.create(new Path("/haha"));

        //2.创建输入流

//        FileInputStream in=new FileInputStream(new File("f:/temp/data.txt"));//没啥用

        //3.写数据

        out.write("dawn will success".getBytes());

        //4.关闭资源

        IOUtils.closeStream(out);

        fs.close();

    }

}

　　　　　　　　　　　　　　　　　　　　　　hdfs文件流操作方法二：

package it.dawn.HDFSPra;

import java.io.File;

import java.io.FileInputStream;

import java.io.FileOutputStream;

import java.io.IOException;

import java.net.URI;

import java.net.URISyntaxException;

import org.apache.hadoop.conf.Configuration;

import org.apache.hadoop.fs.FSDataInputStream;

import org.apache.hadoop.fs.FSDataOutputStream;

import org.apache.hadoop.fs.FileSystem;

import org.apache.hadoop.fs.Path;

import org.apache.hadoop.io.IOUtils;

import org.junit.Before;

import org.junit.Test;

/**

 * @version 1.0

 * @author Dawn

 * @date 2019年4月28日23:21:03

 * @return 使用IOUtills更为方便

 */

public class HdfsIOUtilsTest {

    public static String hdfs="hdfs://bigdata11:9000";

    public static FileSystem fs=null;

    public static Configuration conf=null;

    @Before

    public void init() throws IOException, InterruptedException, URISyntaxException {

        conf =new Configuration();

        fs=FileSystem.get(new URI(hdfs), conf, "root");

    }

    /*

     * 文件上传HDFS

     *

     */

    @Test

    public void putFileToHDFS() throws IllegalArgumentException, IOException {

        //1.获取输入流

        FileInputStream fis=new FileInputStream(new File("f:/temp/lol.txt"));

        //2获取输出流

        FSDataOutputStream fos=fs.create(new Path("/dawn/n.txt"));

        //3 流的拷贝

        IOUtils.copyBytes(fis, fos, conf);

        //4.关闭资源

        IOUtils.closeStream(fis);

        IOUtils.closeStream(fos);

    }

    /*

     * 文件下载HDFS

     */

    @Test

    public void getFileFromHDFS() throws IllegalArgumentException, IOException {

        //1.获取输入流

        FSDataInputStream fis=fs.open(new Path("/xxx.txt"));

        //2.获取输出流

        FileOutputStream fos=new FileOutputStream("f:/temp/lala.txt");

        //3.流的对拷

        IOUtils.copyBytes(fis, fos, conf);

        //4.关闭资源

        IOUtils.closeStream(fos);

        IOUtils.closeStream(fis);

    }

}

附上读写流程图

大数据学习之HDFS基本API操作（下）06的更多相关文章

大数据学习之HDFS基本API操作（上）06
package it.dawn.HDFSPra; import java.io.FileNotFoundException; import java.io.IOException; import ja ...
大数据学习之HDFS基本命令操作05
1)hdfs的客户端 1.网页形式->测试用 http://192.168.40.11:50070/dfshealth.html#tab-overview 2.命令行形式->测试用 3.企 ...
大数据学习之hdfs集群安装部署04
1-> 集群的准备工作 1)关闭防火墙(进行远程连接) systemctl stop firewalld systemctl -disable firewalld 2)永久修改设置主机名 vi ...
大数据学习笔记——HDFS写入过程源码分析(1)
HDFS写入过程方法调用逻辑 & 源码注释解读前一篇介绍HDFS模块的博客中,我们重点从实践角度介绍了各种API如何使用以及IDEA的基本安装和配置步骤,而从这一篇开始,将会正式整理HDFS ...
大数据学习笔记——HDFS写入过程源码分析(2)
HDFS写入过程注释解读 & 源码分析此篇博客承接上一篇未讲完的内容,将会着重分析一下在Namenode获取到元数据后,具体是如何向datanode节点写入真实的数据的 1. 框架图展示在 ...
大数据学习笔记——HDFS理论知识之编辑日志与镜像文件
HDFS文件系统——编辑日志和镜像文件详细介绍我们知道,启动Hadoop之后,在主节点下会产生Namenode,即名称节点进程,该节点的目录下会保存一份元数据,用来记录文件的索引,而在从节点上即Da ...
大数据学习之HDFS的工作机制07
1:namenode+secondaryNameNode工作机制 2:datanode工作机制 3:HDFS中的通信(代理对象RPC) 下面用代码来实现基本的原理 1:服务端代码 package it ...
大数据学习笔记——Hadoop编程实战之HDFS
HDFS基本API的应用(包含IDEA的基本设置) 在上一篇博客中,本人详细地整理了如何从0搭建一个HA模式下的分布式Hadoop平台,那么,在上一篇的基础上,我们终于可以进行编程实操了,同样,在编程 ...
大数据学习路线，来qun里分享干货，
一.Linux lucene: 全文检索引擎的架构 solr: 基于lucene的全文搜索服务器,实现了可配置.可扩展并对查询性能进行了优化,并且提供了一个完善的功能管理界面. 推荐一个大数据学习群 ...

随机推荐

Java基础--常见计算机编码类型
计算机编码指电脑内部代表字母或数字的方式,常见的编码方式有:ASCII编码,GB2312编码(简体中文),GBK,BIG5编码(繁体中文),ANSI编码,Unicode,UTF-8编码等. 1.ASC ...
Eclipse - 安装lombok后注解无效
安装 lombok lombok 的安装过程挺简单的,网上已经有很多相关的博客,这里就不在多说了,可以参考这篇:eclipse集成lombok注解不起作用但是我按照网上的方式安装之后,注解一直不起作 ...
HDU-1709 The Balance(生成函数)
题意给$n$个数,有哪些属于$1$到$n$个数字总和$sum$的数是通过该集合任意子集之间的加减运算无法得到的. 思路对每个数构造$x^{-a[i]}+1+x^{a[i]}$,为了避免负幂次可以将 ...
python2编码问题
前言:python3解决了编码的问题,但python2还存在很多编码问题,用P2写爬虫爬了网页,解析时常有不同字符混着编码,导致解码问题成为爬虫程序员的噩梦... 但咱们要用robot framewo ...
makefile 嵌套
目录结构: dynamic 和 static 两个目录实现加法功能, 分别生成动态库和静态库, main.c 主文件链接加法功能, 终端命令执行: make dynamic=1 则编译动态 ...
C. Neko does Maths(数论二进制枚举因数)
题目链接:https://codeforces.com/contest/1152/problem/C 题目大意:给你a和b,然后让你找到一个k,使得a+k和b+k的lcm. 学习网址:https:/ ...
实验吧 deeeeeeaaaaaadbeeeeeeeeeef-20
题目描述: 图片是正确的吗? 解题思路: 这道题很有意思,常规的隐写思路没有线索,结果问题出现在照片的分辨率上,tEXtSource iPhone 5的后置摄像头是3264×2448的分辨率,前置摄像 ...
Convolutional Pose Machines（理解）
0 - 背景人体姿态识别存在遮挡以及关键点不清晰等主要挑战,然而,人体的关键点之间由于人体结构而具有相互关系,利用容易识别的关键点来指导难以识别关键点的检测,是提高关键点检测的一个思路.本文通过提出 ...
只有try和finally,没有catch
因为没有catch捕获异常,所以异常发生时,会将异常抛出,导致程序中止:在抛出之前会执行finally中的代码. 用于无法捕获处理异常,需要在程序结束之前进行善后处理的场景
Java 多线程 - 锁优化
http://www.cnblogs.com/pureEve/p/6421273.html https://www.cnblogs.com/mingyao123/p/7424911.html

大数据学习之HDFS基本API操作（下）06

大数据学习之HDFS基本API操作（下）06的更多相关文章

随机推荐

热门专题