使用java api操作HDFS文件

实现的代码如下：

     import java.io.IOException;

     import java.net.URI;

     import java.net.URISyntaxException;  

     import org.apache.hadoop.conf.Configuration;

     import org.apache.hadoop.fs.FSDataInputStream;

     import org.apache.hadoop.fs.FSDataOutputStream;

     import org.apache.hadoop.fs.FileStatus;

     import org.apache.hadoop.fs.FileSystem;

     import org.apache.hadoop.fs.FileUtil;

     import org.apache.hadoop.fs.Path;

     import org.apache.hadoop.io.IOUtils;  

     public class HDFSTest {  

         //在指定位置新建一个文件，并写入字符

         public static void WriteToHDFS(String file, String words) throws IOException, URISyntaxException

         {

             Configuration conf = new Configuration();

             FileSystem fs = FileSystem.get(URI.create(file), conf);

             Path path = new Path(file);

             FSDataOutputStream out = fs.create(path);   //创建文件  

             //两个方法都用于文件写入，好像一般多使用后者

             out.writeBytes(words);

             out.write(words.getBytes("UTF-8"));  

             out.close();

             //如果是要从输入流中写入，或是从一个文件写到另一个文件（此时用输入流打开已有内容的文件）

             //可以使用如下IOUtils.copyBytes方法。

             //FSDataInputStream in = fs.open(new Path(args[0]));

             //IOUtils.copyBytes(in, out, 4096, true)        //4096为一次复制块大小，true表示复制完成后关闭流

         }  

         public static void ReadFromHDFS(String file) throws IOException

         {

             Configuration conf = new Configuration();

             FileSystem fs = FileSystem.get(URI.create(file), conf);

             Path path = new Path(file);

             FSDataInputStream in = fs.open(path);  

             IOUtils.copyBytes(in, System.out, 4096, true);

             //使用FSDataInoutStream的read方法会将文件内容读取到字节流中并返回

             /**

              * FileStatus stat = fs.getFileStatus(path);

           // create the buffer

            byte[] buffer = new byte[Integer.parseInt(String.valueOf(stat.getLen()))];

            is.readFully(0, buffer);

            is.close();

                  fs.close();

            return buffer;

              */

         }  

         public static void DeleteHDFSFile(String file) throws IOException

         {

             Configuration conf = new Configuration();

             FileSystem fs = FileSystem.get(URI.create(file), conf);

             Path path = new Path(file);

             //查看fs的delete API可以看到三个方法。deleteonExit实在退出JVM时删除，下面的方法是在指定为目录是递归删除

             fs.delete(path,true);

             fs.close();

         }  

         public static void UploadLocalFileHDFS(String src, String dst) throws IOException

         {

             Configuration conf = new Configuration();

             FileSystem fs = FileSystem.get(URI.create(dst), conf);

             Path pathDst = new Path(dst);

             Path pathSrc = new Path(src);  

             fs.copyFromLocalFile(pathSrc, pathDst);

             fs.close();

         }  

         public static void ListDirAll(String DirFile) throws IOException

         {

             Configuration conf = new Configuration();

             FileSystem fs = FileSystem.get(URI.create(DirFile), conf);

             Path path = new Path(DirFile);  

             FileStatus[] status = fs.listStatus(path);

             //方法1

             for(FileStatus f: status)

             {

                 System.out.println(f.getPath().toString());

             }

             //方法2

             Path[] listedPaths = FileUtil.stat2Paths(status);

             for (Path p : listedPaths){

               System.out.println(p.toString());

             }

         }  

         public static void main(String [] args) throws IOException, URISyntaxException

         {

             //下面做的是显示目录下所有文件

             ListDirAll("hdfs://ubuntu:9000/user/kqiao");  

             String fileWrite = "hdfs://ubuntu:9000/user/kqiao/test/FileWrite";

             String words = "This words is to write into file!\n";

             WriteToHDFS(fileWrite, words);

             //这里我们读取fileWrite的内容并显示在终端

             ReadFromHDFS(fileWrite);

             //这里删除上面的fileWrite文件

             DeleteHDFSFile(fileWrite);

             //假设本地有一个uploadFile，这里上传该文件到HDFS

     //      String LocalFile = "file:///home/kqiao/hadoop/MyHadoopCodes/uploadFile";

     //      UploadLocalFileHDFS(LocalFile, fileWrite    );

         }

     }

FSDataOutputStream os = hdfs.create(new Path(args[0]));

注意：在os.flush() 刷新数据流；

有时写入的文件不能立即被其他读者看见，只有大于一个块时其他读者才能看见第一个块，但还是不能看见当前块。可以使用out.sync() 强制所有缓存与数据节点同步。其实在每一个os.close()中隐含了一个sync()的调用。

使用java api操作HDFS文件的更多相关文章

JAVA API 实现hdfs文件操作
java api 实现hdfs 文件操作会出现错误提示: Permission denied: user=hp, access=WRITE, inode="/":hdfs:supe ...
使用Java API操作HDFS文件系统
使用Junit封装HFDS import org.apache.hadoop.conf.Configuration; import org.apache.hadoop.fs.*; import org ...
使用Java Api 操作HDFS
如题我就是一个标题党就是使用JavaApi操作HDFS,使用的是MAVEN,操作的环境是Linux 首先要配置好Maven环境,我使用的是已经有的仓库,如果你下载的jar包速度慢,可以改变Ma ...
Hadoop Java API操作HDFS文件系统（Mac）
1.下载Hadoop的压缩包 tar.gz https://mirrors.tuna.tsinghua.edu.cn/apache/hadoop/common/stable/ 2.关联jar包在 ...
hadoop学习笔记（五）：java api 操作hdfs
HDFS的Java访问接口 1)org.apache.hadoop.fs.FileSystem 是一个通用的文件系统API,提供了不同文件系统的统一访问方式. 2)org.apache.hadoop. ...
java Api 读取HDFS文件内容
package dao; import org.apache.hadoop.conf.Configuration; import org.apache.hadoop.fs.*; import java ...
用java api读取HDFS文件
import java.io.IOException; import java.io.InputStream; import java.security.PrivilegedExceptionActi ...
Hadoop之HDFS（三）HDFS的JAVA API操作
HDFS的JAVA API操作 HDFS 在生产应用中主要是客户端的开发,其核心步骤是从 HDFS 提供的 api中构造一个 HDFS 的访问客户端对象,然后通过该客户端对象操作(增删改查)HDFS ...
HDFS 05 - HDFS 常用的 Java API 操作
目录 0 - 配置 Hadoop 环境(Windows系统) 1 - 导入 Maven 依赖 2 - 常用类介绍 3 - 常见 API 操作 3.1 获取文件系统(重要) 3.2 创建目录.写入文件 ...

随机推荐

安卓逆向之基于Xposed-ZjDroid脱壳
http://bbs.pediy.com/thread-218798.htm 前言之前介绍了普通常见的反编译模式但对于使用了 360加固棒棒爱加密等等的加固应用就没办法了. 你会发现 ...
mysql 拾遗提高(函数、事务、索引)
目录 1.tips 2.事务(transaction) 3.索引(index) 4.数据库的导出和备份 5.函数 6.防SQL注入 7.使用Explain分析SQL语句 8.视图(view) 1.ti ...
21：包含min函数的栈
import java.util.Stack; /** * 面试题21:包含min函数的栈 * 定义栈的数据结构,请在该类型中实现一个能够得到栈最小元素的min函数. */ public class ...
接口调用 POST
/** * 接口调用 POST * @return [type] [description] */ public function portPhone(Request $request) { $pho ...
thinkphp调整框架核心目录think的位置
thinkphp的核心目录即框架文件可以放在项目之外的目录,这点手册上有提到,放在项目之外的地方可以方便其他项目共用一个框架文件. 在入口文件的index.php中,在导入框架目录这一行,可以直接修改 ...
eNSP仿真学习和VLAN配置
路由&交换机基本命令 sys #切换到系统视图(修改配置),Ctrl+Z 返回用户视图 sysname SW1 #设备重命名为SW1 int g0/0/1 #进入接口视图 VLAN配置首先连 ...
初识Spring——Spring核心容器
一. IOC和DI基础 IOC-Inversion of Control,译为控制反转,是一种遵循依赖倒置原则的代码设计思想. 所谓依赖倒置,就是把原本的高层建筑依赖底层建筑“倒置”过来,变成底层建筑 ...
Swift2.0语言教程之函数的返回值与函数类型
Swift2.0语言教程之函数的返回值与函数类型 Swift2.0中函数的返回值根据是否具有返回值,函数可以分为无返回值函数和有返回值函数.以下将会对这两种函数类型进行讲解. Swift2.0中具有 ...
课堂练习—hash
课堂练习-hash 要求: 利用除留余数法为下列关键字集合的存储设计hash函数,并画出分别用开放寻址法和拉链法解决冲突得到的空间存储状态(散列因子取0.75) 关键字集合:85,75,57,60,6 ...
HDU 5715 XOR 游戏二分+字典树
XOR 游戏题目连接: http://acm.hdu.edu.cn/showproblem.php?pid=5715 Description 众所周知,度度熊喜欢XOR运算(XOR百科). 今天,它 ...

使用java api操作HDFS文件

使用java api操作HDFS文件的更多相关文章

随机推荐

热门专题