hadoop的dfs工具类一个【原创】
开始没搞定插件问题,就弄了个dsf操作类,后面搞定了插件问题,这玩意也就聊胜于无了,还是丢这里算了。
首先是一个配置,ztool.hadoop.properties
hadoop.home.dir=G:/hadoop/hadoop-2.4.1
hadoop.user.name=hadoop hadoop.server.ip=192.168.117.128
hadoop.server.hdfs.port=9000
前面两个属性后面代码会有说明的。
属性文件的读取,方法多了,一般用commons-configuration包,我是自己把这个再整了一次,加了些自动处理,这个代码中可以无视,直接把代码中的那部分改成普通引用就好了。
logger部分,用了logback,也是处理了一下,处理了其在linux下会莫名其妙找不到配置文件的问题。这里就不放出代码了,直接把代码中的那部分改成普通引用就好了,我就不改了。
工具类代码如下
package com.cnblogs.zxub.hadoop.dfs; import java.io.IOException;
import java.net.URI; import org.apache.commons.configuration.PropertiesConfiguration;
import org.apache.hadoop.conf.Configuration;
import org.apache.hadoop.fs.FSDataInputStream;
import org.apache.hadoop.fs.FSDataOutputStream;
import org.apache.hadoop.fs.FileStatus;
import org.apache.hadoop.fs.FileSystem;
import org.apache.hadoop.fs.Path;
import org.apache.hadoop.io.IOUtils;
import org.apache.hadoop.mapred.JobConf;
import org.slf4j.Logger; import com.cnblogs.zxub.util.logger.ZLoggerFactory;
import com.cnblogs.zxub.util.properties.PropertiesLoader; public class DfsUtil { private static final Logger logger = ZLoggerFactory
.getLogger(DfsUtil.class); private final PropertiesConfiguration props = PropertiesLoader
.getConfiguration("ztool.hadoop");
private Configuration config = null;
private String hdfsPath = null; private String baseDir = null; public DfsUtil(String hdfs, Configuration config) {
// windows下设置HADOOP_HOME后,还可能找不到winutils.exe,直接自己写进去程序算了
System.setProperty("hadoop.home.dir",
this.props.getString("hadoop.home.dir"));
// 设置与dfs服务通信的用户名,省得换当前用户名,也不改配置关闭权限控制了
System.setProperty("HADOOP_USER_NAME",
this.props.getString("hadoop.user.name"));
this.hdfsPath = (hdfs == null) ? "hdfs://"
+ this.props.getString("hadoop.server.ip") + ":"
+ this.props.getString("hadoop.server.hdfs.port") + "/" : hdfs;
if (config == null) {
JobConf conf = new JobConf(DfsUtil.class);
conf.setJobName("HdfsDAO");
config = conf;
}
this.config = config;
} public DfsUtil(Configuration conf) {
this(null, conf);
} public DfsUtil() {
this(null, null);
} public String getBaseDir() {
return this.baseDir;
} public void setBaseDir(String baseDir) {
this.baseDir = baseDir;
} public String getHdfsPath() {
return this.hdfsPath;
} public Configuration getConfig() {
return this.config;
} private String standardPath(String path) {
if (this.baseDir == null) {
this.baseDir = "/";
}
if (this.baseDir.indexOf("/") != 0) {
this.baseDir = "/" + this.baseDir;
}
if (this.baseDir.lastIndexOf("/") == this.baseDir.length() - 1) {
this.baseDir = this.baseDir.replaceFirst("/$", "");
}
if (path.indexOf("/") != 0) {
path = "/" + path;
}
path = this.baseDir + path;
if (path.lastIndexOf("/") == path.length() - 1) {
path = path.replaceFirst("/$", "");
}
if (path.isEmpty()) {
path = "/";
}
return path;
} public void ll(String folder) throws IOException {
folder = this.standardPath(folder);
Path path = new Path(folder);
FileSystem fs = FileSystem.get(URI.create(this.getHdfsPath()),
this.getConfig());
FileStatus[] list = fs.listStatus(path);
System.out.println("ll: " + folder);
for (FileStatus f : list) {
System.out.printf("name: %s, folder: %s, size: %d\n", f.getPath(),
f.isDirectory(), f.getLen());
}
fs.close();
} public void mkdirs(String folder) throws IOException {
folder = this.standardPath(folder);
Path path = new Path(folder);
FileSystem fs = FileSystem.get(URI.create(this.getHdfsPath()),
this.getConfig());
if (!fs.exists(path)) {
fs.mkdirs(path);
logger.info("create: {}.", folder);
} else {
logger.warn("folder [{}] already exists, mkdirs failed.", folder);
}
fs.close();
} public void rm(String file) throws IOException {
file = this.standardPath(file);
Path path = new Path(file);
FileSystem fs = FileSystem.get(URI.create(this.getHdfsPath()),
this.getConfig());
fs.deleteOnExit(path);
logger.info("delete: {}.", file);
fs.close();
} public void newFile(String file, String content) throws IOException {
file = this.standardPath(file);
FileSystem fs = FileSystem.get(URI.create(this.getHdfsPath()),
this.getConfig());
byte[] buff = content.getBytes();
FSDataOutputStream os = null;
try {
os = fs.create(new Path(file));
os.write(buff, 0, buff.length);
logger.info("create: {}.", file);
} finally {
if (os != null) {
os.close();
}
}
fs.close();
} public void scp(String local, String remote) throws IOException {
remote = this.standardPath(remote);
FileSystem fs = FileSystem.get(URI.create(this.getHdfsPath()),
this.getConfig());
fs.copyFromLocalFile(new Path(local), new Path(remote));
logger.info("copy: from [{}] to [{}]", local, remote);
fs.close();
} public void download(String remote, String local) throws IOException {
remote = this.standardPath(remote);
Path path = new Path(remote);
FileSystem fs = FileSystem.get(URI.create(this.getHdfsPath()),
this.getConfig());
fs.copyToLocalFile(path, new Path(local));
logger.info("download: from [{}] to [{}]", remote, local);
fs.close();
} public void cat(String remote) throws IOException {
remote = this.standardPath(remote);
Path path = new Path(remote);
FileSystem fs = FileSystem.get(URI.create(this.getHdfsPath()),
this.getConfig());
FSDataInputStream fsdis = null;
System.out.println("cat: " + remote);
try {
fsdis = fs.open(path);
IOUtils.copyBytes(fsdis, System.out, 4096, false);
} finally {
IOUtils.closeStream(fsdis);
fs.close();
}
} public static void main(String[] args) throws IOException {
DfsUtil hdfs = new DfsUtil();
// hdfs.setBaseDir("/test");
// hdfs.mkdirs("/debug_in");
// hdfs.newFile("/test.txt", "测试");
// hdfs.rm("/test.txt");
// hdfs.rm("/test");
// hdfs.scp("c:/q.txt", "/");
hdfs.ll("/");
// hdfs.download("/test.txt", "c:/t.txt");
// hdfs.cat("q.txt");
// hdfs.scp("c:/din/f1.txt", "debug_in");
// hdfs.scp("c:/din/f2.txt", "debug_in");
}
}
hadoop的dfs工具类一个【原创】的更多相关文章
- 基于AFNetworking封装的网络请求工具类【原创】
今天给大家共享一个我自己封装的网络请求类,希望能帮助到大家. 前提,导入AFNetworking框架, 关于修改AFN源码:通常序列化时做对text/plan等的支持时,可以一劳永逸的修改源代码,在a ...
- Log 日志工具类 保存到文件 MD
Markdown版本笔记 我的GitHub首页 我的博客 我的微信 我的邮箱 MyAndroidBlogs baiqiantao baiqiantao bqt20094 baiqiantao@sina ...
- UIViewAdditions(一个非常方便的工具类用它)
我们在project在,改变或多或少控件的坐标-宽度-高度,然后,经常看到你的self.view.frame.origin.x,self.view.frame.size.width.........相 ...
- Android 分享一个SharedPreferences的工具类,方便保存数据
我们平常保存一些数据,都会用到SharedPreferences,他是保存在手机里面的,具体路径是data/data/你的包名/shared_prefs/保存的文件名.xml, SharedPrefe ...
- JDBC的增删改写成一个方法,调用一个工具类
package com.hx.jdbc.connection; import java.sql.Connection; import java.sql.Statement; import com.my ...
- [分享]一个String工具类,也许你的项目中会用得到
每次做项目都会遇到字符串的处理,每次都会去写一个StringUtil,完成一些功能. 但其实每次要的功能都差不多: 1.判断类(包括NULL和空串.是否是空白字符串等) 2.默认值 3.去空白(tri ...
- java中使用反射做一个工具类,来为指定类中的成员变量进行赋值操作,使用与多个类对象的成员变量的赋值。
//------------------------------------------------我是代码的分割线 // 首选是一个工具类,在该工具类里面,定义了一个方法,public void s ...
- 封装一个简单好用的打印Log的工具类And快速开发系列 10个常用工具类
快速开发系列 10个常用工具类 http://blog.csdn.net/lmj623565791/article/details/38965311 ------------------------- ...
- 自己用反射写的一个request.getParameter工具类
适用范围:当我们在jsp页面需要接收很多值的时候,如果用request.getParameter(属性名)一个一个写的话那就太麻烦了,于是我想是 否能用反射写个工具类来简化这样的代码,经过1个小时的代 ...
随机推荐
- 实验六 序列信号检测器的VHDL设计
一.实验目的 (1)进一步熟悉Quartus II软件和GW48-PK2S实验系统的使用方法: (2)用状态机实现序列检测器的设计,了解一般状态机的设计与应用 二.实验内容 1. 基本命题 利用Qua ...
- IIS7 配置
1.配置应用程序池->高级设置 (1) .net Framework版本 :V4.0 (2)启用32位应用程序 :True (3)特定时间: 上班之前,下班之后 2.网站配置->高级设置 ...
- 微软发布手机版 Sample Browser。7000多示例代码一手掌握
今天早上,Sample Browser发布其全新的Windows Phone版本.至此,自2012年相继推出Desktop版.Visual Studio版,以及2013年推出Windows Store ...
- 使用grunt打包ueditor源代码
支持版本支持 UEditor 1.3.0+ 的版本 使用方法1.线上下载ueditor下载地址:ueditor,要下载"完整版 + 源码" 2.安装nodejs下载nodejs并安 ...
- Linux下的NFS配置(转)
http://rubyer.me/blog/1682/ 遇到的问题: 1.reason given by server: Permission denied 在服务器的/etc/export配置文件中 ...
- Atitit.dwr3 不能显示错误详细信息的解决方案,控件显示错误详细信息的解决方案 java .net php
Atitit.dwr3 不能显示错误详细信息的解决方案,控件显示错误详细信息的解决方案 java .net php 1. Keyword/subtitle 1 2. 使用dwr3的异常convert处 ...
- 适合于小团队产品迭代的APP测试流程
一.测试周期 测试周期一般为2~3天,根据项目情况以及版本质量可适当缩短或延长测试时间.正式测试前先向主管或产品经理确认项目排期. 二.测试资源 测试任务开始前,检查各项测试资源. 产品功能需求文档. ...
- 题目一:一张纸的厚度大约是0.08mm,对折多少次之后能达到珠穆朗玛峰的高度(8848.13米)?
题目一:一张纸的厚度大约是0.08mm,对折多少次之后能达到珠穆朗玛峰的高度(8848.13米)? //一张纸的厚度大约是0.08mm,对折多少次之后能达到珠穆朗玛峰的高度(8848.13米 doub ...
- javascript设计模式与开发实践阅读笔记(7)——迭代器模式
迭代器模式:指提供一种方法顺序访问一个聚合对象中的各个元素,而又不需要暴露该对象的内部表示. 迭代器模式可以把迭代的过程从业务逻辑中分离出来,在使用迭代器模式之后,即使不关心对象的内部构造,也可以按顺 ...
- C#中的串口通信
关于串行接口 串行接口(Serial port)又称“串口”,主要用于串行式逐位数据传输.常见的有一般电脑应用的RS-232(使用 25 针或 9 针连接器)和工业电脑应用的半双工RS-485与全双工 ...