Hadoop 中的 ArrayWritable
虽然ArrayWritable不是接口,但貌似必须要子类去extends ArrayWritable,不能直接用ArrayWriable
否则会报下面的错误?(不是很确定)
java.lang.Exception: java.lang.RuntimeException: java.lang.NoSuchMethodException: org.apache.hadoop.io.ArrayWritable.<init>()
下面是我自己实现的ArrayWritable,完全是自己摸索的网上看到的几篇感觉都不是很靠谱
这个是为了Reduce输出结果中包含一个list,我研究一个晚上的时间,才把它弄好,结果后来发现标准答案,是用StringBuffer把list中的每个元素一个一个append然后输出的……
这样真的简化了太多的代码,而且实现难度变得低了不少。看来写代码还是要多动脑子。
不过唯一的好处是研究了一下ArrayWritable的源码,同时自己实现了这个父类,也算是有所收获
import org.apache.hadoop.io.ArrayWritable;
import org.apache.hadoop.io.Text;
import org.apache.hadoop.io.WritableFactories;
/**
* 自己实现ArrayWritable类,直接用好像会出问题
* @author wmxl
*
*/
class TextArrayWritable extends ArrayWritable { //父类其实有一个private的value,可以直接用那个,具体看ArrayWritable源码
private Text[] myValue = new Text[0]; public Text[] getMyValue() { return myValue;
} public void setMyValue(Text[] myValue) {
this.myValue = myValue;
} //这两个构造方法一定要实现TextArrayWritable() 和 TextArrayWritable(String[] strings) 而且里面要写super(Text.class)
public TextArrayWritable() {
super(Text.class);
} public TextArrayWritable(String[] strings) { super(Text.class);
Text[] texts = new Text[strings.length]; for (int i = 0; i < strings.length; i++) {
texts[i] = new Text(strings[i]);
}
// set(texts); //这个是set父类的value
setMyValue(texts);
} @Override
public void readFields(DataInput in) throws IOException { //这两个方法都是copy父类的,稍作改动,看的不是很懂
myValue = new Text[in.readInt()]; // construct values
for (int i = 0; i < myValue.length; i++) {
Text value = (Text) WritableFactories.newInstance(Text.class);
value.readFields(in); // read a value
myValue[i] = value; // store it in values
}
} @Override
public void write(DataOutput out) throws IOException { //同上
out.writeInt(myValue.length); // write values
for (int i = 0; i < myValue.length; i++) {
myValue[i].write(out);
}
} /**
* 重写这个方法,让最后write文件中的结果是你想要的样子
*/
@Override
public String toString() { StringBuffer result = new StringBuffer(); for(int i =0; i < this.getMyValue().length; i++){
if(i == this.getMyValue().length -1)
result.append(this.getMyValue()[i].toString());
else
result.append(this.getMyValue()[i].toString()).append(",");
} return result.toString();
} public void add(String friend){
int len = getMyValue().length;
Text[] newValue = new Text[len + 1];
for(int i = 0; i < len + 1; i++){
if(i < len)
newValue[i] = getMyValue()[i];
else
newValue[i] = new Text(friend);
} myValue = newValue;
}
/**
* 自己写的添加元素方法
* @param friend
*/
public void add(Text friend){
int len = getMyValue().length;
Text[] newValue = new Text[len + 1];
for(int i = 0; i < len + 1; i++){
if(i < len)
newValue[i] = getMyValue()[i];
else
newValue[i] = new Text(friend);
} myValue = newValue;
}
}
参考了这篇文章:https://www.cnblogs.com/yancey/p/3946513.html
Hadoop 中的 ArrayWritable的更多相关文章
- Hadoop 中利用 mapreduce 读写 mysql 数据
Hadoop 中利用 mapreduce 读写 mysql 数据 有时候我们在项目中会遇到输入结果集很大,但是输出结果很小,比如一些 pv.uv 数据,然后为了实时查询的需求,或者一些 OLAP ...
- Hadoop中客户端和服务器端的方法调用过程
1.Java动态代理实例 Java 动态代理一个简单的demo:(用以对比Hadoop中的动态代理) Hello接口: public interface Hello { void sayHello(S ...
- [转] - hadoop中使用lzo的压缩
在hadoop中使用lzo的压缩算法可以减小数据的大小和数据的磁盘读写时间,不仅如此,lzo是基于block分块的,这样他就允许数据被分解成chunk,并行的被hadoop处理.这样的特点,就可以让l ...
- Hadoop中WritableComparable 和 comparator
1.WritableComparable 查看HadoopAPI,如图所示: WritableComparable继承自Writable和java.lang.Comparable接口,是一个Writa ...
- hadoop中常见元素的解释
secondarynamenode 图: secondarynamenode根据文件的的大小对namenode的编辑日志和镜像日志 进行合并. 光从字面上来理解,很容易让一些初学者先入为主的认为:Se ...
- Hadoop中常用的InputFormat、OutputFormat(转)
Hadoop中的Map Reduce框架依赖InputFormat提供数据,依赖OutputFormat输出数据,每一个Map Reduce程序都离不开它们.Hadoop提供了一系列InputForm ...
- hadoop中Text类 与 java中String类的区别
hadoop 中 的Text类与java中的String类感觉上用法是相似的,但两者在编码格式和访问方式上还是有些差别的,要说明这个问题,首先得了解几个概念: 字符集: 是一个系统支持的所有抽象字符的 ...
- hadoop 中对Vlong 和 Vint的压缩方法
hadoop 中对java的基本类型进行了writeable的封装,并且所有这些writeable都是继承自WritableComparable的,都是可比较的:并且,它们都有对应的get() 和 s ...
- Hadoop中两表JOIN的处理方法(转)
1. 概述 在传统数据库(如:MYSQL)中,JOIN操作是非常常见且非常耗时的.而在HADOOP中进行JOIN操作,同样常见且耗时,由于Hadoop的独特设计思想,当进行JOIN操作时,有一些特殊的 ...
随机推荐
- JAVA向EXE文件尾追加配置信息,用于解决局版客户端的程序IP配置问题
package com.demo.blog; import java.io.DataOutputStream;import java.io.File;import java.io.FileOutput ...
- 漂亮的弹窗口插件——sweetAlert的使用
想必你已经受够了单调的alert弹窗吧? 为了更好的用户体验性,现在介绍一款漂亮的弹窗口插件——sweetAlert,现在就来介绍它的使用 1.首先在官网下载它的CSS和JavaScript文件:ht ...
- bzoj2440(莫比乌斯函数)
bzoj2440 题意 求第 k 个不是完全平方数(除 1 以外)的正倍数的数. 分析 利用二分法求解,二分 x ,判断 x 是否是第 k 个数即可,那么我们就要计算 [1, x] 有几个符合条件的数 ...
- Tarjan缩点【p1726】上白泽慧音
Description 在幻想乡,上白泽慧音是以知识渊博闻名的老师.春雪异变导致人间之里的很多道路都被大雪堵塞,使有的学生不能顺利地到达慧音所在的村庄.因此慧音决定换一个能够聚集最多人数的村庄作为新的 ...
- Xamarin XAML语言教程使用Progress属性数据绑定设置进度条进度
Xamarin XAML语言教程使用Progress属性数据绑定设置进度条进度 开发者除了可以为ProgressBar定义的Progress属性直接赋双精度类型的值外,还可以通过数据绑定的方式为该属性 ...
- Bluetooth篇 开发实例之十一 官网的Bluetooth Chat sample的bug
当没有匹配的设备和没有找到可用设备的时候. // If there are paired devices, add each one to the ArrayAdapter if (pairedDev ...
- 程序编译时书写Makefile注意事项一例
在进行程序编译时,可能需要指定一些库的库的路径.头文件的路径,分别使用的参数选项是-L和-I,需要注意的是: 需要确保-L和-I后边的内容不为空,否则会出现意想不到的错误,而这种错误比较难以发现,引起 ...
- Debian 安装Linux源码
参考: http://blog.chinaunix.net/uid-20683355-id-1895778.html http://www.linuxdiyf.com/viewarticle.php? ...
- 咏南3层数据集控件--TYNDataSet
咏南3层数据集控件--TYNDataSet 和2层CS数据集的语法非常近似.有了这个控件,学习掌握3层开发变得如此地简单. 新增数据: procedure Tfunit.btnappendClick( ...
- 重要的ui组件——Behavior
v7包下的组件类似CoordinatorLayout推出也有一段时间了,大家使用的时候应该会体会到其中很多的便利,今天这篇文章带大家来了解一个比较重要的ui组件——Behavior.从字面意思上就可以 ...