1. Configuration :public 类型接口,这个接口包含的多数方法是进行与数据属性<key,value>有关的操作. 几个方法: 1)addProperty(String key, Object value): Add a property to configuration 2)setProperty(String key, Object value): Set a property 3)clear(): remove all properties from the confi…
Hadoop中有一套Writable实现可以满足大部分需求,但是在有些情况下,我们需要根据自己的需要构造一个新的实现,有了定制的Writable,我们就可以完全控制二进制表示和排序顺序. 为了演示如何新建一个定制的writable类型,我们需要写一个表示一对字符串的实现: blic class TextPair implements WritableComparable<TextPair> { private Text first; private Text second; public Te…
在前面的博文<Hadoop中WritableComparable 和 comparator>中,对于WritableComparator说的不够细致,下面说说具体的实现原理! 1.WritableComparator主要提供了两个功能: 提供了对原始compara()方法的一个默认实现,默认实现是先反序列化成对象,在对对象进行比较 public int compare(byte[] b1, int s1, int l1, byte[] b2, int s2, int l2) { try { b…