hadoop2.2.0 MapReduce求和并排序

javabean必须实现WritableComparable接口，并实现该接口的序列化，反序列话和比较方法

package com.my.hadoop.mapreduce.sort;

import java.io.DataInput;
import java.io.DataOutput;
import java.io.IOException;

import org.apache.hadoop.io.WritableComparable;

public class InfoBean implements WritableComparable<InfoBean> {

   private String account;
   private double income;
   private double expences;
   private double surplus;

public void set(String account, double income, double expences){
       this.account = account;
       this.income = income;
       this.expences = expences;
       this.surplus = income - expences;
   }

   @Override
   public String toString() {
       return income+"\t"+expences+"\t"+surplus;
   }

@Override
   public void readFields(DataInput in) throws IOException {
       this.account = in.readUTF();
       this.income = in.readDouble();
       this.expences = in.readDouble();
       this.surplus = in.readDouble();
   }

@Override
   public void write(DataOutput out) throws IOException {
       out.writeUTF(this.account);
       out.writeDouble(this.income);
       out.writeDouble(this.expences);
       out.writeDouble(this.surplus);
   }

@Override
   public int compareTo(InfoBean o) {
       if (this.income == o.getIncome()) {
           return this.expences > o.getExpences() ? 1 : -1;
       } else {
           return this.income > o.getIncome() ? -1 : 1;
       }
   }

public String getAccount() {
return account;
}

public void setAccount(String account) {
this.account = account;
}

public double getIncome() {
return income;
}

public void setIncome(double income) {
this.income = income;
}

public double getExpences() {
return expences;
}

public void setExpences(double expences) {
this.expences = expences;
}

public double getSurplus() {
return surplus;
}

public void setSurplus(double surplus) {
this.surplus = surplus;
}

}

先求和

package com.my.hadoop.mapreduce.sort;

import org.apache.hadoop.conf.Configuration;
import org.apache.hadoop.fs.Path;
import org.apache.hadoop.io.LongWritable;
import org.apache.hadoop.io.Text;
import org.apache.hadoop.mapreduce.Job;
import org.apache.hadoop.mapreduce.Mapper;
import org.apache.hadoop.mapreduce.Reducer;
import org.apache.hadoop.mapreduce.lib.input.FileInputFormat;
import org.apache.hadoop.mapreduce.lib.output.FileOutputFormat;

public class SumStep {

public static class SumMap extends Mapper<LongWritable, Text, Text, InfoBean>{
       private Text k = new Text();
       private InfoBean v = new InfoBean();

       @Override
       public void map(LongWritable key, Text value, Context context) throws java.io.IOException ,InterruptedException {
           String[] fields = value.toString().split("\t");
           String account = fields[0];
           double in = Double.parseDouble(fields[1]);
           double out = Double.parseDouble(fields[2]);
           k.set(account);
           v.set(account, in, out);
           context.write(k, v);
       }
   }

   public static class SumReduce extends Reducer<Text, InfoBean, Text, InfoBean>{
       private InfoBean v = new InfoBean();

       @Override
       public void reduce(Text key, Iterable<InfoBean> value, Context context) throws java.io.IOException ,InterruptedException {
           double in_sum = 0;
           double out_sum = 0;
           for (InfoBean bean : value) {
               in_sum += bean.getIncome();
               out_sum += bean.getExpences();
           }
           v.set("", in_sum, out_sum);
           context.write(key, v);
       }
   }

   public static void main(String[] args) throws Exception {
       Configuration conf = new Configuration();
       Job job = Job.getInstance(conf, SumStep.class.getSimpleName());
       job.setJarByClass(SumStep.class);

       FileInputFormat.setInputPaths(job, new Path(args[0]));
       job.setMapperClass(SumMap.class);
       job.setMapOutputKeyClass(Text.class);
       job.setMapOutputValueClass(InfoBean.class);

       job.setReducerClass(SumReduce.class);
       job.setOutputKeyClass(Text.class);
       job.setOutputValueClass(InfoBean.class);
       FileOutputFormat.setOutputPath(job, new Path(args[1]));

       System.exit(job.waitForCompletion(true) ? 0 :1);

   }

}

后排序

package com.my.hadoop.mapreduce.sort;

import org.apache.hadoop.conf.Configuration;
import org.apache.hadoop.fs.Path;
import org.apache.hadoop.io.LongWritable;
import org.apache.hadoop.io.NullWritable;
import org.apache.hadoop.io.Text;
import org.apache.hadoop.mapreduce.Job;
import org.apache.hadoop.mapreduce.Mapper;
import org.apache.hadoop.mapreduce.Reducer;
import org.apache.hadoop.mapreduce.lib.input.FileInputFormat;
import org.apache.hadoop.mapreduce.lib.output.FileOutputFormat;

public class SortStep {

public static class SortMap extends Mapper<LongWritable, Text, InfoBean, NullWritable>{
       private InfoBean k = new InfoBean();

       @Override
       public void map(LongWritable key, Text value, Context context) throws java.io.IOException ,InterruptedException {
           System.out.println("===="+value.toString()+"====");
           String[] fields = value.toString().split("\t");
           String account = fields[0];
           double in = Double.parseDouble(fields[1]);
           double out = Double.parseDouble(fields[2]);
           k.set(account, in, out);
           context.write(k, NullWritable.get());
       }
   }

   public static class SortReduce extends Reducer<InfoBean, NullWritable, Text, InfoBean>{
       private Text k = new Text();

       @Override
       public void reduce(InfoBean bean, Iterable<NullWritable> value, Context context) throws java.io.IOException ,InterruptedException {
           k.set(bean.getAccount());
           context.write(k, bean);
       }
   }

   public static void main(String[] args) throws Exception {
       Configuration conf = new Configuration();
       Job job = Job.getInstance(conf, SortStep.class.getSimpleName());
       job.setJarByClass(SortStep.class);

       FileInputFormat.setInputPaths(job, new Path(args[0]));
       job.setMapperClass(SortMap.class);
       job.setMapOutputKeyClass(InfoBean.class);
       job.setMapOutputValueClass(NullWritable.class);

       job.setReducerClass(SortReduce.class);
       job.setOutputKeyClass(Text.class);
       job.setOutputValueClass(InfoBean.class);
       FileOutputFormat.setOutputPath(job, new Path(args[1]));

       System.exit(job.waitForCompletion(true) ? 0 :1);

   }

}

hadoop2.2.0 MapReduce求和并排序的更多相关文章

hadoop2.2.0 MapReduce分区
package com.my.hadoop.mapreduce.partition; import java.util.HashMap;import java.util.Map; import org ...
hadoop2.2.0 MapReduce的序列化
package com.my.hadoop.mapreduce.dataformat; import java.io.DataInput;import java.io.DataOutput;impor ...
【hadoop2.6.0】用C++ 编写mapreduce
hadoop通过hadoop streaming 来实现用非Java语言写的mapreduce代码. 对于一个一点Java都不会的我来说,这真是个天大的好消息. 官网上hadoop streaming ...
一脸懵逼学习Hadoop中的序列化机制——流量求和统计MapReduce的程序开发案例——流量求和统计排序
一:序列化概念序列化(Serialization)是指把结构化对象转化为字节流.反序列化(Deserialization)是序列化的逆过程.即把字节流转回结构化对象.Java序列化(java.io. ...
国内最全最详细的hadoop2.2.0集群的MapReduce的最简单配置
简介 hadoop2的中的MapReduce不再是hadoop1中的结构已经没有了JobTracker,而是分解成ResourceManager和ApplicationMaster.这次大变革被称为M ...
编写简单的Mapreduce程序并部署在Hadoop2.2.0上运行
今天主要来说说怎么在Hadoop2.2.0分布式上面运行写好的 Mapreduce 程序. 可以在eclipse写好程序,export或用fatjar打包成jar文件. 先给出这个程序所依赖的Mave ...
Hadoop2.2.0 第一步完成MapReduce wordcount计算文本数量
1.完成Hadoop2.2.0单机版环境搭建之后需要利用一个例子程序来检验hadoop2 的mapreduce的功能 //启动hdfs和yarn sbin/start-dfs.sh sbin/star ...
使用命令行编译打包运行自己的MapReduce程序 Hadoop2.6.0
使用命令行编译打包运行自己的MapReduce程序 Hadoop2.6.0 网上的 MapReduce WordCount 教程对于如何编译 WordCount.java 几乎是一笔带过… 而有写到的 ...
Eclipse中部署hadoop2.3.0
1 eclipse中hadoop环境部署概览 eclipse 中部署hadoop包括两大部分:hdfs环境部署和mapreduce任务执行环境部署.一般hdfs环境部署比较简单,部署后就可以在ecl ...

随机推荐

Java 异常处理的误区和经验总结--转载
本文着重介绍了 Java 异常选择和使用中的一些误区,希望各位读者能够熟练掌握异常处理的一些注意点和原则,注意总结和归纳.只有处理好了异常,才能提升开发人员的基本素养,提高系统的健壮性,提升用户体验, ...
IntelliJIdea快捷键
Ctrl+Shift+方向键Up/Down 代码向上/下移动. Ctrl+X 删除行 Ctrl+Y 也是删除行,不知道有啥区别 Ctrl+D 复制行 Ctrl+Alt+L 格式化代码 Ctrl+N 查 ...
hdu 2203
题意: 子串问题水题,只要把母串*2,然后比较...... 感觉我好懒....没有自己写函数...... 反正我不是勤快的人......... AC代码: #include <iostream ...
solr官方文档翻译系列之schema.xml配置介绍
常见的元素 <field name="weight" type="float" indexed="true" stored=" ...
.NET中删除空白字符串的10大方法
介绍我们有无数方法可用于删除字符串中的所有空白.大部分都能够在绝大多数的用例中很好工作,但在某些对时间敏感的应用程序中,是否采用最快的方法可能就会造成天壤之别. 如果你问空白是什么,那说起来还真是有 ...
关于ISAPI和CGI限制，这个要设为允许
否则程序就报这个错误,注意,设置允许时不是在添加的网站上设置,而是在根iis,选择后右侧出现关于ISAPI和CGI限制,进去后选择相应版本,设置为允许就可以了
java BigDecimal的操作
今天给大家讲一下java中BigDecimal的操作.由于double,float的精度不够,因此在进行商业计算的时候要使用的BigDecimal.BigDecimal对象创建如下: BigDecim ...
checking for oracle home incompatibilities failed
安装Oracle软件的过程中,报错: 出错原因: 这个错误主要是oracle上一次安装失败,而没有删除干净而留下的目录文件造成. 解决办法: 清除原先目录下的文件,再retry或者重新安装即可. 示例 ...
protocol buffer介绍(protobuf)
一.理论概述0.参考资料入门资料:https://developers.google.com/protocol-buffers/docs/javatutorial更详细的资料:For more det ...
SpringMVC 文件上传配置，多文件上传，使用的MultipartFile（转）
文件上传项目的源码下载地址:http://download.csdn.net/detail/swingpyzf/6979915 一.配置文件:SpringMVC 用的是的MultipartFil ...

hadoop2.2.0 MapReduce求和并排序

hadoop2.2.0 MapReduce求和并排序的更多相关文章

随机推荐

热门专题