Hadoop 学习笔记（十一） MapReduce 求平均成绩

china：
张三 78
李四 89
王五 96
赵六 67
english
张三 80
李四 82
王五    84
赵六 86
math
张三 88
李四 99
王五 66
赵六 77

import java.io.IOException;

import org.apache.hadoop.conf.Configuration;

import org.apache.hadoop.fs.Path;

import org.apache.hadoop.io.IntWritable;

import org.apache.hadoop.io.FloatWritable;

import org.apache.hadoop.io.Text;

import org.apache.hadoop.mapreduce.Job;

import org.apache.hadoop.mapreduce.Mapper;

import org.apache.hadoop.mapreduce.Reducer;

import org.apache.hadoop.mapreduce.lib.input.FileInputFormat;

import org.apache.hadoop.mapreduce.lib.input.TextInputFormat;

import org.apache.hadoop.mapreduce.lib.output.FileOutputFormat;

import org.apache.hadoop.mapreduce.lib.reduce.IntSumReducer;

public class MyAverage {

    public static class FormatMapper extends Mapper<Object, Text, Text, IntWritable>{

        private IntWritable val = new IntWritable();

        public void map(Object key, Text value, Context context) throws IOException, InterruptedException{

            String line[] = value.toString().split("\\s");

            val.set(Integer.parseInt(line[]));

            context.write(new Text(line[]), val);

        }

    }

    public static class AverageReducer extends Reducer<Text, IntWritable, Text, FloatWritable>{

        public void reduce(Text key, Iterable<IntWritable> values, Context context) throws IOException, InterruptedException{

            int count = ;

            int sum = ;

            for (IntWritable val : values) {

                sum += val.get();

                count ++;

            }

            float ave = (float)sum / count;

            context.write(key, new FloatWritable(ave));

        }

    }

    public static void main(String[] args) throws Exception {

        String dir_in = "hdfs://localhost:9000/in_average";

        String dir_out = "hdfs://localhost:9000/out_average";

        Path in = new Path(dir_in);

        Path out = new Path(dir_out);

        Configuration conf = new Configuration();

        Job averageJob = new Job(conf, "my_average");

        averageJob.setJarByClass(MyAverage.class);

        averageJob.setInputFormatClass(TextInputFormat.class);

        averageJob.setMapperClass(FormatMapper.class);

        averageJob.setCombinerClass(IntSumReducer.class);

        //countJob.setPartitionerClass(HashPartitioner.class);

        averageJob.setMapOutputKeyClass(Text.class);

        averageJob.setMapOutputValueClass(IntWritable.class);

        FileInputFormat.addInputPath(averageJob, in);

        averageJob.setReducerClass(AverageReducer.class);

        //averageJob.setNumReduceTasks(1);

        averageJob.setOutputKeyClass(Text.class);

        averageJob.setOutputValueClass(FloatWritable.class);

        //countJob.setOutputFormatClass(SequenceFileOutputFormat.class);

        FileOutputFormat.setOutputPath(averageJob, out);

        averageJob.waitForCompletion(true);

    }

}

张三    82.0

李四    90.0

王五    82.0

赵六    76.666664

Hadoop 学习笔记（十一） MapReduce 求平均成绩的更多相关文章

hadoop 学习笔记：mapreduce框架详解
开始聊mapreduce,mapreduce是hadoop的计算框架,我学hadoop是从hive开始入手,再到hdfs,当我学习hdfs时候,就感觉到hdfs和mapreduce关系的紧密.这个可能 ...
Hadoop学习笔记：MapReduce框架详解
开始聊mapreduce,mapreduce是hadoop的计算框架,我学hadoop是从hive开始入手,再到hdfs,当我学习hdfs时候,就感觉到hdfs和mapreduce关系的紧密.这个可能 ...
【Big Data - Hadoop - MapReduce】hadoop 学习笔记：MapReduce框架详解
开始聊MapReduce,MapReduce是Hadoop的计算框架,我学Hadoop是从Hive开始入手,再到hdfs,当我学习hdfs时候,就感觉到hdfs和mapreduce关系的紧密.这个可能 ...
hadoop 学习笔记：mapreduce框架详解(转)
原文:http://www.cnblogs.com/sharpxiajun/p/3151395.html(有删减) Mapreduce运行机制下面我贴出几张图,这些图都是我在百度图片里找到的比较好的 ...
Hadoop学习笔记—11.MapReduce中的排序和分组
一.写在之前的 1.1 回顾Map阶段四大步骤首先,我们回顾一下在MapReduce中,排序和分组在哪里被执行: 从上图中可以清楚地看出,在Step1.4也就是第四步中,需要对不同分区中的数据进行排 ...
Hadoop学习笔记—12.MapReduce中的常见算法
一.MapReduce中有哪些常见算法 (1)经典之王:单词计数这个是MapReduce的经典案例,经典的不能再经典了! (2)数据去重 "数据去重"主要是为了掌握和利用并行化思 ...
Hadoop学习笔记： MapReduce二次排序
本文给出一个实现MapReduce二次排序的例子 package SortTest; import java.io.DataInput; import java.io.DataOutput; impo ...
Hadoop学习笔记： MapReduce Java编程简介
概述本文主要基于Hadoop 1.0.0后推出的新Java API为例介绍MapReduce的Java编程模型.新旧API主要区别在于新API(org.apache.hadoop.mapreduce ...
三、Hadoop学习笔记————从MapReduce到Yarn
Yarn减轻了JobTracker的负担,对其进行了解耦

随机推荐

linux进程间通讯-System V IPC 信号量
进程间通信的机制--信号量.注意请不要把它与之前所说的信号混淆起来,信号与信号量是不同的两种事物.有关信号的很多其它内容,能够阅读我的还有一篇文章:Linux进程间通信--使用信号.以下就进入信号量的 ...
再次轻度破解EXE文件
在经历股市多年的大起大落.大赚大赔之后.痛定思痛.深切感到在金融市场拼搏.必须建立健全交易纪律守则,严格运行. 这套完整的纪律守则,就是"交易系统". 在很多方面,它与一般的专家系 ...
Ⅱ.AngularJS的点点滴滴--缓存
模板缓存-$templateCache and 缓存工厂 $cacheFactory 1.使用script标签 <html ng-app> <script src="htt ...
RedHat7笔记
第一章管理网络查看网络信息显示网卡状态# nmcli dev status列出所有连接# nmcli con show只列出可用连接# nmcli con show --active显示网卡配 ...
wget下载网站整个目录
wget -r -p -np -k -P ./data/ http://example.com/eg/ 具体参数: -P 表示下载到哪个目录 -r 表示递归下载 -np 表示不下载旁站连接 -k 表示 ...
dhcp源码编译支持4G上网卡
1. tar xvzf dhcp-4.2.5-P1.tar.gz 2. ./configure --host=arm-linux ac_cv_file__dev_random=yes 3. vi bi ...
Js的History对象
History回顾 window.history表示window对象的历史记录 window.history的简单回顾历史记录中前进/后退,移动到指定历史记录点 window.history.bac ...
关于word-break,word-wrap换行
目前项目中有一些流程日志需要动态显示到页面上,实现方法是ajax动态获取附加到<span></span>标签上,然后设置word-break:break-all样式使其自动换行 ...
Ubuntu Server下建立VPN服务器 pptp 模式的方法
对于想要在外部访问内部的网络,除了在防火墙上开启相应服务器所对应的端口,最好的方法应该是建立VPN-Server,使得用户可以在外网任何一台计算机上拨入到内网中进行操作,而且VPN可以记录详细的日志, ...
oracle数据库误删恢复方法
一.如果只是误删部分数据或者某条数据可以通过 1.select * from 误删除的表明 as of timestamp to_Date('恢复年月日时分秒', '恢复时间格式') ...

Hadoop 学习笔记 （十一） MapReduce 求平均成绩

Hadoop 学习笔记 （十一） MapReduce 求平均成绩的更多相关文章

随机推荐

热门专题

Hadoop 学习笔记（十一） MapReduce 求平均成绩

Hadoop 学习笔记（十一） MapReduce 求平均成绩的更多相关文章