使用老版本的java api提交hadoop作业

还是使用之前的单词计数的例子

自定义Mapper类

import java.io.IOException;

import org.apache.hadoop.io.LongWritable;

import org.apache.hadoop.io.Text;

import org.apache.hadoop.mapred.MapReduceBase;

import org.apache.hadoop.mapred.Mapper;

import org.apache.hadoop.mapred.OutputCollector;

import org.apache.hadoop.mapred.Reporter;

//自定义的Mapper类必须继承MapReduceBase 并且实现Mapper接口

public class JMapper extends MapReduceBase implements

		Mapper<LongWritable, Text, Text, LongWritable> {

	@Override

	public void map(LongWritable key, Text value,

			OutputCollector<Text, LongWritable> collector, Reporter reporter)

			throws IOException {

		String[] ss = value.toString().split("\t");

		for (String s : ss) {

			//使用collector.collect而不是context.write

			collector.collect(new Text(s), new LongWritable(1));

		}

	}

}

自定义Reducer类

import java.io.IOException;

import java.util.Iterator;

import org.apache.hadoop.io.LongWritable;

import org.apache.hadoop.io.Text;

import org.apache.hadoop.mapred.MapReduceBase;

import org.apache.hadoop.mapred.OutputCollector;

import org.apache.hadoop.mapred.Reducer;

import org.apache.hadoop.mapred.Reporter;

//自定义的Reducer类必须继承MapReduceBase 并且实现Reducer接口

public class JReducer extends MapReduceBase implements

		Reducer<Text, LongWritable, Text, LongWritable> {

	@Override

	public void reduce(Text key, Iterator<LongWritable> value,

			OutputCollector<Text, LongWritable> collector, Reporter reporter)

			throws IOException {

		long sum = 0;

		//由于value不在可以用foreach循环，所以用while代替

		while (value.hasNext()) {

			sum += value.next().get();

		}

		collector.collect(key, new LongWritable(sum));

	}

}

运行提交代码的类JSubmit

import java.io.IOException;

import java.net.URI;

import java.net.URISyntaxException;

import org.apache.hadoop.conf.Configuration;

import org.apache.hadoop.fs.FileSystem;

import org.apache.hadoop.fs.Path;

import org.apache.hadoop.io.LongWritable;

import org.apache.hadoop.io.Text;

import org.apache.hadoop.mapred.FileInputFormat;

import org.apache.hadoop.mapred.FileOutputFormat;

import org.apache.hadoop.mapred.JobClient;

import org.apache.hadoop.mapred.JobConf;

import org.apache.hadoop.mapred.TextInputFormat;

import org.apache.hadoop.mapred.TextOutputFormat;

public class JSubmit {

	public static void main(String[] args) throws IOException,

			URISyntaxException, InterruptedException, ClassNotFoundException {

		Path outPath = new Path("hdfs://localhost:9000/out");

		Path inPath = new Path("/home/hadoop/word");

		Configuration conf = new Configuration();

		FileSystem fs = FileSystem.get(new URI("hdfs://localhost:9000"), conf);

		if (fs.exists(outPath)) {

			fs.delete(outPath, true);

		}

		// 使用JobConf 而不是Job

		JobConf job = new JobConf(conf, JSubmit.class);

		FileInputFormat.setInputPaths(job, inPath);

		job.setInputFormat(TextInputFormat.class);

		job.setMapperClass(JMapper.class);

		job.setMapOutputKeyClass(Text.class);

		job.setMapOutputValueClass(LongWritable.class);

		job.setReducerClass(JReducer.class);

		job.setOutputKeyClass(Text.class);

		job.setOutputValueClass(LongWritable.class);

		FileOutputFormat.setOutputPath(job, outPath);

		job.setOutputFormat(TextOutputFormat.class);

		// 使用JobClient.runJob而不是job.waitForCompletion

		JobClient.runJob(job);

	}

}

可以看到

其实老版本的api差别不大，只是用了少数几个类替换了而已

注意老版本api的类虽然和新版本api的类名字很多都是一模一样的

但是所在的包不同，老版本所在的包都是mapred的，而新版本的都在mapreduce

使用老版本的java api提交hadoop作业的更多相关文章

Java API实现Hadoop文件系统增删改查
Java API实现Hadoop文件系统增删改查 Hadoop文件系统可以通过shell命令hadoop fs -xx进行操作,同时也提供了Java编程接口 maven配置 <project x ...
通过java api提交自定义hadoop 作业
通过API操作之前要先了解几个基本知识一.hadoop的基本数据类型和java的基本数据类型是不一样的,但是都存在对应的关系如下图如果需要定义自己的数据类型,则必须实现Writable hado ...
使用HDFS客户端java api读取hadoop集群上的信息
本文介绍使用hdfs java api的配置方法. 1.先解决依赖,pom <dependency> <groupId>org.apache.hadoop</groupI ...
补装老版本的Java SE
到oracle注册账号下载bin文件在bin文件下载目录打开终端复制下面到命令 # chmod +x jdk-6u21-linux-i586.bin 注意版本不同,比如我这次下载到是6u45 chm ...
Java --本地提交MapReduce作业至集群☞实现 Word Count
还是那句话,看别人写的的总是觉得心累,代码一贴,一打包,扔到Hadoop上跑一遍就完事了????写个测试样例程序(MapReduce中的Hello World)还要这么麻烦!!!?,还本地打Jar包, ...
oozie java api提交作业
今晚试验用java的api来提交代码,由于代码是在我机器上写的,然后提交到我的虚拟机集群当中去,所以中间产生了一个错误..要想在任意一台机器上向oozie提交作业的话,需要对hadoop的core-s ...
Java API操作Hadoop可能会遇到的问题以及解决办法
https://www.zifangsky.cn/1292.html Could not locate Hadoop executable: xxx\bin\winutils.exe 1 2 3 ...
使用JAVA API获取hadoop集群的FileSystem
所需要配置的参数: Configuration conf = new Configuration(); conf.set("fs.defaultFS", "hdfs ...
Java API操作HA方式下的Hadoop
通过java api连接Hadoop集群时,如果集群支持HA方式,那么可以通过如下方式设置来自动切换到活动的master节点上.其中,ClusterName 是可以任意指定的,跟集群配置无关,dfs. ...

随机推荐

tips 前端各个设备的页面尺寸的media query 与页面高度的经验总结
有段时间扑了一个多月的在一个wifi的前端项目上快做完时各种小问题一堆一堆的修复处理了一些很零散的问题因为页面有一个所有页面都有一个背景色有的页面有背景图主要重点是移动前端的方向因为现 ...
struts2 json 输出日期格式不正确
struts2 输出json中日期出现:2013-12-17T15:57:47 错误格式的数据原因:struts2 json插件对日期的格式化有问题解决方法:在实体类的日期的get方法上加注解: ...
USACO silver P1
原题概述题意: 共有N个数,每个数的个数为ai,ai的总和为M,将每2个数进行配对,要求使配对之后2数的和的最大值最小,并输出最小值. 这不就是裸的贪心么..实在是水题啊, 不过如果假如有一个人要一个 ...
嵌入式Linux下Camera编程--V4L2【转】
转自:http://blog.csdn.net/fwqlzz/article/details/51126653 版权声明:本文为博主原创文章,未经博主允许不得转载. USB video class(又 ...
do_exit——>exit_notify()【转】
转自:http://blog.csdn.net/sunnybeike/article/details/6907322 版权声明:本文为博主原创文章,未经博主允许不得转载. /* * Send sign ...
windows安装scrapy
1.安装Twisted 直接pip install Twisted 然后报错 error: Microsoft Visual C++ 14.0 is required. Get it with &qu ...
c#操作SQL的例子
>> 数据表复制当表目标表存在时: insert into 目的数据库..表 select * from 源数据库..表当目标表不存在时: select * into 目的数据库..表 ...
AC日记——Paint Pearls hdu 5009
Paint Pearls 思路: 离散化+dp+剪枝: dp是个n方的做法: 重要就在剪枝: 如果一个长度为n的区间,有大于根号n种颜色,还不如一个一个涂: 来,上代码: #include <c ...
AC日记——Valued Keys codeforces 801B
801B - Valued Keys 思路: 水题... 来,上代码: #include <cstdio> #include <cstring> #include <io ...
SQL 并发-转
脏读.不可重复读共享锁.悲观锁和事务五种隔离级别一.脏读.不可重复读.幻读1.脏读:脏读就是指当一个事务正在访问数据,并且对数据进行了修改,而这种修改还没有提交到数据库中,这时,另外一个 ...

使用老版本的java api提交hadoop作业

使用老版本的java api提交hadoop作业的更多相关文章

随机推荐

热门专题