Eclipse执行Hadoop WordCount

前期工作

我的Eclipse是安装在Windows下的，通过Eclipse执行程序连接Hadoop，需要让虚拟机的访问地址和本机的访问地址保持在同一域内，虚拟机的地址更改前面的文章介绍过了，如果想改windows本机ip地址，打开“网络和共享中心“，点击左侧菜单”更改适配器设置“，选择相应连接网络进行IpV4属性地址修改即可。我虚拟机地址为192.168.3.137

准备工作

地址配置好之后，在Eclipse上要安装Hadoop的插件（你可以参考源码自行修改）。

打开Eclipse安装路径---\eclipse\plugins，把hadoop-eclipse-plugin-1.1.2.jar放到这个目录下。

windows本机新建目录（本人在E:\hadoopMapReduceDir），从Linux的Hadoop安装包内复制所有jar放到这个目录下备用。

Ubuntu 13.04上搭建Hadoop环境 http://www.linuxidc.com/Linux/2013-06/86106.htm

Ubuntu 12.10 +Hadoop 1.2.1版本集群配置 http://www.linuxidc.com/Linux/2013-09/90600.htm

Ubuntu上搭建Hadoop环境（单机模式+伪分布模式） http://www.linuxidc.com/Linux/2013-01/77681.htm

Ubuntu下Hadoop环境的配置 http://www.linuxidc.com/Linux/2012-11/74539.htm

单机版搭建Hadoop环境图文教程详解 http://www.linuxidc.com/Linux/2012-02/53927.htm

搭建Hadoop环境（在Winodws环境下用虚拟机虚拟两个Ubuntu系统进行搭建） http://www.linuxidc.com/Linux/2011-12/48894.htm

配置工作

打开Eclipse，在菜单栏点击Window，showView选择Other打开选择显示的窗口，如下

在MapReduceTools 目录下找到这只大象，将它拖到Eclipse底部显示（和Console放一块）

打开新建配置窗口，设置连接信息，下图是本机的连接配置名称自己填写，两个端口和username 按图填写（Hadoop默认的端口）

点击Eclipse菜单栏Window ---》Preference，找到HadoopMap/Reduce，点击之后在右侧选择导入Hadoop jar的路径，这样以后新建Hadoop项目，jar包会自动从该路径加载，路径上面已设，添加进来如图：

创建项目

点击File---》other，打开新建对话框，创建Map/ReduceProject项目NewHadoopTest

创建完成后你会看到jar包自动加载到项目之中

拷贝Linux下Hadoop的src目录下的example java项目到刚刚创建的工程下src下，

Linux下启动Hadoop（用JPS检查是否已启动），在Eclipse连接，连接成功后Hadoop目录就会显示如下

修改代码

现在设置方面基本完成，接下来就是针对WordCount.java所做的修改和HDFS路径配置

打开WordCount.java(可能会报错),将main方法更改如下：

如果GenericOptionsParser报错，将Hadoop-core-1.1.2.jar加到项目中（或放到jar配置路径）。新建a.txt文件，输入下面内容，保存

在hadoopname下user—》hadoop目录创建input文件夹，将文件a.txt上传到HDFS input上，过程如下（不要创建output目录，不然执行会报错，），如果HDFS已有，可Linux使用命令hadoop fs -rmr /output删除）

在选择Wordcount.java，右击run as ---》run configurations，打开Arguments填写input out路径(注意：input和output路径中间是有空格的)，这里我设置查询input下所有文件的单词出现次数。

右击WordCount.java,run as -àrun on hadoop 执行

执行结束后，刷新DFS Locations/ use/hadoop

自动生成output文件夹，点击可以看到执行结果。最终结果存放在part-r-00000中，双击查看即可

Eclipse执行Hadoop WordCount的更多相关文章

分布式配置 tachyon 并执行Hadoop样例 MapReduce
----------此文章.笔者按着tachyon官网教程进行安装并记录. (本地安装tachyon具体解释:http://blog.csdn.net/u012587561/article/detai ...
MapReduce编程入门实例之WordCount：分别在Eclipse和Hadoop集群上运行
上一篇博文如何在Eclipse下搭建Hadoop开发环境,今天给大家介绍一下如何分别分别在Eclipse和Hadoop集群上运行我们的MapReduce程序! 1. 在Eclipse环境下运行MapR ...
【hadoop】在eclipse上运行WordCount的操作过程
序:本以为今天花点时间将WordCount例子完全理解到,但高估自己了,更别说我只是在大学选修一学期的java,之后再也没碰过java语言了总的来说,从宏观上能理解具体的程序思路,但具体到每个代码有 ...
解决在windows的eclipse上面运行WordCount程序出现的一系列问题详解
一．简介要在Windows下的 Eclipse上调试Hadoop2代码,所以我们在windows下的Eclipse配置hadoop-eclipse-plugin- 2.6.0.jar插件,并在运行H ...
eclipse 执行MapReduce程序错误异常汇总(解决Map not fount)
错误一: Error: java.lang.RuntimeException: java.lang.ClassNotFoundException: Class wordCount.wordCount$ ...
基于Eclipse的Hadoop应用开发环境配置
基于Eclipse的Hadoop应用开发环境配置我的开发环境: 操作系统ubuntu11.10 单机模式 Hadoop版本:hadoop-0.20.1 Eclipse版本:eclipse-java- ...
基于Eclipse搭建Hadoop源码环境
Hadoop使用ant+ivy组织工程,无法直接导入Eclipse中.本文将介绍如何基于Eclipse搭建Hadoop源码环境. 准备工作本文使用的操作系统为CentOS.需要的软件版本:hadoo ...
hadoop wordcount
Mapper // map的数量与数的分片有关系 public class WCMapper extends Mapper<LongWritable, Text, Text, LongWrita ...
获取hadoop的源码和通过eclipse关联hadoop的源码
一.获取hadoop的源码首先通过官网下载hadoop-2.5.2-src.tar.gz的软件包,下载好之后解压发现出现了一些错误,无法解压缩, 因此有部分源码我们无法解压 ,因此在这里我讲述一下如 ...

随机推荐

使用gulp脚本配合TypeScript开发
目标:编写TypeScript时,保存即生成js文件. 使用npm安装以下组件 gulp gulp-rename through-gulp gulp-typescript 编写gulpfile ...
UVALive 3027（并查集）
题意:某公司的各企业群要建立联系,I i j 表示企业i与企业j建立联系,并且以企业j为中心(并查集中的父亲)(企业j为暂时的中心企业),E i 表示查询企业 i 距离此时的中心企业的距离.各企业间的 ...
Poj 2109 / OpenJudge 2109 Power of Cryptography
1.Link: http://poj.org/problem?id=2109 http://bailian.openjudge.cn/practice/2109/ 2.Content: Power o ...
关于Fragment的使用与Androikd sdk版本之间的东东
第一个问题如何使用Fragment? 第二个问题哪些场景适合用Fragment? 第三个问题android.app.fragment与android.support.v4.app.Fragment 为 ...
Angularjs在线编辑器
1.TextAngular: https://github.com/fraywing/textAngular textAngular是一个强大的Text-Editor/Wysiwyg 编辑器,用于An ...
javaScript创建无边框iframe兼容ie
<script>var m_iframe=document.createElement("iframe");m_iframe.scrolling="no&qu ...
《CSS3使用指南》读书笔记
一.CSS3的来龙去脉 1.CSS3的新特性: 1)不依赖图片的视觉效果 2)盒容器变形 3)独一无二的字体 4)强大的选择器 5)过渡与动画 6)媒体信息查询 7)多列布局 2.CSS标准发布分5个 ...
discuz x3插件开发傻瓜图文教程，用demo说话
此demo功能是在模板footer部位插入一段javascript代码,这段代码可以是alert提示,也可以是加载广告等等. 第一步: 在config\config_global.php 文件里设置$ ...
CorelDRAW 二维码插件
随着智能手机的流行,二维码在各个领域大量应用,这个插件在补CorelDRAW这方面的不足: 这个插件是 cpg 格式,安装请看这篇博客:http://www.cnblogs.com/o594cql/p ...
Oracle 内核参数
安装Oracle的时候,可以参考Oracle 的安装文档,来设置相关内核参数的值,但是有些参数的值还是需要根据我们自己的情况来进行调整.注:不同系统的参数不同,本篇针对linux. 一.Linux 系 ...

Eclipse执行Hadoop WordCount

Eclipse执行Hadoop WordCount的更多相关文章

随机推荐

热门专题