运行 wordcount 案例：

-----------------------------------------------------------------

Hadoop集群测试wordcount程序：

1）：在bigData目录下创建wordcount文件夹

mkdir wordcount //创建文件夹

2）：在wordcount文件夹下创建两个文件并输入内容

//创建 file1.txt

vim file1.txt
//输入内容如下：

　hello word
　hello java

//创建 file2.txt

vim file2.txt

　hello hadoop
　hello wordcount

3）：在HDFS中创建input文件夹

hadoop fs -mkdir /input

// hadoop fs  ：可以理解为 hadoop系统文件目录

查看创建的文件（是否存在）

4）：把刚才创建的两个文件上传到HDFS中input文件夹

//上传所有以 .txt 结尾的文件
hadoop fs -put ./*.txt /input/

//查看上传的文件
hadoop fs -ls /

注意：可能存在的问题：

查看当前正在运行的相关服务：

jps  //没有规定要在哪一个目录执行

1）：上传过程中可能出现以下错误：

解决方案：

查看配置 hdfs-site.xml 节点指定的路径【 name 和 data 】目录是否自动生成了（查看主机是否存在 name 和子机器上的 data）。

小编这里是没有生成 data 目录。

有了目录还需要注意：name 和 data 目录中的 id 必须一致：（如果不一致可以修改一下或者删除 name data logs tem 生成的目录重新格式化并启动集群：查看是否有相应信息）

5）：运行wordcount程序

Hadoop的 jar 包中已经给我们提供了 mapreduce 程序！都在 /bigData/hadoop-2.8.0/share/hadoop/mapreduce文件夹中！

切换到 share/hadoop/mapreduce 目录下：

cd share/hadoop/mapreduce

执行以下命令：

hadoop jar hadoop-mapreduce-examples-2.8.0.jar  wordcount /input/ /output/

　/input/ :是指需要计算文件所在的位置

　/output/：是指计算之后的结果文件存放位置

6）：查看执行运算后的结果

hadoop fs -cat /output/*

Eclipse集成Hadoop插件：点我下载源码

如果eclipse是装在了真机windows系统中，需要我们在真机上安装hadoop！（同样将 hadoop 压缩包在 windows 上解压一份：【以管理员方式运行解压】）

1）：配置 windows hadoop环境变量：

2）：使用 hadoop version 查看是否配置成功：

3）：下载指定版本的插件：下载地址一　　下载地址二

把插件放进 eclipse 安装目录下的 plugins 文件夹下

4）：启动eclipse配置hadoop的安装目录

4-1）：

4-2）：

4-3）：eclipse中显示插件的页面：

4-）：

5）：使用eclipse创建并运行wordcount程序

导入计算程序：

1）:

2）：

NativeIO：更改以下配置

目录结构：

右键点击WordCount====》Run As ===》Run Configuration：

java Application 上 new：

hdfs://admin:9000/input

hdfs://admin:9000/eclipseoutput

得到结果：

注意：Error 可能出现的错误...

1）：有可能是本机的hadoop/bin目录下缺少hadoop.dll和winutils.exe等文件。（建议全部替换 hadoop/bin 下的所有文件。bin包在上述的下载地址中）

2）：

org.apache.hadoop.security.AccessControlException: Permissiondenied: user=zhengcy, access=WRITE,inode="/user/root/output":root:supergroup:drwxr-xr-x

在集群中运行hadoop fs -chmod -R 777 /

或者

修改三个虚拟机的配置：hdfs-site.xml
添加如下配置：

<property>
　　<name>dfs.permissions</name>
　　<value>false</value>
</property>

3）：

Exception in thread "main" java.lang.RuntimeException: 
java.io.FileNotFoundException: java.io.FileNotFoundException: HADOOP_HOME and hadoop.home.dir are unset. -see https://wiki.apache.org/hadoop/WindowsProblems

解决方式：在 WordCount类中的main 方法中添加如下配置

System.setProperty("hadoop.home.dir", "hadoop安装目录");

6）：使用eclipse打成jar包发布到linux中运行

7）：运行完毕之后，在eclipse中查看效果图！

点我进行下一步的操作（揭秘HDFS）

分享知识-快乐自己：运行（wordcount）案例的更多相关文章

使用MapReduce运行WordCount案例
@ 目录一.准备数据二.MR的编程规范三.编程步骤四.编写程序 Mapper程序解读一.准备数据注意:准备的数据的格式必须是文本,每个单词之间使用制表符分割.编码必须是utf-8无bom ...
分享知识-快乐自己：Shrio 案例Demo概述
Shiro 权限认证核心: POM:文件:  <dependency> <groupId>org.apache.shiro</ ...
分享知识-快乐自己：HBase编程
HBase编程: 一):大数据(hadoop)初始化环境搭建二):大数据(hadoop)环境搭建三):运行wordcount案例四):揭秘HDFS 五):揭秘MapReduce 六):揭秘HBa ...
分享知识-快乐自己：揭秘HBase
揭秘HBase: 一):大数据(hadoop)初始化环境搭建二):大数据(hadoop)环境搭建三):运行wordcount案例四):揭秘HDFS 五):揭秘MapReduce 六):揭秘HBa ...
分享知识-快乐自己：揭秘HDFS
揭秘HDFS: 一):大数据(hadoop)初始化环境搭建二):大数据(hadoop)环境搭建三):运行wordcount案例四):揭秘HDFS 五):揭秘MapReduce 六):揭秘HBas ...
分享知识-快乐自己：Liunx-大数据（Hadoop）初始化环境搭建
大数据初始化环境搭建: 一):大数据(hadoop)初始化环境搭建二):大数据(hadoop)环境搭建三):运行wordcount案例四):揭秘HDFS 五):揭秘MapReduce 六):揭秘 ...
分享知识-快乐自己：大数据（hadoop）环境搭建
大数据 hadoop 环境搭建: 一):大数据(hadoop)初始化环境搭建二):大数据(hadoop)环境搭建三):运行wordcount案例四):揭秘HDFS 五):揭秘MapReduce ...
MapReduce简单执行过程及Wordcount案例
MapReducer运行过程以单词统计为案例. 假如现在文件中存在如下内容: aa bb aa cc dd aa 当然,这是小文件,如果文件大小较大时会将文件进行 "切片" ,此 ...
hadoop学习笔记：运行wordcount对文件字符串进行统计案例
文/朱季谦我最近使用四台Centos虚拟机搭建了一套分布式hadoop环境,简单模拟了线上上的hadoop真实分布式集群,主要用于业余学习大数据相关体系. 其中,一台服务器作为NameNode,一台 ...

随机推荐

PHP资源,库，工具大全
内容包括:库.框架.模板.安全.代码分析.日志.第三方库.配置工具.Web 工具.书籍.电子书.经典博文等等. 大家可以搜索其它语言,如awesome-java的https://github.com/ ...
Android 中通过切割图片创建人物行走动画
以前一直使用序列图片来实现动画效果,造成空间的极大浪费,所以想要尝试下切割图片来实现动画. 如图所示,是由66rpg纸娃娃系统生成的角色行走图.本程序必须实现将人物的整体图片切割后存入4x4的数组来动 ...
1. lvs+keepalived 高可用群集
一. keepalived 工具介绍 1.专为lvs 和HA 设计的一款健康检查工具 2.支持故障自动切换 3.支持节点健康状态检查二. keepalived 实现原理剖析 keepalived ...
POJ 2187 Beauty Contest【旋转卡壳求凸包直径】
链接: http://poj.org/problem?id=2187 http://acm.hust.edu.cn/vjudge/contest/view.action?cid=22013#probl ...
Pipeline outbound
netty源码死磕8 Pipeline outbound 出站流程揭秘 1. Pipeline outbound流程 1.1. 出站的定义简单回顾一下. 出站(outbound) 操作,通常是处于上 ...
spring bean标签常用属性
一.id属性其名称,可以是任意名称,但不能包含特殊符号. 根据id得到配置对象. 二.class属性创建对象所在的类名称三.name属性功能和id属性一样,但name属性值可以包含特殊属性四 ...
Nodejs课堂笔记—第一课：修改Webstorm的默认主题
最近小半年一直在忙于研究Docker源码,也在写相关的分析文章.但受限于某些条件不能发布到网上,甚为郁闷.而最近几天,接到新的开发任务,需要使用nodejs.之前一直听说过nodejs,但从来没有真正 ...
activiti--5 -----------------Activiti 工作流流程各个步骤所涉及到的表
ACT_RE_*: 'RE'表示repository. 这个前缀的表包含了流程定义和流程静态资源 (图片,规则,等等). ACT_RU_*: 'RU'表示runtime. 这些运行时的表,包含流程实例 ...
python3 pillow使用测试
# -*- encoding=utf-8 -*- ''''' pil处理图片,验证,处理大小,格式过滤压缩,截图,转换图片库最好用Pillow 还有一个测试图片img.jpg, 一个log图片 ...
QT设置QToolBar带有图标和文字
ui->mainToolBar->setToolButtonStyle(Qt::ToolButtonTextBesideIcon);

分享知识-快乐自己：运行（wordcount）案例

运行 wordcount 案例：

Hadoop集群测试wordcount程序：

Eclipse集成Hadoop插件：点我下载源码

分享知识-快乐自己：运行（wordcount）案例的更多相关文章

随机推荐

热门专题