WordCount( Java )

个人项目：WordCount (Java)

一.Github项目地址 https://github.com/misterchaos/WordCount 二.解题思路 2.1 基本需求分析经过仔细阅读题目,分析得出项目的基本需求如下: wc.exe -c //返回文件 file.c 的字符数 wc.exe -c //返回文件 file.c 的字符数 wc.exe -w //返回文件 file.c 的词的数目 wc.exe -l //返回文件 file.c 的行数 wc.exe -a //返回更复杂的数据(代码行 / 空行 / 注释行) w…

Github项目地址:https://github.com/Sabot1203/WordCount 一. 题目描述实现一个简单而完整的软件工具(源程序特征统计程序). 进行单元测试.回归测试.效能测试,在实现上述程序的过程中使用相关的工具. 进行个人软件过程(PSP)的实践,逐步记录自己在每个软件工程环节花费的时间. 二.项目要求 wc.exe 是一个常见的工具,它能统计文本文件的字符数.单词数和行数.这个项目要求写一个命令行程序,模仿已有wc.exe 的功能,并加以扩充,给出某程序设计语言源…

WordCount(Java实现)

Github项目地址:https://github.com/linzworld/word-count 项目相关要求题目描述 Word Count 实现一个简单而完整的软件工具(源程序特征统计程序). 进行单元测试.回归测试.效能测试,在实现上述程序的过程中使用相关的工具. 进行个人软件过程(PSP)的实践,逐步记录自己在每个软件工程环节花费的时间. WC 项目要求 wc.exe 是一个常见的工具,它能统计文本文件的字符数.单词数和行数.这个项目要求写一个命令行程序,模仿已有wc.exe 的功能…

大数据之路week07--day03（Hadoop深入理解，JAVA代码编写WordCount程序，以及扩展升级）

什么是MapReduce 你想数出一摞牌中有多少张黑桃.直观方式是一张一张检查并且数出有多少张是黑桃. MapReduce方法则是: 1.给在座的所有玩家中分配这摞牌 2.让每个玩家数自己手中的牌有几张是黑桃,几张是红桃,然后把这两组数目汇报给你 3.你把所有玩家告诉你的两组数字分别加起来,得到最后的结论 MapReduce是一种分布式计算模型,由Google提出,主要用于搜索领域,解决海量数据的计算问题. MapReduce是分布式运行的,由两个阶段组成:Map和Reduce,Map阶段是一个…

Eclipse 执行成功的 Hadoop-1.2.1 WordCount 源码

万事开头难.最近在学习Hadoop,先是搭建各种版本环境,从2.2.0到2.3.0,再到1.2.1,终于都搭起来了,折腾了1周时间,之后开始尝试使用Eclipse编写小demo.仅复制一个现成的WordCount到Eclipse中执行竟然也出现各种错误,一一解决之后也是几个小时过去了. 为避免他人也耽误时间在这些问题上,现将运行成功后的源码分享. 先看下效果图: 图1. 运行成功的截图图2. 项目结构视图图3. 修改后的代码将Hadoop安装目录下WordCount源码拷贝过来之后需要做图…

《Java学习笔记(第8版)》学习指导

<Java学习笔记(第8版)>学习指导目录图书简况学习指导第一章 Java平台概论第二章从JDK到IDE 第三章基础语法第四章认识对象第五章对象封装第六章继承与多态第七章接口与多态第八章异常处理第九章 Collection与Map 第十章输入/输出第十一章线程与并行API 第十二章 Lambda 第十三章时间与日期第十四章 NIO与NIO2 第十五章通用API 第十六章整合数据库第十七章反射与类加载器第十八章自定义类型.枚举补充:Ja…

【hadoop】——修改hadoop FileUtil.java，解决权限检查的问题

在Hadoop Eclipse开发环境搭建这篇文章中,第15.)中提到权限相关的异常,如下: 15/01/30 10:08:17 WARN util.NativeCodeLoader: Unable to load native-hadoop library for your platform... using builtin-java classes where applicable 15/01/30 10:08:17 ERROR security.UserGroupInformation:…

hadoop的统计单词程序WordCount提示找不到WordCount类

按这里的教程: http://www.imooc.com/learn/391 试验时,发现在wordcount的最后一步一直提示如下错误: Exception in thread "main" java.lang.ClassNotFoundException:WordCount at java.net.URLClassLoader$.run(URLClassLoader.java:) at java.net.URLClassLoader$.run(URLClassLoader.java…

开源分布式实时计算引擎 Iveely Computing 之 WordCount 详解(3)

WordCount是很多分布式计算中,最常用的例子,例如Hadoop.Storm,Iveely Computing也不例外.明白了WordCount在Iveely Computing上的运行原理,就很容易写出新的分布式程序.上一篇中已经知道了如何部署Iveely Computing以及提交任务,现在我们将深入WordCount的代码. 一.代码结构图3-1 从图3-1中,可以看出,类WordCount中,有两个子类WordInput.WordOutput,以及一个主方法,Word…

Hadoop入门程序WordCount的执行过程

首先编写WordCount.java源文件,分别通过map和reduce方法统计文本中每个单词出现的次数,然后按照字母的顺序排列输出, Map过程首先是多个map并行提取多个句子里面的单词然后分别列出来每个单词,出现次数为1,全部列举出来 Reduce过程首先将相同key的数据进行查找分组然后合并,比如对于key为Hello的数据分组为:<Hello, 1>.<Hello,1>.<Hello,1>,合并之后就是<Hello,1+1+1>,分组也可以理解为re…

linux下在eclipse上运行hadoop自带例子wordcount

启动eclipse:打开windows->open perspective->other->map/reduce 可以看到map/reduce开发视图.设置Hadoop location. 打开windows->show view->other-> map/reduce Locations视图,在点击大象后[new Hadoop location]弹出的对话框(General tab)进行参数的添加: Location name: 任意 map/reduce maste…

Hadoop入门实践之从WordCount程序说起

这段时间需要学习Hadoop了,以前一直听说Hadoop,但是从来没有研究过,这几天粗略看完了<Hadoop实战>这本书,对Hadoop编程有了大致的了解.接下来就是多看多写了.以Hadoop自带的例子WordCount程序开始,来记录我的Hadoop学习过程. Hadoop自带例子WordCount.java /** * Licensed under the Apache License, Version 2.0 (the "License"); * you may no…

Linux下编译java并生成jar包

下面是WordCount.java类 package com.ll; import java.io.IOException; import java.util.Iterator; import java.util.StringTokenizer; import org.apache.hadoop.fs.Path; import org.apache.hadoop.io.IntWritable; import org.apache.hadoop.io.LongWritable; import or…

eclipse运行WordCount

1) 可以完全参考http://www.cnblogs.com/archimedes/p/4539751.html在eclipse下创建MapReduce工程,创建了MR工程,并完成WordCount.java的编写之后,运行WordCount.java,结果可能如图所示,原因是未设置MR读取文件的路径以及输出结果的路径,修改方法如下图所示需要注意的就是,这里的in和out就是hdfs中的路径,in就是输入数据所在的路径,ou就是最后结果的输出路径.使用完全分布式运行MR程序,设置如下: ,其…

解决在windows的eclipse上面运行WordCount程序出现的一系列问题详解

一．简介要在Windows下的 Eclipse上调试Hadoop2代码,所以我们在windows下的Eclipse配置hadoop-eclipse-plugin- 2.6.0.jar插件,并在运行Hadoop的WordCount代码时出现了一系列的问题,搞了好几天终于能运行起代码.接下来我们来看看问题并怎么解决,提供给跟我同样遇到的问题作为参考. Hadoop2的WordCount.java统计代码如下: import java.io.IOException; import java.util…

windows下eclipse远程连接hadoop错误“Exception in thread"main"java.io.IOException: Call to Master.Hadoop/172.20.145.22:9000 failed ”

在VMware虚拟机下搭建了hadoop集群,ubuntu-12.04,一台master,三台slave.hadoop-0.20.2版本.在 master机器上利用eclipse-3.3连接hadoop并运行mapreduce实例可以成功.但是当在windows下eclipse-3.3 远程连接hadoop,DFS locations可以连接上,但运行mapreduce实例时报错,如下: 13/07/02 13:37:04 WARN conf.Configuration: DEPRECATED:…

Hadoop示例程序WordCount编译运行

首先确保Hadoop已正确安装及运行. 将WordCount.java拷贝出来 $ cp ./src/examples/org/apache/hadoop/examples/WordCount.java /home/hadoop/ 在当前目录下创建一个存放WordCount.class的文件夹 $ mkdir class 编译WordCount.java $ javac -classpath /usr/local/hadoop/hadoop-core-0.20.203.0.jar:/usr/lo…

Eclipse执行Hadoop WordCount

前期工作我的Eclipse是安装在Windows下的,通过Eclipse执行程序连接Hadoop, 需要让虚拟机的访问地址和本机的访问地址保持在同一域内,虚拟机的地址更改前面的文章介绍过了,如果想改windows本机ip地址,打开“网络和共享中心“,点击左侧菜单”更改适配器设置“,选择相应连接网络进行IpV4属性地址修改即可.我虚拟机地址为192.168.3.137 准备工作地址配置好之后,在Eclipse上要安装Hadoop的插件(你可以参考源码自行修改). 打开Eclipse安装路径-…

hadoop安装与WordCount例子

1.JDK安装下载网址: http://www.oracle.com/technetwork/java/javase/downloads/jdk-6u29-download-513648.html 如果本地有安装包,则用SecureCRT连接Linux机器,然后用rz指令进行上传文件: 下载后获得jdk-6u29-linux-i586-rpm.bin文件,使用sh jdk-6u29-linux-i586-rpm.bin进行安装, 等待安装完成即可:java默认会安装在/usr/java下: 在…

伪分布式环境下命令行正确运行hadoop示例wordcount

首先确保hadoop已经正确安装.配置以及运行. 1. 首先将wordcount源代码从hadoop目录中拷贝出来. [root@cluster2 logs]# cp /usr/local/hadoop-1.1.2/src/examples/org/apache/hadoop/examples/WordCount.java ~/ygch/hadoop/ 因为在编译过程中需要将jave源文件和class类文件分离,所以在~/ygch/hadoop下还要有一个class目录. 2. …

Eclipse的下载、安装和WordCount的初步使用（本地模式和集群模式）

包括: Eclipse的下载 Eclipse的安装 Eclipse的使用本地模式或集群模式 Scala IDE for Eclipse的下载.安装和WordCount的初步使用(本地模式和集群模式) IntelliJ IDEA的下载.安装和WordCount的初步使用(本地模式和集群模式) 我们知道,对于开发而言,IDE是有很多个选择的版本.如我们大部分人经常用的是如下. Eclipse *版本 Eclipse *下载现在啊,在业界,用java语言,开发是霸主地位. 比如,一个高级的高…

2 weekend110的mapreduce介绍及wordcount + wordcount的编写和提交集群运行 + mr程序的本地运行模式

把我们的简单运算逻辑,很方便地扩展到海量数据的场景下,分布式运算. Map作一些,数据的局部处理和打散工作. Reduce作一些,数据的汇总工作. 这是之前的,weekend110的hdfs输入流之源码分析.现在,全部关闭断点. //4个泛型中,前两个是指定mapper输入数据的类型,KEYIN是输入的key类型,VALUE是输入的value的类型 //map 和 reduce的数据输入输出是以key-value对的形式封装的 //默认情况下,框架传递给我们的mapper的输入数据中,key是要…

Hadoop版Helloworld之wordcount运行示例

1.编写一个统计单词数量的java程序,并命名为wordcount.java,代码如下: import java.io.IOException; import java.util.StringTokenizer; import org.apache.hadoop.conf.Configuration; import org.apache.hadoop.fs.Path; import org.apache.hadoop.io.IntWritable; import org.apache.hadoo…

hadoop笔记之MapReduce的应用案例(WordCount单词计数)

MapReduce的应用案例(WordCount单词计数) MapReduce的应用案例(WordCount单词计数) 1. WordCount单词计数作用: 计算文件中出现每个单词的频数输入结果按照字母顺序进行排序 Map过程 Reduce过程 WordCount的源代码 import java.io.IOException;import java.util.StringTokenizer;import org.apache.hadoop.conf.Configuration;import…

Hadoop-2.4.0安装和wordcount执行验证

Hadoop-2.4.0安装和wordcount执行验证下面描写叙述了64位centos6.5机器下,安装32位hadoop-2.4.0,并通过执行系统自带的WordCount样例来验证服务正确性的步骤. 建立文件夹 /home/QiumingLu/hadoop-2.4.0,以后这个是hadoop的安装文件夹. 安装hadoop-2.4.0,解压hadoop-2.4.0.tar.gz到文件夹 /home/QiumingLu/hadoop-2.4.0就可以 [root@localhosthad…

一个可以跑的Hadoop的WordCount程序

搭个新环境时总要折腾一下,于是干脆记下来. 程序: package com.my; import java.io.IOException; import java.util.Iterator; import java.util.StringTokenizer; import org.apache.hadoop.fs.Path; import org.apache.hadoop.io.IntWritable; import org.apache.hadoop.io.LongWritable; im…

linux 编译java并打包

一.首先是编译简单java文件(不引用外部jar包)如test.java public class test(){ System.out.println("hello world!"); } 一个简单的类,看它是怎样打包为jar的 1.第一步:先编译 javac test.java // 注意路径编译后会产生一个test.class 文件 2.第二步: jar -cvf test.jar test.class 二.假设是要引用外部jar包该怎样打包我以hadoop中的Wor…

eclipse hadoop1.2.0配置及wordcount运行

"error: failure to login"问题 http://www.cnblogs.com/xia520pi/archive/2012/05/20/2510723.html DFS Locations 本人这次的编译环境是linuxmint15 64bit,与上文的编译环境win2003不同了首先要配置linux的jdk 1.6.0_45.ant 1.9.1以及相关环境变量,这部分内容本文就不再赘述了然后需要下载eclipse和hadoop的源码包,本人下载的eclips…

命令行下编译Wordcount

1. 编辑WordCount.java文件,在下载的hadoop安装包里有WordCount的例子 http://mirrors.hust.edu.cn/apache/hadoop/common/hadoop-2.2.0/hadoop-2.2.0.tar.gz 2. 把WordCount编译成一个jar文件 mkdir wordcount_classes javac -cp classpath -d wordcount_classes WordCount.java jar -cvf wordco…

Eclipse连接Hadoop集群及WordCount实践

声明:作者原创,转载注明出处. 作者:帅气陈吃苹果一.环境准备 1.JDK安装与配置 2.Eclipse下载下载解压即可,下载地址:https://pan.baidu.com/s/1i51UsVN 3.Hadoop下载与配置下载解压即可,下载地址:https://pan.baidu.com/s/1i57ZXqt 配置环境变量: 在系统变量中新建变量:HADOOP_HOME,值:E:\Hadoop\hadoop-2.6.5 在Path系统变量中添加Hadoop的/bin路径,值:E:\Had…

【WordCount( Java )】的更多相关文章