WordCount(Java实现)
Github项目地址:https://github.com/linzworld/word-count
项目相关要求
题目描述
Word Count
实现一个简单而完整的软件工具(源程序特征统计程序)。
进行单元测试、回归测试、效能测试,在实现上述程序的过程中使用相关的工具。
进行个人软件过程(PSP)的实践,逐步记录自己在每个软件工程环节花费的时间。
WC 项目要求
wc.exe 是一个常见的工具,它能统计文本文件的字符数、单词数和行数。这个项目要求写一个命令行程序,模仿已有wc.exe 的功能,并加以扩充,给出某程序设计语言源文件的字符数、单词数和行数。
实现一个统计程序,它能正确统计程序文件中的字符数、单词数、行数,以及还具备其他扩展功能,并能够快速地处理多个文件。 具体功能要求: 程序处理用户需求的模式为:
wc.exe [parameter] [file_name]
基本功能列表:
wc.exe -c file.c //返回文件 file.c 的字符数(完成)
wc.exe -w file.c //返回文件 file.c 的词的数目 (完成)
wc.exe -l file.c //返回文件 file.c 的行数(完成)
扩展功能:
-s 递归处理目录下符合条件的文件。(未完成) -a 返回更复杂的数据(代码行 / 空行 / 注释行)。(完成)
空行:本行全部是空格或格式控制字符,如果包括代码,则只有不超过一个可显示的字符,例如“{”。
代码行:本行包括多于一个字符的代码。
注释行:本行不是代码行,并且本行包括注释。一个有趣的例子是有些程序员会在单字符后面加注释:
} //注释 在这种情况下,这一行属于注释行。
[file_name] 文件或目录名,可以处理一般通配符。高级功能:
-x 参数。这个参数单独使用。如果命令行有这个参数,则程序会显示图形界面,用户可以通过界面选取单个文件,程序就会显示文件的字符数、行数等全部统计信息。
需求举例: wc.exe -s -a *.c(未完成)
返回当前目录及子目录中所有*.c 文件的代码行数、空行数、注释行数。
工作的完成度统计
列出各类功能下面的详细需求。
基本功能
支持 -c (完成) 支持 -w (完成) 支持 -l (完成)
扩展功能
支持 -s 参数 (未完成) 支持 -a 参数 (完成) 支持各种文件的通配符(*,?)
高级功能
基本的Windows GUI 程序操作 (未完成) 支持通过图形界面选取文件 支持通过图形界面展现文件的信息
解题思路以及注意事项
整个项目分为两个部分,一个是控制台应用,一个是JavaFX图形化页面(未完成),共用同一套处理的功能函数。
刚开始看到题目的时候,一直都是在脑子里面构想,没有过多地去用代码实际操作;
做好功能函数的封装
通配符的匹配
IO流的使用
关键代码or设计说明
//获取文件行数
public static void lineCount(String fileName) throws IOException {
BufferedReader reader= FileUtil.fileWrapper(fileName);
line = 0;
while(reader.readLine()!=null) {
line ++;
}
reader.close();
}
//获取单词数目,单词只能匹配连续的英文字母
public static void wordCount(String fileName) throws IOException {
BufferedReader reader= FileUtil.fileWrapper(fileName);
word=0;
String currentLine;
Pattern pattern = Pattern.compile(RegexConst.WORD_REGEX);
Matcher matcher;
while((currentLine=reader.readLine())!=null) {
currentLine=currentLine.trim();
matcher= pattern.matcher(currentLine);
while(matcher.find()) {
word++;
}
}
reader.close();
}
//获取字符数,这里的字符是包括空白字符的,所以直接使用每次读取的行字符串的长度进行累加
public static void charCount(String fileName) throws IOException {
BufferedReader reader= FileUtil.fileWrapper(fileName);
character=0;
String currentLine;
while((currentLine=reader.readLine())!=null) {
character +=currentLine.length();
}
reader.close();
}
//空行:本行全部是空格或格式控制字符,如果包括代码,则只有不超过一个可显示的字符,例如“{”。
public static void nullLineCount(String fileName) throws IOException {
BufferedReader reader= FileUtil.fileWrapper(fileName);
nullLine =0;
String currentLine;
//使用正则表达式
while((currentLine=reader.readLine())!=null) {
if(currentLine.matches(RegexConst.nullLineRegex)) {
nullLine++;
}
}
reader.close();
}
//注释行的统计
public static void commentLineCount(String fileName) throws IOException {
BufferedReader reader= FileUtil.fileWrapper(fileName);
commentLine=0;
String currentLine;
while((currentLine=reader.readLine())!=null) {
if(currentLine.matches(RegexConst.Single_Line_Note_REGEX)) {
commentLine++;
}else if(currentLine.matches(RegexConst.Block_Note_Start_REGEX)) {
commentLine++;
while((currentLine=reader.readLine())!=null) {
if(currentLine.matches(RegexConst.Block_Note_End_REGEX)) {
commentLine++;
break;
}else {
commentLine++;
}
}
}
}
}
//代码行数
public static void codeLineCount(String fileName) throws IOException {
BufferedReader reader= FileUtil.fileWrapper(fileName);
lineCount(fileName);
nullLineCount(fileName);
commentLineCount(fileName);
codeLine = line - nullLine - commentLine;
}
命令选择
//选择命令,并执行
public static void selectCommand(String command,String fileName) throws IOException
{
System.out.println("当前文件名为:"+fileName);
// 实例化workCount
switch (command) {//判断命令并执行
case "-c":
BasicService.charCount(fileName);
System.out.println("字符数:"+BasicService.character);
break;
case "-l":
BasicService.lineCount(fileName);
System.out.println("行数:"+BasicService.line);
break;
case "-w":
BasicService.wordCount(fileName);
System.out.println("单词数:"+BasicService.word);
break;
case "-a":
BasicService.codeLineCount(fileName);
BasicService.nullLineCount(fileName);
BasicService.commentLineCount(fileName);
System.out.println("代码行数:"+BasicService.codeLine);
System.out.println("空行数:"+BasicService.nullLine);
System.out.println("注释行数:"+BasicService.commentLine);
break;
case "-s":
//BasicService.getAllFilefileName(fileName);
break;
default:
System.out.println("当前命令格式不存在! "+command);
break;
}
}
测试运行
PSP
PSP2.1 |
Personal Software Process Stages |
预估耗时(分钟) |
实际耗时(分钟) |
|
Planning |
计划 |
60 |
70 |
|
· Estimate |
· 估计这个任务需要多少时间 |
60 |
70 |
|
Development |
开发 |
620 |
1465 |
|
· Analysis |
· 需求分析 (包括学习新技术) |
50 |
60 |
|
· Design Spec |
· 生成设计文档 |
40 |
400 |
|
· Design Review |
· 设计复审 (和同事审核设计文档) |
30 |
40 |
|
· Coding Standard |
· 代码规范 (为目前的开发制定合适的规范) |
10 |
15 |
|
· Design |
· 具体设计 |
150 |
300 |
|
· Coding |
· 具体编码 |
240 |
500 |
|
· Code Review |
· 代码复审 |
40 |
50 |
|
· Test |
· 测试(自我测试,修改代码,提交修改) |
60 |
100 |
|
Reporting |
报告 |
130 |
140 |
|
· Test Report |
· 测试报告 |
50 |
60 |
|
· Size Measurement |
· 计算工作量 |
40 |
20 |
|
· Postmortem & Process Improvement Plan |
· 事后总结, 并提出过程改进计划 |
40 |
60 |
|
合计 |
910 |
1675 |
项目小结
通过这个java项目,我意识到实际开发和设想中的时间是不一样的,实际开发中存在各种各样的问题,而且我在IO流这方面的知识掌握得不够全面,对于文件的操作还是不太会,导致后面的一个功能没做出来。
没有做好时间的规划,开发中没有充分集中注意力,导致效率的降低。
过于精益求精,导致手高眼低的情况的发生。
WordCount(Java实现)的更多相关文章
- 个人项目:WordCount (Java)
一.Github项目地址 https://github.com/misterchaos/WordCount 二.解题思路 2.1 基本需求分析 经过仔细阅读题目,分析得出项目的基本需求如下: wc.e ...
- WordCount( Java )
Github项目地址:https://github.com/Sabot1203/WordCount 一. 题目描述 实现一个简单而完整的软件工具(源程序特征统计程序). 进行单元测试.回归测试.效能测 ...
- 大数据之路week07--day03(Hadoop深入理解,JAVA代码编写WordCount程序,以及扩展升级)
什么是MapReduce 你想数出一摞牌中有多少张黑桃.直观方式是一张一张检查并且数出有多少张是黑桃. MapReduce方法则是: 1.给在座的所有玩家中分配这摞牌 2.让每个玩家数自己手中的牌有几 ...
- Eclipse 执行成功的 Hadoop-1.2.1 WordCount 源码
万事开头难.最近在学习Hadoop,先是搭建各种版本环境,从2.2.0到2.3.0,再到1.2.1,终于都搭起来了,折腾了1周时间,之后开始尝试使用Eclipse编写小demo.仅复制一个现成的Wor ...
- 《Java学习笔记(第8版)》学习指导
<Java学习笔记(第8版)>学习指导 目录 图书简况 学习指导 第一章 Java平台概论 第二章 从JDK到IDE 第三章 基础语法 第四章 认识对象 第五章 对象封装 第六章 继承与多 ...
- 【hadoop】——修改hadoop FileUtil.java,解决权限检查的问题
在Hadoop Eclipse开发环境搭建这篇文章中,第15.)中提到权限相关的异常,如下: 15/01/30 10:08:17 WARN util.NativeCodeLoader: Unable ...
- hadoop的统计单词程序WordCount提示找不到WordCount类
按这里的教程: http://www.imooc.com/learn/391 试验时,发现在wordcount的最后一步一直提示如下错误: Exception in thread "main ...
- 开源分布式实时计算引擎 Iveely Computing 之 WordCount 详解(3)
WordCount是很多分布式计算中,最常用的例子,例如Hadoop.Storm,Iveely Computing也不例外.明白了WordCount在Iveely Computing上的运行原理,就很 ...
- Hadoop入门程序WordCount的执行过程
首先编写WordCount.java源文件,分别通过map和reduce方法统计文本中每个单词出现的次数,然后按照字母的顺序排列输出, Map过程首先是多个map并行提取多个句子里面的单词然后分别列出 ...
随机推荐
- IDEA必备插件系列-Rainbow Brackets(彩虹括号)
Rainbow Brackets ,就是彩虹括号,各种鲜明颜色的括号 这个一个开源的项目: https://github.com/izhangzhihao/intellij-rainbow-brack ...
- 我是键盘侠-键盘流神器Vimium
黑客的浏览器. Vimium本着Vim的精神为导航和控制提供键盘快捷键. 注意:谷歌不允许 Vimium在 Chrome Web Store页面和 新选项卡页面上运行.所以按键无效不要惊讶 Vimiu ...
- 解决Xshell 工具连接不上VirtualBox虚拟机
初次尝试用VirtualBox安装Linux虚拟机,却遇到了一些问题,特地记录于此,方便后面查阅! 首先简易记录下安装Linux虚拟机过程: 大致经过如下步骤:新建虚拟电脑,加载Linux版本镜像安装 ...
- 02【Collection、泛型】
主要内容 Collection集合 迭代器 增强for 泛型 第一章 Collection集合 1.1 集合概述 在前面基础班我们已经学习过并使用过集合ArrayList<E> ,那么集合 ...
- C#LeetCode刷题之#665-非递减数列( Non-decreasing Array)
问题 该文章的最新版本已迁移至个人博客[比特飞],单击链接 https://www.byteflying.com/archives/3732 访问. 给定一个长度为 n 的整数数组,你的任务是判断在最 ...
- 用python爬虫监控CSDN博客阅读量
作为一个博客新人,对自己博客的访问量也是很在意的,刚好在学python爬虫,所以正好利用一下,写一个python程序来监控博客文章访问量 效果 代码会自动爬取文章列表,并且获取标题和访问量,写入exc ...
- STM32 重启之后程序丢失
1 BOOT1 BOOT0都已经接10K接地,晶振波形正常 2 在主程序最开始运行的地方加入5秒的延时,程序不会丢失.原因可能为单片机其它外设没有准备好 int main(void) { delay_ ...
- 几个递进的make file
春节在家写的几个递进的make file,部分有点问题.接下来 有空我要把GNU make的手册看完.不然这方面太菜了. GNU make手册 都需要make先设置环境变量BUILD_MODE为run ...
- 实现0.5px边框线
实现0.5px边框方法 方案一:利用渐变(原理:高度1px,背景渐变,一半有颜色,一半透明) CSS部分 .container { width: 500px; margin: 0px auto; } ...
- jqgrid 自定义文本框、选择框等查询
要实现jqgrid的自定义查询可通过表格获取查询的条件,再给jqgrid表格发送postData参数. HTML: <table id="querytable" border ...