Github项目地址:https://github.com/linzworld/word-count

项目相关要求

题目描述

Word Count

  1. 实现一个简单而完整的软件工具(源程序特征统计程序)。

  2. 进行单元测试、回归测试、效能测试,在实现上述程序的过程中使用相关的工具。

  3. 进行个人软件过程(PSP)的实践,逐步记录自己在每个软件工程环节花费的时间。

WC 项目要求

  1. wc.exe 是一个常见的工具,它能统计文本文件的字符数、单词数和行数。这个项目要求写一个命令行程序,模仿已有wc.exe 的功能,并加以扩充,给出某程序设计语言源文件的字符数、单词数和行数。

  2. 实现一个统计程序,它能正确统计程序文件中的字符数、单词数、行数,以及还具备其他扩展功能,并能够快速地处理多个文件。 具体功能要求: 程序处理用户需求的模式为:

    wc.exe [parameter] [file_name]

  3. 基本功能列表:

    wc.exe -c file.c //返回文件 file.c 的字符数(完成)

    wc.exe -w file.c //返回文件 file.c 的词的数目 (完成)

    wc.exe -l file.c //返回文件 file.c 的行数(完成)

  4. 扩展功能:

    -s 递归处理目录下符合条件的文件。(未完成) -a 返回更复杂的数据(代码行 / 空行 / 注释行)。(完成)

    空行:本行全部是空格或格式控制字符,如果包括代码,则只有不超过一个可显示的字符,例如“{”。

    代码行:本行包括多于一个字符的代码。

    注释行:本行不是代码行,并且本行包括注释。一个有趣的例子是有些程序员会在单字符后面加注释:

    } //注释 在这种情况下,这一行属于注释行。

    [file_name]  文件或目录名,可以处理一般通配符。 
  5. 高级功能:

-x 参数。这个参数单独使用。如果命令行有这个参数,则程序会显示图形界面,用户可以通过界面选取单个文件,程序就会显示文件的字符数、行数等全部统计信息。

需求举例:   wc.exe -s -a *.c(未完成)

返回当前目录及子目录中所有*.c 文件的代码行数、空行数、注释行数。

工作的完成度统计

列出各类功能下面的详细需求。

基本功能

支持 -c (完成) 支持 -w (完成) 支持 -l (完成)

扩展功能

支持 -s 参数 (未完成) 支持 -a 参数 (完成) 支持各种文件的通配符(*,?)

高级功能

基本的Windows GUI 程序操作 (未完成) 支持通过图形界面选取文件 支持通过图形界面展现文件的信息


解题思路以及注意事项

  1. 整个项目分为两个部分,一个是控制台应用,一个是JavaFX图形化页面(未完成),共用同一套处理的功能函数。

  2. 刚开始看到题目的时候,一直都是在脑子里面构想,没有过多地去用代码实际操作;

  3. 做好功能函数的封装

  4. 通配符的匹配

  5. IO流的使用


关键代码or设计说明


//获取文件行数
public static void lineCount(String fileName) throws IOException {
  BufferedReader reader= FileUtil.fileWrapper(fileName);
  line = 0;
  while(reader.readLine()!=null) {
      line ++;
  }
  reader.close();
}
//获取单词数目,单词只能匹配连续的英文字母
public static void wordCount(String fileName) throws IOException {
  BufferedReader reader= FileUtil.fileWrapper(fileName);
  word=0;

  String currentLine;
  Pattern pattern = Pattern.compile(RegexConst.WORD_REGEX);
  Matcher matcher;
  while((currentLine=reader.readLine())!=null) {
      currentLine=currentLine.trim();
      matcher= pattern.matcher(currentLine);
      while(matcher.find()) {
          word++;
      }
  }
  reader.close();
}
//获取字符数,这里的字符是包括空白字符的,所以直接使用每次读取的行字符串的长度进行累加
public static void charCount(String fileName) throws IOException {
  BufferedReader reader= FileUtil.fileWrapper(fileName);
  character=0;
  String currentLine;
  while((currentLine=reader.readLine())!=null) {
      character +=currentLine.length();
  }
  reader.close();
}
//空行:本行全部是空格或格式控制字符,如果包括代码,则只有不超过一个可显示的字符,例如“{”。
public static void nullLineCount(String fileName) throws IOException {
  BufferedReader reader= FileUtil.fileWrapper(fileName);
  nullLine =0;
  String currentLine;
  //使用正则表达式
  while((currentLine=reader.readLine())!=null) {
      if(currentLine.matches(RegexConst.nullLineRegex)) {
          nullLine++;
      }
  }
  reader.close();
}


//注释行的统计
public static void commentLineCount(String fileName) throws IOException {
  BufferedReader reader= FileUtil.fileWrapper(fileName);
  commentLine=0;
  String currentLine;
  while((currentLine=reader.readLine())!=null) {
      if(currentLine.matches(RegexConst.Single_Line_Note_REGEX)) {
          commentLine++;
      }else if(currentLine.matches(RegexConst.Block_Note_Start_REGEX)) {
          commentLine++;
          while((currentLine=reader.readLine())!=null) {
              if(currentLine.matches(RegexConst.Block_Note_End_REGEX)) {
                  commentLine++;
                  break;
              }else {
                  commentLine++;
              }
          }
      }
  }
}

//代码行数
public static void codeLineCount(String fileName) throws IOException {
  BufferedReader reader= FileUtil.fileWrapper(fileName);
  lineCount(fileName);
  nullLineCount(fileName);
  commentLineCount(fileName);
  codeLine = line - nullLine - commentLine;
}

命令选择

//选择命令,并执行
public static void selectCommand(String command,String fileName) throws IOException
{
    System.out.println("当前文件名为:"+fileName);
    // 实例化workCount
    switch (command) {//判断命令并执行
        case "-c":
            BasicService.charCount(fileName);
            System.out.println("字符数:"+BasicService.character);
            break;
        case "-l":
            BasicService.lineCount(fileName);
            System.out.println("行数:"+BasicService.line);
            break;
        case "-w":
            BasicService.wordCount(fileName);
            System.out.println("单词数:"+BasicService.word);
            break;
        case "-a":
            BasicService.codeLineCount(fileName);
            BasicService.nullLineCount(fileName);
            BasicService.commentLineCount(fileName);
            System.out.println("代码行数:"+BasicService.codeLine);
            System.out.println("空行数:"+BasicService.nullLine);
            System.out.println("注释行数:"+BasicService.commentLine);
            break;
        case "-s":
            //BasicService.getAllFilefileName(fileName);
            break;
        default:
            System.out.println("当前命令格式不存在! "+command);
            break;
    }
}


测试运行

PSP

PSP2.1

Personal Software Process Stages

预估耗时(分钟)

实际耗时(分钟)

 

Planning

计划

60

70

· Estimate

· 估计这个任务需要多少时间

60

70

Development

开发

620

1465

· Analysis

· 需求分析 (包括学习新技术)

50

60

· Design Spec

· 生成设计文档

40

400

· Design Review

· 设计复审 (和同事审核设计文档)

30

40

· Coding Standard

· 代码规范 (为目前的开发制定合适的规范)

10

15

· Design

· 具体设计

150

300

· Coding

· 具体编码

240

500

· Code Review

· 代码复审

40

50

· Test

· 测试(自我测试,修改代码,提交修改)

60

100

Reporting

报告

130

140

· Test Report

· 测试报告

50

60

· Size Measurement

· 计算工作量

40

20

· Postmortem & Process Improvement Plan

· 事后总结, 并提出过程改进计划

40

60

合计

910

1675


  • 项目小结

    1. 通过这个java项目,我意识到实际开发和设想中的时间是不一样的,实际开发中存在各种各样的问题,而且我在IO流这方面的知识掌握得不够全面,对于文件的操作还是不太会,导致后面的一个功能没做出来。

    2. 没有做好时间的规划,开发中没有充分集中注意力,导致效率的降低。

    3. 过于精益求精,导致手高眼低的情况的发生。

WordCount(Java实现)的更多相关文章

  1. 个人项目:WordCount (Java)

    一.Github项目地址 https://github.com/misterchaos/WordCount 二.解题思路 2.1 基本需求分析 经过仔细阅读题目,分析得出项目的基本需求如下: wc.e ...

  2. WordCount( Java )

    Github项目地址:https://github.com/Sabot1203/WordCount 一. 题目描述 实现一个简单而完整的软件工具(源程序特征统计程序). 进行单元测试.回归测试.效能测 ...

  3. 大数据之路week07--day03(Hadoop深入理解,JAVA代码编写WordCount程序,以及扩展升级)

    什么是MapReduce 你想数出一摞牌中有多少张黑桃.直观方式是一张一张检查并且数出有多少张是黑桃. MapReduce方法则是: 1.给在座的所有玩家中分配这摞牌 2.让每个玩家数自己手中的牌有几 ...

  4. Eclipse 执行成功的 Hadoop-1.2.1 WordCount 源码

    万事开头难.最近在学习Hadoop,先是搭建各种版本环境,从2.2.0到2.3.0,再到1.2.1,终于都搭起来了,折腾了1周时间,之后开始尝试使用Eclipse编写小demo.仅复制一个现成的Wor ...

  5. 《Java学习笔记(第8版)》学习指导

    <Java学习笔记(第8版)>学习指导 目录 图书简况 学习指导 第一章 Java平台概论 第二章 从JDK到IDE 第三章 基础语法 第四章 认识对象 第五章 对象封装 第六章 继承与多 ...

  6. 【hadoop】——修改hadoop FileUtil.java,解决权限检查的问题

    在Hadoop Eclipse开发环境搭建这篇文章中,第15.)中提到权限相关的异常,如下: 15/01/30 10:08:17 WARN util.NativeCodeLoader: Unable ...

  7. hadoop的统计单词程序WordCount提示找不到WordCount类

    按这里的教程: http://www.imooc.com/learn/391 试验时,发现在wordcount的最后一步一直提示如下错误: Exception in thread "main ...

  8. 开源分布式实时计算引擎 Iveely Computing 之 WordCount 详解(3)

    WordCount是很多分布式计算中,最常用的例子,例如Hadoop.Storm,Iveely Computing也不例外.明白了WordCount在Iveely Computing上的运行原理,就很 ...

  9. Hadoop入门程序WordCount的执行过程

    首先编写WordCount.java源文件,分别通过map和reduce方法统计文本中每个单词出现的次数,然后按照字母的顺序排列输出, Map过程首先是多个map并行提取多个句子里面的单词然后分别列出 ...

随机推荐

  1. IDEA必备插件系列-Rainbow Brackets(彩虹括号)

    Rainbow Brackets ,就是彩虹括号,各种鲜明颜色的括号 这个一个开源的项目: https://github.com/izhangzhihao/intellij-rainbow-brack ...

  2. 我是键盘侠-键盘流神器Vimium

    黑客的浏览器. Vimium本着Vim的精神为导航和控制提供键盘快捷键. 注意:谷歌不允许 Vimium在 Chrome Web Store页面和 新选项卡页面上运行.所以按键无效不要惊讶 Vimiu ...

  3. 解决Xshell 工具连接不上VirtualBox虚拟机

    初次尝试用VirtualBox安装Linux虚拟机,却遇到了一些问题,特地记录于此,方便后面查阅! 首先简易记录下安装Linux虚拟机过程: 大致经过如下步骤:新建虚拟电脑,加载Linux版本镜像安装 ...

  4. 02【Collection、泛型】

    主要内容 Collection集合 迭代器 增强for 泛型 第一章 Collection集合 1.1 集合概述 在前面基础班我们已经学习过并使用过集合ArrayList<E> ,那么集合 ...

  5. C#LeetCode刷题之#665-非递减数列( Non-decreasing Array)

    问题 该文章的最新版本已迁移至个人博客[比特飞],单击链接 https://www.byteflying.com/archives/3732 访问. 给定一个长度为 n 的整数数组,你的任务是判断在最 ...

  6. 用python爬虫监控CSDN博客阅读量

    作为一个博客新人,对自己博客的访问量也是很在意的,刚好在学python爬虫,所以正好利用一下,写一个python程序来监控博客文章访问量 效果 代码会自动爬取文章列表,并且获取标题和访问量,写入exc ...

  7. STM32 重启之后程序丢失

    1 BOOT1 BOOT0都已经接10K接地,晶振波形正常 2 在主程序最开始运行的地方加入5秒的延时,程序不会丢失.原因可能为单片机其它外设没有准备好 int main(void) { delay_ ...

  8. 几个递进的make file

    春节在家写的几个递进的make file,部分有点问题.接下来 有空我要把GNU make的手册看完.不然这方面太菜了. GNU make手册 都需要make先设置环境变量BUILD_MODE为run ...

  9. 实现0.5px边框线

    实现0.5px边框方法 方案一:利用渐变(原理:高度1px,背景渐变,一半有颜色,一半透明) CSS部分 .container { width: 500px; margin: 0px auto; } ...

  10. jqgrid 自定义文本框、选择框等查询

    要实现jqgrid的自定义查询可通过表格获取查询的条件,再给jqgrid表格发送postData参数. HTML: <table id="querytable" border ...