Github项目地址:https://github.com/linzworld/word-count

项目相关要求

题目描述

Word Count

  1. 实现一个简单而完整的软件工具(源程序特征统计程序)。

  2. 进行单元测试、回归测试、效能测试,在实现上述程序的过程中使用相关的工具。

  3. 进行个人软件过程(PSP)的实践,逐步记录自己在每个软件工程环节花费的时间。

WC 项目要求

  1. wc.exe 是一个常见的工具,它能统计文本文件的字符数、单词数和行数。这个项目要求写一个命令行程序,模仿已有wc.exe 的功能,并加以扩充,给出某程序设计语言源文件的字符数、单词数和行数。

  2. 实现一个统计程序,它能正确统计程序文件中的字符数、单词数、行数,以及还具备其他扩展功能,并能够快速地处理多个文件。 具体功能要求: 程序处理用户需求的模式为:

    wc.exe [parameter] [file_name]

  3. 基本功能列表:

    wc.exe -c file.c //返回文件 file.c 的字符数(完成)

    wc.exe -w file.c //返回文件 file.c 的词的数目 (完成)

    wc.exe -l file.c //返回文件 file.c 的行数(完成)

  4. 扩展功能:

    -s 递归处理目录下符合条件的文件。(未完成) -a 返回更复杂的数据(代码行 / 空行 / 注释行)。(完成)

    空行:本行全部是空格或格式控制字符,如果包括代码,则只有不超过一个可显示的字符,例如“{”。

    代码行:本行包括多于一个字符的代码。

    注释行:本行不是代码行,并且本行包括注释。一个有趣的例子是有些程序员会在单字符后面加注释:

    } //注释 在这种情况下,这一行属于注释行。

    [file_name]  文件或目录名,可以处理一般通配符。 
  5. 高级功能:

-x 参数。这个参数单独使用。如果命令行有这个参数,则程序会显示图形界面,用户可以通过界面选取单个文件,程序就会显示文件的字符数、行数等全部统计信息。

需求举例:   wc.exe -s -a *.c(未完成)

返回当前目录及子目录中所有*.c 文件的代码行数、空行数、注释行数。

工作的完成度统计

列出各类功能下面的详细需求。

基本功能

支持 -c (完成) 支持 -w (完成) 支持 -l (完成)

扩展功能

支持 -s 参数 (未完成) 支持 -a 参数 (完成) 支持各种文件的通配符(*,?)

高级功能

基本的Windows GUI 程序操作 (未完成) 支持通过图形界面选取文件 支持通过图形界面展现文件的信息


解题思路以及注意事项

  1. 整个项目分为两个部分,一个是控制台应用,一个是JavaFX图形化页面(未完成),共用同一套处理的功能函数。

  2. 刚开始看到题目的时候,一直都是在脑子里面构想,没有过多地去用代码实际操作;

  3. 做好功能函数的封装

  4. 通配符的匹配

  5. IO流的使用


关键代码or设计说明


//获取文件行数
public static void lineCount(String fileName) throws IOException {
  BufferedReader reader= FileUtil.fileWrapper(fileName);
  line = 0;
  while(reader.readLine()!=null) {
      line ++;
  }
  reader.close();
}
//获取单词数目,单词只能匹配连续的英文字母
public static void wordCount(String fileName) throws IOException {
  BufferedReader reader= FileUtil.fileWrapper(fileName);
  word=0;

  String currentLine;
  Pattern pattern = Pattern.compile(RegexConst.WORD_REGEX);
  Matcher matcher;
  while((currentLine=reader.readLine())!=null) {
      currentLine=currentLine.trim();
      matcher= pattern.matcher(currentLine);
      while(matcher.find()) {
          word++;
      }
  }
  reader.close();
}
//获取字符数,这里的字符是包括空白字符的,所以直接使用每次读取的行字符串的长度进行累加
public static void charCount(String fileName) throws IOException {
  BufferedReader reader= FileUtil.fileWrapper(fileName);
  character=0;
  String currentLine;
  while((currentLine=reader.readLine())!=null) {
      character +=currentLine.length();
  }
  reader.close();
}
//空行:本行全部是空格或格式控制字符,如果包括代码,则只有不超过一个可显示的字符,例如“{”。
public static void nullLineCount(String fileName) throws IOException {
  BufferedReader reader= FileUtil.fileWrapper(fileName);
  nullLine =0;
  String currentLine;
  //使用正则表达式
  while((currentLine=reader.readLine())!=null) {
      if(currentLine.matches(RegexConst.nullLineRegex)) {
          nullLine++;
      }
  }
  reader.close();
}


//注释行的统计
public static void commentLineCount(String fileName) throws IOException {
  BufferedReader reader= FileUtil.fileWrapper(fileName);
  commentLine=0;
  String currentLine;
  while((currentLine=reader.readLine())!=null) {
      if(currentLine.matches(RegexConst.Single_Line_Note_REGEX)) {
          commentLine++;
      }else if(currentLine.matches(RegexConst.Block_Note_Start_REGEX)) {
          commentLine++;
          while((currentLine=reader.readLine())!=null) {
              if(currentLine.matches(RegexConst.Block_Note_End_REGEX)) {
                  commentLine++;
                  break;
              }else {
                  commentLine++;
              }
          }
      }
  }
}

//代码行数
public static void codeLineCount(String fileName) throws IOException {
  BufferedReader reader= FileUtil.fileWrapper(fileName);
  lineCount(fileName);
  nullLineCount(fileName);
  commentLineCount(fileName);
  codeLine = line - nullLine - commentLine;
}

命令选择

//选择命令,并执行
public static void selectCommand(String command,String fileName) throws IOException
{
    System.out.println("当前文件名为:"+fileName);
    // 实例化workCount
    switch (command) {//判断命令并执行
        case "-c":
            BasicService.charCount(fileName);
            System.out.println("字符数:"+BasicService.character);
            break;
        case "-l":
            BasicService.lineCount(fileName);
            System.out.println("行数:"+BasicService.line);
            break;
        case "-w":
            BasicService.wordCount(fileName);
            System.out.println("单词数:"+BasicService.word);
            break;
        case "-a":
            BasicService.codeLineCount(fileName);
            BasicService.nullLineCount(fileName);
            BasicService.commentLineCount(fileName);
            System.out.println("代码行数:"+BasicService.codeLine);
            System.out.println("空行数:"+BasicService.nullLine);
            System.out.println("注释行数:"+BasicService.commentLine);
            break;
        case "-s":
            //BasicService.getAllFilefileName(fileName);
            break;
        default:
            System.out.println("当前命令格式不存在! "+command);
            break;
    }
}


测试运行

PSP

PSP2.1

Personal Software Process Stages

预估耗时(分钟)

实际耗时(分钟)

 

Planning

计划

60

70

· Estimate

· 估计这个任务需要多少时间

60

70

Development

开发

620

1465

· Analysis

· 需求分析 (包括学习新技术)

50

60

· Design Spec

· 生成设计文档

40

400

· Design Review

· 设计复审 (和同事审核设计文档)

30

40

· Coding Standard

· 代码规范 (为目前的开发制定合适的规范)

10

15

· Design

· 具体设计

150

300

· Coding

· 具体编码

240

500

· Code Review

· 代码复审

40

50

· Test

· 测试(自我测试,修改代码,提交修改)

60

100

Reporting

报告

130

140

· Test Report

· 测试报告

50

60

· Size Measurement

· 计算工作量

40

20

· Postmortem & Process Improvement Plan

· 事后总结, 并提出过程改进计划

40

60

合计

910

1675


  • 项目小结

    1. 通过这个java项目,我意识到实际开发和设想中的时间是不一样的,实际开发中存在各种各样的问题,而且我在IO流这方面的知识掌握得不够全面,对于文件的操作还是不太会,导致后面的一个功能没做出来。

    2. 没有做好时间的规划,开发中没有充分集中注意力,导致效率的降低。

    3. 过于精益求精,导致手高眼低的情况的发生。

WordCount(Java实现)的更多相关文章

  1. 个人项目:WordCount (Java)

    一.Github项目地址 https://github.com/misterchaos/WordCount 二.解题思路 2.1 基本需求分析 经过仔细阅读题目,分析得出项目的基本需求如下: wc.e ...

  2. WordCount( Java )

    Github项目地址:https://github.com/Sabot1203/WordCount 一. 题目描述 实现一个简单而完整的软件工具(源程序特征统计程序). 进行单元测试.回归测试.效能测 ...

  3. 大数据之路week07--day03(Hadoop深入理解,JAVA代码编写WordCount程序,以及扩展升级)

    什么是MapReduce 你想数出一摞牌中有多少张黑桃.直观方式是一张一张检查并且数出有多少张是黑桃. MapReduce方法则是: 1.给在座的所有玩家中分配这摞牌 2.让每个玩家数自己手中的牌有几 ...

  4. Eclipse 执行成功的 Hadoop-1.2.1 WordCount 源码

    万事开头难.最近在学习Hadoop,先是搭建各种版本环境,从2.2.0到2.3.0,再到1.2.1,终于都搭起来了,折腾了1周时间,之后开始尝试使用Eclipse编写小demo.仅复制一个现成的Wor ...

  5. 《Java学习笔记(第8版)》学习指导

    <Java学习笔记(第8版)>学习指导 目录 图书简况 学习指导 第一章 Java平台概论 第二章 从JDK到IDE 第三章 基础语法 第四章 认识对象 第五章 对象封装 第六章 继承与多 ...

  6. 【hadoop】——修改hadoop FileUtil.java,解决权限检查的问题

    在Hadoop Eclipse开发环境搭建这篇文章中,第15.)中提到权限相关的异常,如下: 15/01/30 10:08:17 WARN util.NativeCodeLoader: Unable ...

  7. hadoop的统计单词程序WordCount提示找不到WordCount类

    按这里的教程: http://www.imooc.com/learn/391 试验时,发现在wordcount的最后一步一直提示如下错误: Exception in thread "main ...

  8. 开源分布式实时计算引擎 Iveely Computing 之 WordCount 详解(3)

    WordCount是很多分布式计算中,最常用的例子,例如Hadoop.Storm,Iveely Computing也不例外.明白了WordCount在Iveely Computing上的运行原理,就很 ...

  9. Hadoop入门程序WordCount的执行过程

    首先编写WordCount.java源文件,分别通过map和reduce方法统计文本中每个单词出现的次数,然后按照字母的顺序排列输出, Map过程首先是多个map并行提取多个句子里面的单词然后分别列出 ...

随机推荐

  1. nvidia-smi:控制您的GPU

    翻译  https://www.microway.com/hpc-tech-tips/nvidia-smi_control-your-gpus/ 大多数用户知道如何检查其CPU的状态,查看多少系统内存 ...

  2. ThreadLocal刨根问底

    一.ThreadLocal使用场景 数据库连接connection对象使用,每个客户都能使用自己的connection对象.不会出现客户A操作关闭了客户B的connection 案例:https:// ...

  3. GIT pull 如何解决 fatal: refusing to merge unrelated histories

    在Github新建一个仓库,写了Readme.md,然后把本地一个已有内容的仓库上传. 先pull,因为两个仓库不同,发现refusing to merge unrelated histories,无 ...

  4. 极简 Node.js 入门 - 1.3 调试

    极简 Node.js 入门系列教程:https://www.yuque.com/sunluyong/node 本文更佳阅读体验:https://www.yuque.com/sunluyong/node ...

  5. java 接口一

    一 接口的概念 接口是功能的集合,同样可看做是一种数据类型,是比抽象类更为抽象的”类”. 接口只描述所应该具备的方法,并没有具体实现,具体的实现由接口的实现类(相当于接口 的子类)来完成.这样将功能的 ...

  6. 洛谷P1048 采药 二维dp化一维

    题目描述 辰辰是个天资聪颖的孩子,他的梦想是成为世界上最伟大的医师.为此,他想拜附近最有威望的医师为师.医师为了判断他的资质,给他出了一个难题.医师把他带到一个到处都是草药的山洞里对他说:“孩子,这个 ...

  7. AMD 5700 XT显卡装ubuntu18.04.* 驱动的问题解决(全)

    公司开发需要测试新的 AMD显卡,由于测试服务器上的显卡是英伟达的显卡所以换完后要安装相应的驱动.由于之前装机的同事装的ubuntu是18.04.5 恰巧18.04.5在amd官网上没有相匹配的驱动( ...

  8. Salesforce学习笔记之Actions and Recommendations

    设置Actions and Recommendations(Salesforce提供的标准元素),Salesforce上的文档说有两种方法,即Deployment和Process Builder(通过 ...

  9. 【Gin-API系列】Gin中间件之日志模块(四)

    日志是程序开发中必不可少的模块,同时也是日常运维定位故障的最重要环节之一.一般日志类的操作包括日志采集,日志查询,日志监控.日志统计等等.本文,我们将介绍日志模块在Gin中的使用. Golang如何打 ...

  10. python re之search/match差别

    search → find something anywhere in the string and return a match object. match → find something at ...