Github项目地址:https://github.com/linzworld/word-count

项目相关要求

题目描述

Word Count

  1. 实现一个简单而完整的软件工具(源程序特征统计程序)。

  2. 进行单元测试、回归测试、效能测试,在实现上述程序的过程中使用相关的工具。

  3. 进行个人软件过程(PSP)的实践,逐步记录自己在每个软件工程环节花费的时间。

WC 项目要求

  1. wc.exe 是一个常见的工具,它能统计文本文件的字符数、单词数和行数。这个项目要求写一个命令行程序,模仿已有wc.exe 的功能,并加以扩充,给出某程序设计语言源文件的字符数、单词数和行数。

  2. 实现一个统计程序,它能正确统计程序文件中的字符数、单词数、行数,以及还具备其他扩展功能,并能够快速地处理多个文件。 具体功能要求: 程序处理用户需求的模式为:

    wc.exe [parameter] [file_name]

  3. 基本功能列表:

    wc.exe -c file.c //返回文件 file.c 的字符数(完成)

    wc.exe -w file.c //返回文件 file.c 的词的数目 (完成)

    wc.exe -l file.c //返回文件 file.c 的行数(完成)

  4. 扩展功能:

    -s 递归处理目录下符合条件的文件。(未完成) -a 返回更复杂的数据(代码行 / 空行 / 注释行)。(完成)

    空行:本行全部是空格或格式控制字符,如果包括代码,则只有不超过一个可显示的字符,例如“{”。

    代码行:本行包括多于一个字符的代码。

    注释行:本行不是代码行,并且本行包括注释。一个有趣的例子是有些程序员会在单字符后面加注释:

    } //注释 在这种情况下,这一行属于注释行。

    [file_name]  文件或目录名,可以处理一般通配符。 
  5. 高级功能:

-x 参数。这个参数单独使用。如果命令行有这个参数,则程序会显示图形界面,用户可以通过界面选取单个文件,程序就会显示文件的字符数、行数等全部统计信息。

需求举例:   wc.exe -s -a *.c(未完成)

返回当前目录及子目录中所有*.c 文件的代码行数、空行数、注释行数。

工作的完成度统计

列出各类功能下面的详细需求。

基本功能

支持 -c (完成) 支持 -w (完成) 支持 -l (完成)

扩展功能

支持 -s 参数 (未完成) 支持 -a 参数 (完成) 支持各种文件的通配符(*,?)

高级功能

基本的Windows GUI 程序操作 (未完成) 支持通过图形界面选取文件 支持通过图形界面展现文件的信息


解题思路以及注意事项

  1. 整个项目分为两个部分,一个是控制台应用,一个是JavaFX图形化页面(未完成),共用同一套处理的功能函数。

  2. 刚开始看到题目的时候,一直都是在脑子里面构想,没有过多地去用代码实际操作;

  3. 做好功能函数的封装

  4. 通配符的匹配

  5. IO流的使用


关键代码or设计说明


//获取文件行数
public static void lineCount(String fileName) throws IOException {
  BufferedReader reader= FileUtil.fileWrapper(fileName);
  line = 0;
  while(reader.readLine()!=null) {
      line ++;
  }
  reader.close();
}
//获取单词数目,单词只能匹配连续的英文字母
public static void wordCount(String fileName) throws IOException {
  BufferedReader reader= FileUtil.fileWrapper(fileName);
  word=0;

  String currentLine;
  Pattern pattern = Pattern.compile(RegexConst.WORD_REGEX);
  Matcher matcher;
  while((currentLine=reader.readLine())!=null) {
      currentLine=currentLine.trim();
      matcher= pattern.matcher(currentLine);
      while(matcher.find()) {
          word++;
      }
  }
  reader.close();
}
//获取字符数,这里的字符是包括空白字符的,所以直接使用每次读取的行字符串的长度进行累加
public static void charCount(String fileName) throws IOException {
  BufferedReader reader= FileUtil.fileWrapper(fileName);
  character=0;
  String currentLine;
  while((currentLine=reader.readLine())!=null) {
      character +=currentLine.length();
  }
  reader.close();
}
//空行:本行全部是空格或格式控制字符,如果包括代码,则只有不超过一个可显示的字符,例如“{”。
public static void nullLineCount(String fileName) throws IOException {
  BufferedReader reader= FileUtil.fileWrapper(fileName);
  nullLine =0;
  String currentLine;
  //使用正则表达式
  while((currentLine=reader.readLine())!=null) {
      if(currentLine.matches(RegexConst.nullLineRegex)) {
          nullLine++;
      }
  }
  reader.close();
}


//注释行的统计
public static void commentLineCount(String fileName) throws IOException {
  BufferedReader reader= FileUtil.fileWrapper(fileName);
  commentLine=0;
  String currentLine;
  while((currentLine=reader.readLine())!=null) {
      if(currentLine.matches(RegexConst.Single_Line_Note_REGEX)) {
          commentLine++;
      }else if(currentLine.matches(RegexConst.Block_Note_Start_REGEX)) {
          commentLine++;
          while((currentLine=reader.readLine())!=null) {
              if(currentLine.matches(RegexConst.Block_Note_End_REGEX)) {
                  commentLine++;
                  break;
              }else {
                  commentLine++;
              }
          }
      }
  }
}

//代码行数
public static void codeLineCount(String fileName) throws IOException {
  BufferedReader reader= FileUtil.fileWrapper(fileName);
  lineCount(fileName);
  nullLineCount(fileName);
  commentLineCount(fileName);
  codeLine = line - nullLine - commentLine;
}

命令选择

//选择命令,并执行
public static void selectCommand(String command,String fileName) throws IOException
{
    System.out.println("当前文件名为:"+fileName);
    // 实例化workCount
    switch (command) {//判断命令并执行
        case "-c":
            BasicService.charCount(fileName);
            System.out.println("字符数:"+BasicService.character);
            break;
        case "-l":
            BasicService.lineCount(fileName);
            System.out.println("行数:"+BasicService.line);
            break;
        case "-w":
            BasicService.wordCount(fileName);
            System.out.println("单词数:"+BasicService.word);
            break;
        case "-a":
            BasicService.codeLineCount(fileName);
            BasicService.nullLineCount(fileName);
            BasicService.commentLineCount(fileName);
            System.out.println("代码行数:"+BasicService.codeLine);
            System.out.println("空行数:"+BasicService.nullLine);
            System.out.println("注释行数:"+BasicService.commentLine);
            break;
        case "-s":
            //BasicService.getAllFilefileName(fileName);
            break;
        default:
            System.out.println("当前命令格式不存在! "+command);
            break;
    }
}


测试运行

PSP

PSP2.1

Personal Software Process Stages

预估耗时(分钟)

实际耗时(分钟)

 

Planning

计划

60

70

· Estimate

· 估计这个任务需要多少时间

60

70

Development

开发

620

1465

· Analysis

· 需求分析 (包括学习新技术)

50

60

· Design Spec

· 生成设计文档

40

400

· Design Review

· 设计复审 (和同事审核设计文档)

30

40

· Coding Standard

· 代码规范 (为目前的开发制定合适的规范)

10

15

· Design

· 具体设计

150

300

· Coding

· 具体编码

240

500

· Code Review

· 代码复审

40

50

· Test

· 测试(自我测试,修改代码,提交修改)

60

100

Reporting

报告

130

140

· Test Report

· 测试报告

50

60

· Size Measurement

· 计算工作量

40

20

· Postmortem & Process Improvement Plan

· 事后总结, 并提出过程改进计划

40

60

合计

910

1675


  • 项目小结

    1. 通过这个java项目,我意识到实际开发和设想中的时间是不一样的,实际开发中存在各种各样的问题,而且我在IO流这方面的知识掌握得不够全面,对于文件的操作还是不太会,导致后面的一个功能没做出来。

    2. 没有做好时间的规划,开发中没有充分集中注意力,导致效率的降低。

    3. 过于精益求精,导致手高眼低的情况的发生。

WordCount(Java实现)的更多相关文章

  1. 个人项目:WordCount (Java)

    一.Github项目地址 https://github.com/misterchaos/WordCount 二.解题思路 2.1 基本需求分析 经过仔细阅读题目,分析得出项目的基本需求如下: wc.e ...

  2. WordCount( Java )

    Github项目地址:https://github.com/Sabot1203/WordCount 一. 题目描述 实现一个简单而完整的软件工具(源程序特征统计程序). 进行单元测试.回归测试.效能测 ...

  3. 大数据之路week07--day03(Hadoop深入理解,JAVA代码编写WordCount程序,以及扩展升级)

    什么是MapReduce 你想数出一摞牌中有多少张黑桃.直观方式是一张一张检查并且数出有多少张是黑桃. MapReduce方法则是: 1.给在座的所有玩家中分配这摞牌 2.让每个玩家数自己手中的牌有几 ...

  4. Eclipse 执行成功的 Hadoop-1.2.1 WordCount 源码

    万事开头难.最近在学习Hadoop,先是搭建各种版本环境,从2.2.0到2.3.0,再到1.2.1,终于都搭起来了,折腾了1周时间,之后开始尝试使用Eclipse编写小demo.仅复制一个现成的Wor ...

  5. 《Java学习笔记(第8版)》学习指导

    <Java学习笔记(第8版)>学习指导 目录 图书简况 学习指导 第一章 Java平台概论 第二章 从JDK到IDE 第三章 基础语法 第四章 认识对象 第五章 对象封装 第六章 继承与多 ...

  6. 【hadoop】——修改hadoop FileUtil.java,解决权限检查的问题

    在Hadoop Eclipse开发环境搭建这篇文章中,第15.)中提到权限相关的异常,如下: 15/01/30 10:08:17 WARN util.NativeCodeLoader: Unable ...

  7. hadoop的统计单词程序WordCount提示找不到WordCount类

    按这里的教程: http://www.imooc.com/learn/391 试验时,发现在wordcount的最后一步一直提示如下错误: Exception in thread "main ...

  8. 开源分布式实时计算引擎 Iveely Computing 之 WordCount 详解(3)

    WordCount是很多分布式计算中,最常用的例子,例如Hadoop.Storm,Iveely Computing也不例外.明白了WordCount在Iveely Computing上的运行原理,就很 ...

  9. Hadoop入门程序WordCount的执行过程

    首先编写WordCount.java源文件,分别通过map和reduce方法统计文本中每个单词出现的次数,然后按照字母的顺序排列输出, Map过程首先是多个map并行提取多个句子里面的单词然后分别列出 ...

随机推荐

  1. 调用thrift出现No handlers could be found for logger "thrift.transport.TSocket"

    1.问题 使用thrift版本为0.10,在0.8没有这个问题 其中ncTAgent是代码中封装的thrift接口的结构,在thrift服务端没有启动的时候,应该拋错为连接不到.但是拋错的堆栈输出之前 ...

  2. 家庭记账本APP开发准备(三)

    单选框(RadioButton) 通过设置单选框,可以将非此即彼的问题进行解决,成功学会并应用了手机端单项选择框; 复选框(CheckBox) 学习复选框是为了给使用软件的人更多的选择,在其他选择框后 ...

  3. MySQL连接查询、子查询与联合查询

    一 连接查询 1.交叉连接: 语法: from  表1  [cross]  join  表2  ; 例如: 表一: 表2: 交叉: 交叉查询并没有意义. 2.内连接: 语法: from  表1  [i ...

  4. 2020-06-02:千万级数据量的list找一个数据。

    福哥答案2020-06-02: 对于千万级长度的数组单值查找:序号小的,单线程占明显优势:序号大的,多线程占明显优势.单线程时间不稳定,多线程时间稳定. go语言测试代码如下: package mai ...

  5. 年轻的樵夫哟,你掉的是这个免费 8 核 4G 公网服务器,还是这个随时可用的 Docker 实验平台?

    小孩子才做选择,成年人全都要.那么我们现在就来看看如何获得一台免费的 8 核 4G 公网 Docker 实验平台服务器. Play With Docker 直接打开 https://labs.play ...

  6. 【EFCore】利用Entityframework Core创建数据库模型

    利用Entityframework Core创建数据库模型 本文中Entityframework Core版本为v3.1.6 简介 Entity Framework (EF) Core 是微软轻量化. ...

  7. NameNode和SecondaryNameNode(面试开发重点)

    NameNode和SecondaryNameNode(面试开发重点) 1 NN和2NN工作机制 思考:NameNode中的元数据是存储在哪里的? 首先,我们做个假设,如果存储在NameNode节点的磁 ...

  8. CSS动画实例:移动的眼珠子

    适当地利用CSS的box-shadow可以构造图形,然后可以对构造的图形添加动画效果.下面我们通过移动的眼珠子.圆珠一二三.一分为四.四小圆旋转扩散等实例来体会box-shadow属性在动画制作中的使 ...

  9. 求求大厂给个Offer:List面试题

    前言 只有光头才能变强. 文本已收录至我的GitHub精选文章,欢迎Star:https://github.com/ZhongFuCheng3y/3y 从今天开始,我,三歪,正式开始写面试系列.我给这 ...

  10. python 基础-文件读写'r' 和 'rb'区别

    原文链接: python基础-文件读写'r' 和 'rb'区别 一.Python文件读写的几种模式: r,rb,w,wb 那么在读写文件时,有无b标识的的主要区别在哪里呢? 1.文件使用方式标识 'r ...