软件工程—WC功能实现(JAVA)

Github项目地址:https://github.com/Ousyoung/wc

项目要求

​ wc.exe 是一个常见的工具,它能统计文本文件的字符数、单词数和行数。这个项目要求写一个命令行程序,模仿已有wc.exe 的功能,并加以扩充,给出某程序设计语言源文件的字符数、单词数和行数。实现一个统计程序,它能正确统计程序文件中的字符数、单词数、行数,以及还具备其他扩展功能,并能够快速地处理多个文件。

基本要求

​ -c [filename]统计文件字符数

-w [filename]统计文件词数

-l [filename]统计文件行数

扩展功能

-s [filename]递归处理目录下符合条件得文件

-a [filename]返回文件代码行 / 空行 / 注释行

​ 支持各种文件的通配符(*,?)

高级功能

-x 图形化界面(未实现

PSP

PSP2.1 Personal Software Process Stages 预估耗时(分钟) 实际耗时(分钟)
Planning 计划 40 60
· Estimate · 估计这个任务需要多少时间 40 60
Development 开发 850 1400
· Analysis · 需求分析 (包括学习新技术) 60 120
· Design Spec · 生成设计文档 40 120
· Design Review · 设计复审 (和同事审核设计文档) 40 60
· Coding Standard · 代码规范 (为目前的开发制定合适的规范) 20 60
· Design · 具体设计 80 120
· Coding · 具体编码 500 800
· Code Review · 代码复审 40 30
· Test · 测试(自我测试,修改代码,提交修改) 70 90
Reporting 报告 80 90
· Test Report · 测试报告 40 50
· Size Measurement · 计算工作量 10 20
· Postmortem & Process Improvement Plan · 事后总结, 并提出过程改进计划 30 20
合计 970 1550

解题思路

​ 此次项目是模拟WC统计文件字,词,行信息,很容易想到用JAVA中的I/O流来读取文件信息,对于读取文件字符数以及行数,这些都比较简单,字符数只需读出字符匹配不是换行符即可,行数只需没读到换行符就加一,基本功能当中就属词的统计较为不易,词的界定相对来说要模糊的多,所以想到需要用正则表达式来匹配字符串,替换掉一些分隔符号,继而使词的匹配简单化。

​ 扩展功能方面,无非是在以上基础上再多加细分和应用。代码行/空行/注释行同样需要使用正则表达式来进行匹配,其界定一开始自己也很苦恼,但上网查阅资料,弄明白后也就迎刃而解了;至于文件的递归查找,只需要设计一个递归方法,递归查找指定目录下所有文件名,再通过用户键入的关键字作为方法参数,用contains(string)方法检索出符合条件的文件即可。

设计实现

此次项目中只写了两个类,一个是存放各种统计方法的WC类,另一个是运行程序的主类Main类,用于启动程序,里面还包括了命令获取,命令匹配的代码。

运行程序,main方法启动,系统显使用说明,再通过用户键入得到命令,考虑到项目要求的命令显示,需要把命令拆分成两部分:功能选择function以及文件路径path,继而需要调用split(" ")方法,用空格分割命令得到子命令,再用多个if语句的嵌套,匹配调用WC类中不同的静态方法,将path作为参数输入,找到指定文件。

设计主类Main类中的静态方法:词统计wordsCount,代码行,空行统计complexCount,文件递归处理fileHandle 等(只列举了部分,详见代码说明

类,方法调用关系图如下

代码说明

main方法

数据的输入输出处理,命令的提取,匹配都在这一部分,下面主要展示命令的提取,匹配部分。这里使用nextLIne方法获取命令,再用split分割命令,得到子命令,再进行匹配;外层使用whlie循环访问,直至用户键入退出命令 -esc 退出

while (true) {
Scanner getIn = new Scanner(System.in);
if (getIn.hasNext())
command = getIn.nextLine(); // 获取指令
if (command.equals("-esc")) {
System.out.println("***WC.exe程序已关闭");
System.exit(0); // 关闭程序
} else {
String[] commands = new String[2]; // 字符串数组用于存放指令
commands = command.split(" ", 2); // 拆分用户输入的指令
function = commands[0]; // command前半部分为功能选择
path = commands[1]; // 后半部分为文件路径
// Mark:修改代码时出现了数组下标越界的问题*****************
if (function.equals("-c"))
WC.charsCount(path);
else if (function.equals("-w"))
WC.wordsCount(path);
else if (function.equals("-l"))
WC.rowsCount(path);
else if (function.equals("-a"))
WC.complexCount(path);
else if (function.equals("-all"))
WC.allCount(path);
else if (function.equals("-s")) {
System.out.print("请输入文件迭代查找的关键字:\n");
Scanner getIn2 = new Scanner(System.in);
// 需要拿到指定字符串,这里的方法需要两个参数
WC.fileHandle(path, getIn2.nextLine());
} else
System.out.println("用户输入不合法,请重新输入!");
}
}

WC类

统计字符 charsCount

比较简单,所以只展示关键代码

try {
int tempchar;
readFile = new InputStreamReader(new FileInputStream(file));
while ((tempchar = readFile.read()) != -1) {
if ((char) tempchar != '\r' && (char) tempchar != '\n') {
// 只要匹配的不是换行符,字符数就加一
charsNum++;
}
}
readFile.close();
System.out.println("文件路径:" + fileName + " 文件的字符数为: " + charsNum);
}

统计行 rowsCount

同样比较简单,所以只展示关键代码

try {
readFile = new InputStreamReader(new FileInputStream(file));
int tempchar;
while ((tempchar = readFile.read()) != -1) {
if ((char) tempchar == '\n') {
// 匹配到换行符,行数就加一
lineNum++;
}
}
System.out.println("文件路径:" + fileName + " 文件的行数为: " + lineNum);
readFile.close();
}

统计词 wordsCount

使用正则表达式,匹配字符,将文件字符串中的 . * " " / 等符号用reaplaceAll方法替换成空格,再用split方法用空格分割字符串,得到词

static void wordsCount(String fileName) throws IOException {
// 返回该文件的词的数目
File file = new File(fileName);
BufferedReader bur = null;
String string = "";
String line;
int wordNum = 0;
String words[] = null;
try {
bur = new BufferedReader(new FileReader(file));
while ((line = bur.readLine()) != null) {
String s = line.replaceAll("[\\p{Punct}\\s\\p{Nd}\\uffe5\\u4e00-]", " ");
// 得到除字符外全是空格的文本
string = string + s + " ";
// 这里要加空格,否则string每次增长,行末的词会和下一行首词相连
}
words = string.split(" ");
// 去除空格,得到词的字符串数组
wordNum = words.length;
System.out.println("文件路径:" + fileName + " 文件的词数为: " + wordNum);
bur.close();
} catch (FileNotFoundException e) {
System.out.println("***系统提示:找不到指定的文件!请重新输入:");
}
}

统计代码行,注释行等 complexCount

使用正则表达式匹配相应行:“((//)|(/+)|((\s))|((\s)+/))+” 注释行,"^\s$"空白行,"(?!import|package).+;\s(((//)|(/+)).)" 代码行

static void complexCount(String fileName) throws IOException {
// 返回该文件的代码行 / 空行/注释行
File file = new File(fileName);
BufferedReader bufr = null;
String line = null;
int codeLine = 0;
int blankLine = 0;
int noteLine = 0;
Pattern codePattern = Pattern.compile("(?!import|package).+;\\s*(((//)|(/\\*+)).*)*",
Pattern.MULTILINE + Pattern.DOTALL);
// 匹配代码行 // Mark:匹配代码曾行时出现了错误,还有优化空间*********
Pattern blankPattern = Pattern.compile("^\\s*$");
// 匹配空白行
Pattern notePattern = Pattern.compile("((//)|(/\\*+)|((^\\s)*\\*)|((^\\s)*\\*+/))+",
Pattern.MULTILINE + Pattern.DOTALL);
// 匹配注释行
try {
bufr = new BufferedReader(new InputStreamReader(new FileInputStream(file)));
while ((line = bufr.readLine()) != null) { if (codePattern.matcher(line).matches())
codeLine++;
if (blankPattern.matcher(line).find())
blankLine++;
if (notePattern.matcher(line).find())
noteLine++;
}
System.out.println(
"文件路径:" + fileName + " 文件的代码行 / 空行 / 注释行数为: " + codeLine + "/" + blankLine + "/" + noteLine);
bufr.close();
} catch (FileNotFoundException e) {
System.out.println("***系统提示:找不到指定的文件!请重新输入:");
}
}
}

文件递归处理 fileHandle 及 allCount

递归返回目录下所有文件名,再调用String类的contains()方法模糊匹配所有文件名含指定字符串str的文件,再调用allCount方法返回各个文件的词,字符,行信息

static void fileHandle(String fileName, String str) throws IOException {
// 文件迭代处理
List<File> fileList = new ArrayList<File>();
File file = new File(fileName);
File[] files = file.listFiles();
// 获取目录下的所有文件或文件夹
if (files == null) {
// 如果目录为空,直接退出
System.out.println("***系统提示:找不到指定路径!请重新输入:");
}
// 遍历,目录下的所有文件
for (File f : files) {
if (f.isFile()) {
fileList.add(f);
} else if (f.isDirectory()) {
System.out.println(f.getAbsolutePath());
fileHandle(f.getAbsolutePath(), str);
}
}
for (File f1 : fileList) {
if (f1.getName().contains(str) == true) {
// 文件名包含指定字符串,contains()方法值为true
WC.allCount(fileName + "/" + f1.getName());
// f1.getName()只是文件名,这里要在f1.getName()前加入作为参数传入的fileName路径,否则会找不到文件
}
}
// System.out.println("测试代码"); 左侧为测试用代码
}
static void allCount(String fileName) throws IOException {
// 返回详细信息
WC.charsCount(fileName);
WC.wordsCount(fileName);
WC.rowsCount(fileName);
WC.complexCount(fileName);
System.out.println("\n");
}

运行测试

-c -w -l -a 测试

由于我写了一个allCount方法(命令 -all ),相当于一次执行-w -c -l -a ,所以对于以上命令只做部分测试

测试 oneline.txt

测试readme.txt

-all 测试 readme.txt文件

-s 测试 检索test目录下文件名含one的文件(onechar, oneword ,oneline,one)

递归处理 .java源代码文件测试

注:(上面截图第二行文字中“迭代查找”应为“递归查找”,截图的时候没注意,写错了......代码中已更改)

代码覆盖率

项目小结

​ 此次项目是软件工程的第一次项目,总的来说感觉自己做的有些仓促,许多细节的地方还有优化的空间,比如正则表达式匹配词那里,对于一些中文词没有考虑在内;还有main方法里完全可以写一个匹配方法来处理用户命令,是代码结构看起来更加合理;部分代码(I/O流的创建)有些繁琐,可以再简洁化一点,达到更低的时间复杂度。不过,这次项目的收获也不少,首先是对正则表达式的掌握有了提升,以前自己都没怎么仔细了解正则表达式,做项目的时候,边做边学,现在自己也能写一些正则表达式了。再者,通过软件工程理论的学习,开始了解编程的设计步骤,从无到有,一步一步来,效率有所提高,正如老师所说的,前面的准备工作做足,考虑更全面,后面的代码编写就会轻松高效很多。

软件工程—WC功能实现 (JAVA)的更多相关文章

  1. 软件工程作业 - 实现WC功能(java)

    项目地址:https://github.com/yogurt1998/WordCount 要求 基本要求 -c 统计文件字符数(实现) -w 统计文件单词数(实现) -l 统计文件行数(实现) 扩展功 ...

  2. 软件工程 wc.exe 代码统计作业

    软件工程 wc.exe 代码统计作业分享 1. Github 项目地址 https://github.com/EdwardLiu-Aurora/WordCount 更好地阅读本文,可点击这里 基本要求 ...

  3. MyCP -tx -xt 功能的Java实现

    MyCP -tx -xt 功能的Java实现 功能简介 java MyCP -tx XXX1.txt XXX2.bin 用来把文本文件(内容为十进制数字)转化为二进制文件 java MyCP -xt ...

  4. 功能:Java注解的介绍和反射使用

    功能:Java注解的介绍和反射使用 一.注解 1.注解介绍 java注解(Annotation),又称为java标注,是jdk5.0引入的一种机制. Java 语言中的类.方法.变量.参数和包等都可以 ...

  5. 个人小项目——Java实现WC功能

    这个小项目用了两种方法解决了该功能的实现. 1.两种方法的功能和具体实现 代码可以成功运行,但是有一些情况考虑不完整,一种方法用了FileOutputStream输出流,为了解决空格无法统计问题,对文 ...

  6. WC的基本功能实现.(Java)

    我的GitHub地址:https://github.com/Yuetao1219/lessons WC 项目要求 wc.exe 是一个常见的工具,它能统计文本文件的字符数.单词数和行数.这个项目要求写 ...

  7. java实现wc功能

    github项目地址:https://github.com/3216004717/ruanjiangongcheng.git 项目相关要求 基本要求 wc.exe -c file.c //返回文件 f ...

  8. 软件工程wc项目,基于py

    ###WC项目文件链接:https://github.com/ILTHEW/wc.git 个人项目:WC 实践是理论的基础和验证标准,希望读者贯彻"做中学"的思想,动手实现下面的项 ...

  9. 个人项目:实现wc.exe(Java)

    本项目Github地址:https://github.com/NNewBoy/wc 项目相关要求 基本功能:(已实现) -c 统计文件字符数 -w 统计文件词的数目 -l 统计文件行数 扩展功能:(已 ...

随机推荐

  1. python中库学习

    一.numpy NumPy的主要对象是同种元素的多维数组.这是一个所有的元素都是一种类型.通过一个正整数元组索引的元素表格(通常是元素是数字).在NumPy中维度(dimensions)叫做轴(axe ...

  2. Python globals() 函数

    Python globals() 函数  Python 内置函数 描述 globals() 函数会以字典类型返回当前位置的全部全局变量. 语法 globals() 函数语法: globals() 参数 ...

  3. C++ volatile

    volatile的位置与const相同——都是作为类型的附加修饰符 使用volatile的主要目的是提示编译器该对象的值可能在编辑器未监测的情况下被改变,因此编译器不能武断地对引用这些对象的代码作优化 ...

  4. Intersecting Lines(叉积,方程)

    Intersecting Lines http://poj.org/problem?id=1269 Time Limit: 1000MS   Memory Limit: 10000K Total Su ...

  5. 鼠标滑过图片添加边框图片无位移[xyytit]

    实现下面的效果,鼠标滑过图片添加边框图片无位移——鼠标滑过,图片只是加了边框,不会晃动: 参考代码: <!DOCTYPE html PUBLIC "-//W3C//DTD XHTML ...

  6. Spark cache、checkpoint机制笔记

    Spark学习笔记总结 03. Spark cache和checkpoint机制 1. RDD cache缓存 当持久化某个RDD后,每一个节点都将把计算的分片结果保存在内存中,并在对此RDD或衍生出 ...

  7. gdb 调试带参数程序

    在gdb中,运行程序使用r或是run命令. 程序的运行,你有可能需要设置下面四方面的事. 1.程序运行参数. set args 可指定运行时参数.(如:set args 10 20 30 40 50) ...

  8. 属性表格 datagridproperty

    http://www.cnblogs.com/yxlblogs/p/3468921.html

  9. mysql 1045 access denied for user********

    另一个方法Windows: 1. 管理员登陆系统,停止mysql服务或者结束mysqld-nt进程2. 进入命令行,来到mysql的安装目录.假设安装目录为 d:/mysql/ , CMD进入命令行3 ...

  10. JavaScript修改注册表

    JavaScript修改注册表 2009-04-14 11:22:13|  分类: JS相关 |  标签: |字号大中小 订阅     注册表有关安全设置项的说明: 注册表路径: HKEY_CURRE ...