WordCount--统计输入文件的字符数、行数、单词数(java)--初级功能
码云地址:
https://gitee.com/YuRenDaZ/WordCount
个人PSP表格:
PSP2.1 |
PSP阶段 |
预估耗时 (分钟) |
实际耗时 (分钟) |
Planning |
计划 |
180 |
120 |
· Estimate |
· 估计这个任务需要多少时间 |
180 |
120 |
Development |
开发 |
580 |
440 |
· Analysis |
· 需求分析 (包括学习新技术) |
180 |
60 |
· Design Spec |
· 生成设计文档 |
40 |
30 |
· Design Review |
· 设计复审 (和同事审核设计文档) |
20 |
20 |
· Coding Standard |
· 代码规范 (为目前的开发制定合适的规范) |
20 |
10 |
· Design |
· 具体设计 |
20 |
20 |
· Coding |
· 具体编码 |
180 |
200 |
· Code Review |
· 代码复审 |
30 |
40 |
· Test |
· 测试(自我测试,修改代码,提交修改) |
90 |
60 |
Reporting |
报告 |
90 |
70 |
· Test Report |
· 测试报告 |
40 |
30 |
· Size Measurement |
· 计算工作量 |
20 |
10 |
· Postmortem & Process Improvement Plan |
· 事后总结, 并提出过程改进计划 |
30 |
30 |
合计 |
850 |
630 |
一、功能需求分析
WordCount的需求可以概括为:对程序设计语言源文件统计字符数、单词数、行数,统计结果以指定格式输出到默认文件中,以及其他扩展功能,并能够快速地处理多个文件。可执行程序命名为:wc.exe,该程序处理用户需求的模式为:
wc.exe [parameter] [input_file_name]
存储统计结果的文件默认为result.txt,放在与wc.exe相同的目录下。
详细分析:
功能 -c :返回文件 file.c 的字符数
功能 -w :返回文件 file.c 的单词总数
功能 -l :返回文件 file.c 的总行数
功能 -o :将结果输出到指定文件outputFile.txt
要求 : 1. -o 功能后面必须有输出文件路径的参数。
2.在没有 -o 命令指定输出文件的时候默认将结果保存在exe同目录下的result.txt。
3.可以满足多个文件同时查询。
注意:
空格,水平制表符,换行符,均算字符。
由空格或逗号分割开的都视为单词,且不做单词的有效性校验,例如:thi#,that视为用逗号隔开的2个单词。
二、程序设计
A:大概设计
1):程序由工具类和主函数类构成。
2):程序使用main的入口参数。
B:详细设计
1):将每一个“-?”指令对应一个方法。
2):将功能方法写在一个类里,作为工具类。
3):使用条件判断语句来处理命令。
4):用集合存储需要查询的文件,以方便进行添加和遍历。
5):程序主要逻辑在main函数中进行。(逻辑并不非十分复杂)
三、程序编码(编码并不是最好的实现方法,希望各位同学能指出不足之处,我们大家一起进步!)
- 主函数逻辑主要是由循环语句和条件判断语句完成。代码如下:
import java.util.HashSet;
import java.util.Set; public class WordCount { public static void main(String[] args) {
CountUtil countUtil = new CountUtil();//实例化工具类对象
Set<String> file_paths = new HashSet<String>() ; //创建用于存储输入文件的集合
String Output_file = "result.txt"; //存储输出文件名(默认为同目录下的result.txt文件)
String Result = ""; //存储查询结果
boolean isCharacters = false; //是否查询字符数
boolean isLines = false; //是否查询行数
boolean isWords = false; //是否查询单词数
for (int i = 0;i<args.length;i++) { //循环读取入口参数
if (args[i].startsWith("-")) { //判断是否是命令
switch (args[i]) {
case "-c":
isCharacters = true; //是-c指令,激活查询条件
break;
case "-l":
isLines = true; //是-l指令,激活查询条件
break;
case "-w":
isWords =true; //是-w指令,激活查询条件
break;
case "-o":
if(!args[i+1].startsWith("-")) //-o指令 判断后面是否有指定输出文件
{
Output_file = args[i+1]; //args[i+1]必须为输出文件
i++;
}else {
System.out.println("input error !"); //提示输入错误并终止程序
System.exit(0);
}
break;
default:
System.out.println("input error !");
break;
}
}
else file_paths.add(args[i]); //将不属于命令的字符串存储在集合里面
} if (isWords) {
Result+=countUtil.ReturnWords(file_paths)+"\r\n"; //调用查询单词方法,并做字符串拼接
}
if (isLines) {
Result+=countUtil.ReturnLines(file_paths)+"\r\n"; //调用查询行数方法,并做字符串拼接
}
if (isCharacters) {
Result+=countUtil.ReturnCharacters(file_paths)+"\r\n"; //调用查询字符数方法,并做字符串拼接
}
System.out.println(Result);
countUtil.OutputFile(Output_file, Result); //将结果输出到文件
}
} - 在工具类中各方法的实现:(基本上都是基于IO流的操作)
ReturnCharacters方法,返回查询结果(String类型),参数为输入文件的集合。代码如下:
public String ReturnCharacters(Set<String> file_paths) {
int Count = 0,bytes = 0;
String result = "";//用于存储返回值
byte [] tem = new byte[20*1024];//用存储读取数据的定常字节数组
int len = tem.length;//得到tem的长度以避免循环时反复调用.length
FileInputStream in = null;//声明一个文件输入流
try {
for (String file_path : file_paths) {
in = new FileInputStream(file_path);//得到字符输入流,string为文件绝对路径
while ((bytes = in.read(tem,0,len))!=-1) {
Count+=bytes;//统计累计读取的字符数
} result += file_path+",字符数:"+Count+" ";//结果字符串拼接
Count = 0; }
} catch (FileNotFoundException e) {
System.out.println("有文件输入错误,请核对!(如果不会使用相对路径,请使用绝对路径)"); //检查到文件不存在,提示错误
System.exit(0); //结束程序
} catch (IOException e) {
e.printStackTrace();
}finally {
try {
in.close();//关闭输入流
} catch (IOException e) {
e.printStackTrace();
}
}
return result;
}
返回字符数
ReturnWords方法,返回查询结果(String类型),参数为输入文件的集合。代码如下:
public String ReturnWords(Set<String> file_paths){
int Count = 0; //存储单词数
String result = "";//存储返回值
StringBuffer saveString = new StringBuffer();//因为string具有不可变性,用StringBuffer来进行读取的添加
String tmp = ""; //缓存字符串
FileInputStream in = null;//声明文件字符输入流
InputStreamReader isr = null;//声明字节输入流
BufferedReader bis = null;//声明缓存输入流
try {
for (String file_path : file_paths) { //foreach循环遍历数组
in = new FileInputStream(file_path);//实例化文件输入流对象
isr = new InputStreamReader(in);//实例化字节输入流对象
bis = new BufferedReader(isr);//实例化缓存输入流对象
while ((tmp=bis.readLine())!=null) { //readLine()返回读取的字节,若没有了就返回null
saveString.append(tmp); //将新读出来的数据接在已保存的后面
}
tmp = saveString.toString(); //用字符串存储,以用split方法区分单词
String [] total = tmp.split("[\\s+,\\.\n]");//用正则表达式将字符串按单词格式分开
Count = total.length; //字符串数组长度就是单词个数
result += file_path+",单词数:"+Count+" "; //结果字符串拼接
Count = 0;
}
} catch (FileNotFoundException e) {
System.out.println("有文件输入错误,请核对!(如果不会使用相对路径,请使用绝对路径)"); //检查到文件不存在,提示错误
System.exit(0); //结束程序
} catch (IOException e) {
e.printStackTrace();
}finally {
try {
in.close();//关闭文件字符输入流
isr.close();//关闭字节输入流
bis.close();//关闭缓存输入流
} catch (IOException e) {
e.printStackTrace();
} }
return result;
}
返回单词数
ReturnLines方法,返回查询结果(String类型),参数为输入文件的集合。代码如下:
public String ReturnLines(Set<String> file_paths) {
int Count = 0;
String result = "";
FileInputStream in = null;//声明文件字符输入流
InputStreamReader isr = null;//声明字节输入流
BufferedReader bis = null;//声明缓存输入流
try {
for (String file_path : file_paths) { //foreach循环遍历数组
in = new FileInputStream(file_path);//实例化文件输入流对象
isr = new InputStreamReader(in);//实例化字节输入流对象
bis = new BufferedReader(isr);//实例化缓存输入流对象
while (bis.readLine()!=null) {
Count++;
}
result += file_path+",行数:"+Count+" "; //结果字符串拼接
Count = 0;
}
} catch (FileNotFoundException e) {
System.out.println("有文件输入错误,请核对!(如果不会使用相对路径,请使用绝对路径)"); //检查到文件不存在,提示错误
System.exit(0); //结束程序
} catch (IOException e) {
e.printStackTrace();
}finally {
try {
in.close();//关闭文件字符输入流
isr.close();//关闭字节输入流
bis.close();//关闭缓存输入流
} catch (IOException e) {
e.printStackTrace();
} }
return result;
}
返回行数
OutputFile方法,将结果保存在文件中,返回boolean型,参数为文件路径和内容。代码如下:
public boolean OutputFile(String File_path,String Context){
File OutputFile = new File(File_path); //创建File对象
FileOutputStream os = null; //声明 文件输出流
byte [] a = null; //用于存储Context转化的byte字节数组
try {
if(!OutputFile.exists()) { //判断文件是否存在
OutputFile.createNewFile(); //不存在,创建一个文件
}
os = new FileOutputStream(OutputFile); //获得输出流对象
a = Context.getBytes(); //将Context转化为Byte数组,以便写入文件
os.write(a); //将byte数组写入文件
} catch (IOException e) {
e.printStackTrace();
}finally {
try {
os.close(); //关闭输出流
} catch (IOException e) {
e.printStackTrace();
}
}
return true;
}
}
输出结果文件
四、代码测试
代码调试方法参照 https://www.cnblogs.com/xy-hong/p/7197725.html
由于是使用的main函数的入口参数,所以之前并未接触过这类方式的程序编写。在经过查阅后在改文章上找到了调试方式。具体操作再次不予详述,请参照以上链接。
因为要求不能用已有得测试框架进行测试,所以就自己设计了一个测试类。在类中,分为单独针对每一个需要测试得方法都设计一个测试方法,然后再主函数中调用达到一次性全部测试得效果。
import java.util.HashSet;
import java.util.Set; public class ProTest {
public static void main(String[] args) {
testOutputFile();
testReturnCharacters();
testReturnLines();
testReturnWords();
}
public static void testReturnCharacters() {
Set<String> file_paths = new HashSet<String>();
String file1 = "F://test.c";
String file2 = "F://test.java";
file_paths.add(file2);
file_paths.add(file1);
System.out.println("testReturnCharacters():");
System.out.println(new CountUtil().ReturnCharacters(file_paths));
} public static void testReturnWords() {
Set<String> file_paths = new HashSet<String>();
String file1 = "F://test.c";
String file2 = "F://test.java";
file_paths.add(file2);
file_paths.add(file1);
System.out.println("testReturnWords():");
System.out.println(new CountUtil().ReturnWords(file_paths));
} public static void testReturnLines() {
Set<String> file_paths = new HashSet<String>();
String file1 = "F://test.c";
String file2 = "F://test.java";
file_paths.add(file2);
file_paths.add(file1);
System.out.println("testReturnLines():");
System.out.println(new CountUtil().ReturnLines(file_paths));
} public static void testOutputFile() {
String file_path = "result.txt";
String context = "OutPutFile test !"; if(new CountUtil().OutputFile(file_path, context)) {
System.out.println("File output success !");
}else {
System.out.println("error !");
}
}
}
直接运行测试类,得到结果:
用例测试:
文件中的结果:
五、将项目导出为exe可执行文件
依赖工具:exe4j
参考方法:手把手教你如何把java代码,打包成jar文件以及转换为exe可执行文件(注意:改博客中没有指出32位和64位系统的差别,具体如下)
六、项目与远程库同步过程(码云)
有关git和码云项目的远程连接以及工作提交等相关操作参考Git和Github简单教程(该教程非常的详细,值得推荐。)
本项目一共有三次项目提交,分别是初始代码、复审代码、测试后修改的最终代码。
七、个人总结
第一次撰写博客有很多迷茫之处,但是在撰写博客的过程中我发现这其实是对整个项目过程的一次回顾与反思。在以前的作业中,通常都是写完代码测试完后就不再关注,也不会反在完成项目的途中犯过什么样的错误。每当下次遇到同样的问题还是会被困扰住,所以我觉得写博客是真的有必要的。虽然写出来的博客没人看,没人会在意,但是这并不是开始学习的我们的目的。我们的目的就在于回顾过程,反思过程中的错误,让项目的过程在我们脑海里留下更深的印象。最后,这次的作业的量还是算比较大的,但是却真的能感觉到有很多的收获。很多东西都是词不达意的,真的用心体会过就能明白。
感谢以上引用的各链接的作者们,希望你们的文章能帮助更多的人。
WordCount--统计输入文件的字符数、行数、单词数(java)--初级功能的更多相关文章
- C++语言,统计一篇英文文章中的单词数(用正则表达式实现)
下面的例子展示了如何在C++11中,利用regex_search()统计一篇英文文章中的单词数: #include <iostream> #include <regex> #i ...
- java语言实现对程序设计语言源文件统计字符数、单词数、行数及其他拓展功。
本次作业Github项目地址:https://github.com/YiChenglong2018/WordCount 一.项目简介 本项目的需求可以概括为:对程序设计语言源文件统计字符数.单词数.行 ...
- C++实现文件内字符数、单词数、行数的统计
先给出github上的代码链接以及项目需求 1. 项目简介 这个项目的需求可以概括为:对程序设计语言源文件统计字符数.单词数.行数,统计结果以指定格式输出到默认文件中,以及其他扩展功能,并能够快速地处 ...
- 《c程序设计语言》读书笔记--统计 行数、单词数、字符数
#include <stdio.h> int main() { int lin = 0,wor = 0,cha = 0; int flag = 0; int c; while((c = g ...
- Android 简单统计文本文件字符数、单词数、行数Demo
做的demo是统计文本文件的字符数.单词数.行数的,首先呢,我们必须要有一个文本文件.所以我们要么创建一个文本文件,并保存,然后再解析:要么就提前把文本文件先放到模拟器上,然后检索到文本名再进行解析. ...
- 文件内容统计:对任意给定的.txt文件进行内容的字符数、行数、单词数进行统计
项目源码地址:https://gitee.com/xjtsh/projects 功能实现: wc.exe -c file.c //返回文件 file.c 的字符数 wc.exe -w file ...
- linux wc 的用法-linux 下统计行数、单词数、字符个数
linux wc 的用法-linux 下统计行数.单词数.字符个数 wc : wc -l 统计有多少行 wc -w 统计有多少个单词 wc -c 统计有多少个字符
- Linux - wc统计文件行数、单词数或字节数
一 wc简单介绍 wc命令用来打印文件的文本行数.单词数.字节数等(print the number of newlines, words, and bytes in files).在Windows的 ...
- java:打印菱形图案(传参打印的自定义字符和行数)
打印菱形图案: 代码实现: public class Hello { public static void main(String args[]) { LingXingPrint("#&qu ...
随机推荐
- 算法与数据结构基础 - 链表(Linked List)
链表基础 链表(Linked List)相比数组(Array),物理存储上非连续.不支持O(1)时间按索引存取:但链表也有其优点,灵活的内存管理.允许在链表任意位置上插入和删除节点.单向链表结构一般如 ...
- echarts3.x 入门
echarts 使用 1.getStart 1.1引入 echart <!-- 引入 ECharts 文件 --> <script src="echarts.min.js& ...
- Storm初识(1)
在Storm集群中,有两类节点:主节点 master node 和工作节点 worker nodes. 主节点运行着一个叫做Nimbus的守护进程.这个守护进程负责在集群中分发代码,为工作节点分配任务 ...
- 重学计算机组成原理(六)- 函数调用怎么突然Stack Overflow了!
用Google搜异常信息,肯定都访问过Stack Overflow网站 全球最大的程序员问答网站,名字来自于一个常见的报错,就是栈溢出(stack overflow) 从函数调用开始,在计算机指令层面 ...
- Mac如何前往文件夹 修改hosts文件 显示隐藏文件 Mac如何查看剪切板
Mac 如何前往文件夹 首先,回到桌面,或者点击Finder(访达) 然后输入快捷键 ⌘ Command + ⇧ Shift + G 或者在Finder上方状态栏中点击‘前往’>>> ...
- Java 在spring cloud中使用Redis,spring boot同样适用
1.本地安装redis服务,官网下载. 2.在开发中要使用redis,首先要启动本地redis服务,启动后页面如下: 3.在spring boot项目pom.xml文件中添加Redis需要的依赖包,可 ...
- JMeter的JTL大文件解析
1.背景 不知大家在使用JMeter工具进行性能测试时,是否遇到过JTL结果文件过大导致GUI页面长时间解析无响应的问题.这种情况往往出现在稳定性测试场景下,此时的JTL文件大小可能已经达到G级别了. ...
- [HEOI2013]SAO(树上dp,计数)
[HEOI2013]SAO (这写了一个晚上QAQ,可能是我太蠢了吧.) 题目说只有\(n-1\)条边,然而每个点又相互联系.说明它的结构是一个类似树的结构,但是是有向边连接的,题目问的是方案个数,那 ...
- 【数据结构】8.java源码关于HashMap
1.hashmap的底层数据结构 众所皆知map的底层结构是类似邻接表的结构,但是进入1.8之后,链表模式再一定情况下又会转换为红黑树在JDK8中,当链表长度达到8,并且hash桶容量超过64(MIN ...
- 2019heox博客部署到coding该绕的坑-奥怪的小栈
文章转载于:2019heox博客部署到coding该绕的坑-奥怪的小栈 这篇文章适用于初次部署和部署到github后想双线部署到coding的朋友们,我将带你们绕过一些我踏过的坑. 前言 我一开始没打 ...