软件工程 wc.exe 代码统计作业分享 1. Github 项目地址 https://github.com/EdwardLiu-Aurora/WordCount 更好地阅读本文,可点击这里 基本要求 [x] -c 统计文件字符数 (实现) [x] -w 统计文件词数 (实现) [x] -l 统计文件行数(实现) 扩展功能 [x] -s 递归处理目录下符合条件得文件(实现) [x] -a 返回文件代码行 / 空行 / 注释行(实现) [x] 支持各种文件的通配符(*,?)(实现) 高级功能 […
GitHub地址 项目需求 实现一个wc统计程序,可以对文本进行相关功能的统计与分析 基本功能 -c 统计字符数 -w 统计文件词数 -l 统计行数 扩展功能 -s 递归搜索目录下面的文件 -a 返回更复杂的数据(代码行 / 空行 / 注释行) 设计 主函数思路:分析命令并对-s进行预处理,得到相应的文件名字,搜索该目录下匹配的名字,根据是否需要递归进行分析,再对一条命令的每一个参数进行匹配,每次从文件读取一行字符串进行分析,再把结果打印出来. 代码 主函数 import java.io.*;…
Spark学习笔记1--第一个Spark程序:单词数统计 笔记摘抄自 [美] Holden Karau 等著的<Spark快速大数据分析> 添加依赖 通过 Maven 添加 Spark-core_2.10 的依赖 程序 找了一篇注释比较清楚的博客代码1,一次运行通过 import scala.Tuple2; import org.apache.spark.SparkConf; import org.apache.spark.api.java.JavaPairRDD; import org.ap…
最近部门成立了一个python学习小组,旨在让大家在做项目中开始成长起来,于是老大就给布置了第一个小任务:代码统计工具,具体的需求如下: 需求: . 能够统计指定目录下C++程序的代码行数. . C++程序文件包括.cpp和.h文件. . 如果指定目录下有子目录,需要能够递归遍历所有子目录. . 能够区分注释和代码. . 不用考虑语句跨行问题. . 输出.cpp..h文件个数.代码行数.注释行数及处理时间. . 基于python3开发. 乍一看,感觉好像有点难度,一下要处理这么多的功能,又是统计…
Python实现代码统计工具--终极加速篇 声明 本文对于先前系列文章中实现的C/Python代码统计工具(CPLineCounter),通过C扩展接口重写核心算法加以优化,并与网上常见的统计工具做对比.实测表明,CPLineCounter在统计精度和性能方面均优于其他同类统计工具.以千万行代码为例评测性能,CPLineCounter在Cpython和Pypy环境下运行时,比国外统计工具cloc1.64分别快14.5倍和29倍,比国内SourceCounter3.4分别快1.8倍和3.6倍. 运…
目录 Python代码统计工具 声明 一. 问题提出 二. 代码实现 三. 效果验证 Python代码统计工具 标签: Python 代码统计 声明 本文将对<Python实现C代码统计工具(一)~(三)>中的C代码统计工具进行扩展,以支持Python脚本自身的行数统计. 一. 问题提出 此前实现的C代码统计工具仅能分析和统计C语言代码文件,但其设计思想也适用于Python代码及其他编码语言. Python行数统计的难点在于注释行,因为Python有两种注释方式:简单明了的单行注释和复杂含糊的…
目录 Python实现C代码统计工具(三) 声明 一. 性能分析 1.1 分析单条语句 1.2 分析代码片段 1.3 分析整个模块 二. 制作exe Python实现C代码统计工具(三) 标签: Python 性能分析 exe 声明 本文将对<Python实现C代码统计工具(二)>中的C代码统计工具进行性能分析,并制作Windows系统下可用的exe文件.本文所述的方法也适用于其他Python脚本. 一. 性能分析 Python标准库提供两个代码性能分析相关的模块,即timeit和cProfi…
Atitit. . 软件命名空间与类名命名单词的统计程序设计v2 1. 要实现的目标1 1.1. Camel字符串模式的分词处理1 1.2. 多个大写的处理1 1.3. 数字与字幕的分离1 1.4. 其他/-_*.$斜杠中画线下划线性好点号美元字符字符的拆分1 1.5. 大写小写的合并2 1.6. 单数复数的合并2 1.7. 过滤数字及单个的字母2 1.8. 复数排除单词比如access,class2 1.9. 类要截取主类名,去除路径与扩展名2 2. Code----2 2.1. public…
先瞎扯点别的.进入这个神圣的地方总需要些鞭策,阿西巴,我是被鞭策进来摆摊的程序猿.软件工程老师说,写程序,发博客,就来博客园.这是个号召力很强的口号.最近看网络营销 搜索引擎优化的书多一些,只能说王老师真的很厉害,至少在这一周因为这个作业的原因,我们学校的程序猿们对各大程序网站访问猛然骤增,网站流量,点击价值当然也是不菲,不过流量转化率就不好说了,当然了,三年多了都这样.再插一句,Google确实比百度做得好(其实只有中国用百度),SEO优化做的很到位,最近推出的“蜂鸟算法”也很棒,因为关键词明…
算法提高 不同单词个数统计 时间限制:1.0s 内存限制:512.0MB 问题描述 编写一个程序,输入一个句子,然后统计出这个句子当中不同的单词个数.例如:对于句子"one little two little three little boys",总共有5个不同的单词:one, little, two, three, boys. 说明:(1)由于句子当中包含有空格,所以应该用gets函数来输入这个句子:(2)输入的句子当中只包含英文字符和空格,单词之间用一个空格隔开:(3)不用考虑单词…