词频统计 #创建表,只有一列,列名line create table word_count ( line string) row format delimited fields terminated by '\t' lines terminated by '\n'; #导入一篇文章到表里 load data local inpath '/home/dip/test/word_count.txt' #词频统计 select word ,count(*) as cnt from (select ex
这里将用c#写一个关于词频统计的命令行程序. 预计时间分配:输入处理3h.词条排序打印2h.测试3h. 实际时间分配:输入处理1h.词条排序打印2h.测试3h.程序改进优化6h. 下面将讲解程序的完成过程: 首先是输入处理部分,我们需要递归地扫描文章中的单词,首先此程序中单词的定义如下: A word: a string with at least 3 English alphabet letters, then followed by optional alphanumerical chara