词频统计小程序-WordCount.exe】的更多相关文章

一. 背景 ​ 最近顶哥为了完成学历提升学业中的小作业,做了一个词频统计的.exe小程序.因为当时做的时候网上的比较少,因此顶哥决定把自己拙略的作品发出来给需要的人提供一种思路,希望各位看官不要dis才好.最后附上源码链接,感兴趣的朋友可以继续优化哦. 二. 先看效果 双击运行,下拉框选择源文件来源,支持本地和网络资源,如图:    本地源文件示例 网络源文件示例 三. 主要代码 1.pom文件 <dependencies> <!-- 分词器 --> <dependency&…
自己完成的第二个自动化统计小程序,完成之后感觉:命名不够规范,造成可读性比较没那么好,幸好给自己很多地方都加了注释#coding:utf-8import os,sysimport reimport xlwtimport xlrdimport xlutilsimport xlutils.copyfrom xlutils.copy import copyimport pandas as pdimport numpy as npimport os.pathfiledir = "E:/内部项目文档/2G…
声明:    1)本文由我原创撰写,转载时请注明出处,侵权必究. 2)本小实验工作环境为Ubuntu操作系统,hadoop1-2-1,jdk1.8.0. 3)统计词频工作在单节点的伪分布上,至于真正实际集群的配置操作还没有达到,希望能够由本文抛砖引玉. (一)Hadoop的配置修正 网上有很多Hadoop的配置教程,可自行寻找,这一部分主要是根据自身实际情况,结合自身特点,设置Hadoop.因为有时候根据别人的教程,设置总是不成功,因为别人的教程依赖于别人的软件或操作环境特点. 本部分也不可能提…
有人说,大学生在校期间要码够10W行代码,也有人说,看的不是写代码的行数,而是修改代码的行数... 不管谁说,说的人都挺牛的 咳,首先给自己定个小目标吧,5W行代码!成天写代码,啥时候到5W呢?为了更准确的衡量自己,写了一个代码统计行数的小程序,初学编程的可以借鉴下,从开始统计自己的代码行数 程序很简单,遍历代码文件的行数,将行数变量存放在本地文件中,可以在加个时间戳 #coding=gbk import os import time from CountItem.FindCode import…
先瞎扯点别的.进入这个神圣的地方总需要些鞭策,阿西巴,我是被鞭策进来摆摊的程序猿.软件工程老师说,写程序,发博客,就来博客园.这是个号召力很强的口号.最近看网络营销 搜索引擎优化的书多一些,只能说王老师真的很厉害,至少在这一周因为这个作业的原因,我们学校的程序猿们对各大程序网站访问猛然骤增,网站流量,点击价值当然也是不菲,不过流量转化率就不好说了,当然了,三年多了都这样.再插一句,Google确实比百度做得好(其实只有中国用百度),SEO优化做的很到位,最近推出的“蜂鸟算法”也很棒,因为关键词明…
按这里的教程: http://www.imooc.com/learn/391 试验时,发现在wordcount的最后一步一直提示如下错误: Exception in thread "main" java.lang.ClassNotFoundException:WordCount at java.net.URLClassLoader$.run(URLClassLoader.java:) at java.net.URLClassLoader$.run(URLClassLoader.java…
源代码例如以下: //2015/7/2 10:30:35 //gino #include <stdio.h> #include <sys/stat.h> #include <sys/types.h> #include <fcntl.h> #include <stdlib.h> #include <errno.h> #include <string.h> #define FLOW_RX_FILE "/sys/cla…
import pandas as pd import jieba import jieba.analyse from collections import Counter,OrderedDict jieba.load_userdict('./userdict.txt') # 加载外部 用户词典 def stopwordslist(filepath): stopwords = [line.strip() for line in open(filepath, 'r', encoding='utf-8…
1.什么是HotApp小程序统计 HotApp小程序统计是第一个微信第三方小程序统计工具,就像做android 和 ios开发的人知道友盟统计一样,小程序也需要有个统计工具. 通过这个工具,可以知道小程序的每日新增,每日启动次数,总用户,每天的活跃用户,很多人可能就会说,微信已经提供了,那还需要这个工具做什么? 因为微信只能看到前一天的新增用户,启动次数等数据,而当日的数据,微信的统计还不能提供. HotApp小程序统计 网址:https://weixin.hotapp.cn 2.HotApp小…
需求: 1.设计一个词频统计的程序. 2.英语文章中包含的英语标点符号不计入统计. 3.将统计结果按照单词的出现频率由大到小进行排序. 设计: 1.基本功能和用法会在程序中进行提示. 2.原理是利用分隔符分词存入列表,然后从列表读出存入字典,键为词,值存放词的数量. 代码如图所示: 1.导入程序所需模块. 2.定义readfile类,实现去除文章中标点符号的功能. 3.定义一个getstr类,对结果输出格式进行定义. 4.构造程序主函数. 测试用例: 测试用例我选择了马丁.路德.金的演讲稿. 部…