利用python将标题切割成词语 import jieba #读取文件 f=open(r"F:\大数据\大作业\爬取到的数据\data1_xinxi.txt",'r') s=f.read() #print(s) #切割文件中的字符串 zifuchuan=s.split("\n");#按行分割 i= zifuchuan1=[]#标题 zifuchuan2=[]#文章链接 zifuchuan3=[]#作者 for ss in zifuchuan: if ss!='':#…
利用python过滤去没用的词语,过滤的词语存储在停用文件中. #创建停用词表 def stopwordlist(): stopwords=[line.strip() for line in open ('F:\大数据\大作业\分词后的文件\stopWord.txt','r').readlines()] return stopwords f=open(r"F:\大数据\大作业\分词后的文件\data2_xinxi.txt",'r') s=f.read() #切割文件中的字符串 zifu…
统计词语出现的频率,并且按从高到低的顺序报错在文件中 def main(): file=open("F:\大数据\大作业\分词后的文件\data4_xinxi.txt",'r') wordCounts={} #先建立一个空的字典,用来存储单词 和相应出现的频次 count= #显示前多少条(按照单词出现频次从高到低) for line in file: lineprocess(line.lower(),wordCounts) #对于每一行都进行处理,调用lineprocess()函数,…
package zuoye1; import java.sql.Connection;import java.sql.PreparedStatement;import java.sql.SQLException;import java.util.ArrayList;import java.util.Date;import java.util.List; import org.jsoup.Jsoup;import org.jsoup.nodes.Document; import us.codecr…
本节来源于阿里云栖社区,同时正在开发一个舆情平台,其中他们发布了一篇他们所做的分析流程,感觉可以作为案例来学习.文章来源:觉民cloud/云栖社区 平台试用链接:https://prophet.data.aliyun.com/hotword?spm=5176.100239.blogcont68813.6.QB2AAc&isDemo=true 一般热词分析历经:分词.关键词提取.词关联计算.热度计算 一.分词 主要是词包大法,你懂得,阿里词包都不用自己写,本身一大堆啊!!!厉害了word哥:公众趋…
日期:2020.02.14 博客期:154 星期五 [本博客的代码如若要使用,请在下方评论区留言,之后再用(就是跟我说一声)] 所有相关跳转: a.[简单准备] b.[云图制作+数据导入] c.[拓扑数据] d.[数据修复] e.[解释修复+热词引用] f.[JSP演示+页面跳转] g.[热词分类+目录生成] h.[热词关系图+报告生成] i . [App制作](本期博客) 今天是要把之前的任务做成 App 展览形式,所以首先我先去把 Android Studio ,下载了回来,我打算分成两部分…
日期:2020.02.04 博客期:143 星期二   [本博客的代码如若要使用,请在下方评论区留言,之后再用(就是跟我说一声)] 所有相关跳转: a.[简单准备] b.[云图制作+数据导入] c.[拓扑数据] d.[数据修复] e.[解释修复+热词引用] f.[JSP演示+页面跳转] g.[热词分类+目录生成](本期博客) h.[热词关系图+报告生成] i . [App制作] 如下图,我已经解决的需求是标黄的部分,剩余需求就只有 热词分类.目录生成.热词关系图展示.数据报告导出 四部分了,这些…
日期:2020.01.27 博客期:135 星期一 [本博客的代码如若要使用,请在下方评论区留言,之后再用(就是跟我说一声)] 所有相关跳转: a.[简单准备](本期博客) b.[云图制作+数据导入] c.[拓扑数据] d.[数据修复] e.[解释修复+热词引用] f.[JSP演示+页面跳转] g.[热词分类+目录生成] h.[热词关系图+报告生成] i . [App制作] 今天问了一下老师,信息领域热词从哪里爬,老师说是IT方面的新闻,嗯~有点儿意思了! 我找到了好多IT网站,但是大多数广告又…
日期:2020.02.05 博客期:144 星期三 [本博客的代码如若要使用,请在下方评论区留言,之后再用(就是跟我说一声)] 所有相关跳转: a.[简单准备] b.[云图制作+数据导入] c.[拓扑数据] d.[数据修复] e.[解释修复+热词引用] f.[JSP演示+页面跳转] g.[热词分类+目录生成] h.[热词关系图+报告生成](本期博客) i . [App制作] 本来是说今天.昨天要写一篇完整实现的,然后今天这一篇就去写演示类的博客的!但是又怕自己查起来不方便,还是分开写吧! 按照昨…
日期:2020.01.28 博客期:136 星期二 [本博客的代码如若要使用,请在下方评论区留言,之后再用(就是跟我说一声)] 所有相关跳转: a.[简单准备] b.[云图制作+数据导入](本期博客) c.[拓扑数据] d.[数据修复] e.[解释修复+热词引用] f.[JSP演示+页面跳转] g.[热词分类+目录生成] h.[热词关系图+报告生成] i . [App制作] 今天主要是在网上找学习网站,爬取方面就参照之前爬到的数据做了一个简单的云图信息展示(Java Web),但是老师要求最好是…