本文转自:https://blog.csdn.net/weixin_34247032/article/details/87125465 英语初学者注意力不要放在语法上, 首先要懂得如何让自己开口说英语. How do you say this? 这个是怎么说? How do you say this in English? 这个用英语怎么说? What is this called? 这个叫什么名字呢? What is this called in English? 你们管这个用英语叫什么? P…
0-定评论结果:好评.差评,1星.4星,二元化为“积极.消极”,取一元的数据为样本 1-得到词频结果:如手机类的“积极样本”得到前10的高频词:运行(run running ran).内存(memory).速度(speed) 2-建立key-value.keys-values的多对多 .n:n键值对,样本继承2 内存--->大/小 运行--->快 速度--->快 2-1-n:n键值对可“同义词合并”或“卖品实质用户体验一致”聚类为一对一 .1:1,但此处非一一映射 3-根据2中结果进行产…
以下代码仅限于python2 NLTK计算中文高频词 >>> sinica_fd=nltk.FreqDist(sinica_treebank.words()) >>> top100=sinica_fd.items()[0:100] >>> for (x,y) in top100: print x,y 的 6776 . 1482 在 1331 是 1317 了 1190 有 759 我 724 他 688 就 627 上 612 和 580 也 542…
Given a non-empty list of words, return the k most frequent elements. Your answer should be sorted by frequency from highest to lowest. If two words have the same frequency, then the word with the lower alphabetical order comes first. Example 1: Inpu…
一.准备 1.首先 先用cmd 安装 jieba库,输入 pip install jieba 2.其次 本次要用到wordcloud库和 matplotlib库,也在cmd输入pip install matplotlib和pip install wordcloud 二.安装完之后,输入如下代码 from wordcloud import WordCloud import matplotlib.pyplot as plt import jieba def create_word_cloud(fil…
接着上文[基于统计的无词典的高频词抽取(一)——后缀数组字典序排序],本文主要讲解高频子串抽取部分. 如果看过上一篇文章的朋友都知道,我们通过 快排 或 基数排序算出了存储后缀数组字典序的PAT数组,以及PAT数组内,每每两个子串的最大公共前缀数组LCP. 我们可以通过LCP来计算出一个字符串在语料库中出现的次数.那怎么计算呢?我们先看看下面一个简单的例子: [例]我们还是以上一篇文章中的字符串“abcba”为例,经过对后缀数组字典序排序(过程参照前一篇),可以得到以下的结果: 由上图中的PAT…
一.背景介绍 最近几天,谷爱凌在冬奥会赛场上夺得一枚宝贵的金牌,为中国队贡献了自己的荣誉! 针对此热门事件,我用Python的爬虫和情感分析技术,针对小破站的弹幕数据,分析了众网友弹幕的舆论导向,下面我们来看一下,是如何实现的分析过程. 二.代码讲解-爬虫部分 2.1 分析弹幕接口 首先分析B站弹幕接口. 经过分析,得到的弹幕地址有两种: 第一种:http://comment.bilibili.com/{cid}.xml 第二种:https://api.bilibili.com/x/v1/dm/…
一.背景介绍 最近一段时间,刘畊宏真是火出了天际,引起一股全民健身的热潮,毕竟锻炼身体,是个好事! 针对此热门事件,我用Python的爬虫和情感分析技术,针对小破站的弹幕数据,分析了众多网友弹幕的舆论导向,下面我们来看一下,是如何实现的分析过程. 二.代码讲解-爬虫部分 2.1 分析弹幕接口 首先分析B站弹幕接口. 经过分析,得到的弹幕地址有两种: 第一种:http://comment.bilibili.com/{cid}.xml 第二种:https://api.bilibili.com/x/v…
目录 一.背景介绍 二.代码讲解-爬虫部分 2.1 分析弹幕接口 2.2 讲解爬虫代码 三.代码讲解-情感分析部分 3.1 整体思路 3.2 情感分析打标 3.3 统计top10高频词 3.4 绘制词云图 3.5 情感分析结论 四.同步演示视频 一.背景介绍 最近一段时间,王心凌在浪姐3的表现格外突出,唤醒了一大批沉睡中的老粉,纷纷直呼'爷青回'! 针对此热门事件,我用Python的爬虫和情感分析技术,针对小破站的弹幕数据,分析了众多网友弹幕的舆论导向,下面我们来看一下,是如何实现的分析过程.…
菜鸟玩3D--3DmeNow初级教程 3D软件对于我们这些菜鸟来说,一直是可望而不可及的一种东西,深奥的3D建模,复杂的面板操作--都使我们对之望而却步,有没有一种很简单的3D造型软件,使我们这些菜鸟也能和3D来个亲密接触呢?而这次带给大家的3DmeNow,就是这么一款简便易用的3D软件.3DmeNow是由BioVirtual公司出品的三维建模软件.用两张人脸照片,加上少许控制点,即可生成立体的三维模型.制作过程中不需任何专业知识,而且过程极为简便(只需要三步即可).下图所示即为创建过程. 图0…