python3 wordcloud词云

wordclou:根据文本生成词云

一.词云设置

 wc=WordCloud(width=400, height=200, #画布长、宽，默认（400,200）像素

             margin=1,    #字与字之间的距离

             background_color='white',#背景颜色

             min_font_size=3,max_font_size=None,#显示的最小,最大的字体大小

             max_words=200,#显示的词的最大个数

             ranks_only=None,#是否只是排名

             prefer_horizontal=.9,#词语水平方向排版出现的频率0.9（所以词语垂直方向排版出现频率为 0.1 ）

             mask=None,## 以该参数值作图绘制词云，这个参数不为空时，width和height会被忽略

             scale=1, #按照比例进行放大画布

             color_func=None,#生成新颜色的函数，如果为空，则使用 self.color_func

             stopwords=('Book'),#设置需要屏蔽的词，如果为空，则使用内置的STOPWORDS

             random_state=None, # 为每个词返回一个PIL颜色

             font_step=1, #字体步长，如果步长大于1，会加快运算但是可能导致结果出现较大的误差。

             mode="RGB",#当参数为“RGBA”并且background_color不为空时，背景为透明

             relative_scaling=.5, #词频和字体大小的关联性

             regexp=None,#使用正则表达式分隔输入的文本

             collocations=True,#是否包括两个词的搭配

             colormap=None,#给每个单词随机分配颜色

             normalize_plurals=True,#是否删除词的尾随S之类的

             font_path="C:/Windows/Fonts/STFANGSO.ttf"  #字体路径

             )

WordCloud词云设置

二.生成词云

 fit_words(frequencies)  //根据词频生成词云

 generate(text)  //根据文本生成词云

 generate_from_frequencies(frequencies[, ...])   //根据词频生成词云

 generate_from_text(text)    //根据文本生成词云

 process_text(text)  //将长文本分词并去除屏蔽词（此处指英语，中文分词还是需要自己用别的库先行实现，使用上面的 fit_words(frequencies) ）

 recolor([random_state, color_func, colormap])   //对现有输出重新着色。重新上色会比重新生成整个词云快很多。

 to_array()  //转化为 numpy array

 to_file(filename)   //输出到文件

python3 wordcloud词云的更多相关文章

python爬虫——京东评论、jieba分词、wordcloud词云统计
接上一章,动态页面抓取——抓取京东评论区内容. url=‘https://club.jd.com/comment/productPageComments.action?callback=fetchJS ...
数字、字符串、列表、字典，jieba库，wordcloud词云
一.基本数据类型什么是数据类型变量:描述世间万物的事物的属性状态为了描述世间万物的状态,所以有了数据类型,对数据分类为什么要对数据分类针对不同的状态需要不同的数据类型标识数据类型的分类二 ...
python3做词云分析
python3做词云其实词云一般分为两种,一个是权重比,一个是频次分析主要还是体现在自然语言方向,难度较大,但这里我们用jieba词库主要思路, 后端算数据+前端生成图(D3-cloud-好像是 ...
wordcloud词云模块
wordcloud词云模块下载 pip install wordcloud 使用 import wordcloud##调用整个模块 form wordcloud import WordCloud## ...
wordcloud词云
借鉴别人的一个小例子,快速生成词云的代码: from wordcloud import WordCloud f = open(u'txt/AliceEN.txt','r').read() wordcl ...
wordcloud词云--可视化
import jieba import wordcloud f = open("新时代中国特色社会主义.txt", "r", encoding="gb ...
python 制作wordcloud词云
pip install wordcloud 需要用到numpy pillow matplotlib 安装完成以后 wordcloud_cli --text in.txt --imagefile ou ...
jieba分词wordcloud词云
1.jieba库的基本介绍 (1).jieba是优秀的中文分词第三方库中文文本需要通过分词获得单个的词语 jieba是优秀的中文分词第三方库,需要额外安装 jieba库提供三种分词模式,最简单只需掌 ...
爬取豆瓣电影影评，生成wordcloud词云，并利用监督学习根据评论自动打星
本文的完整源码在git位置:https://github.com/OceanBBBBbb/douban-ml 爬取豆瓣影评爬豆瓣的影评比较简单,豆瓣没有做限制,甚至你都不用登陆就可以看全部,我这里用 ...

随机推荐

tcp内存占用/socket内存占用
net.ipv4.tcp_mem 内核分配给TCP连接的内存,单位是Page,1 Page = 4096 Bytes,可用命令查看: #getconf PAGESIZE 4096 net.ipv4.t ...
eNSP模拟器OSPF单区域配置
实验拓扑图如下下一步对终端设备与路由器的端口进行基本的ip设置配置完成后要注意检查是否有小错误,不然会对后面的测试带来麻烦.在进行基础配置的时候一定要细心细心细心. 下一步我们就要进行OSPF的配 ...
一文带你全面了解RxJava
工作需要,刚好在学习 RxJava网络请求框架,网上搜了一些关于RxJava 的教程,但都并不是很好理解,所幸最后找到了几篇有助于初学者了解 RxJava 的文章,于是结合自己的理解,重新整理成一篇 ...
转录组组装软件stringtie
StringTie是約翰·霍普金斯大學计算机生物中心开发的一款转录组组装软件,在组装转录本的完整度,精度和速度方面都较以往的cufflinks 有很大的提升,也是目前有参考基因组转录组主流的组装软件. ...
用pytorch1.0搭建简单的神经网络：进行回归分析
搭建简单的神经网络:进行回归分析 import torch import torch.nn.functional as F # 包含激励函数 import matplotlib.pyplot as p ...
（1）Spirng Boot 入门（笔记）
文章目录简介优点 Hello World 打包成可执行 jar 细节探究主程序类,主入口类上面的注解自动生成的项目结构分析简介 Spring Boot 帮助我们简化 Spring 应用开发: ...
从其他数据库迁移到MySQL及MySQL特点
从其他数据库迁移到MySQL Oracle,SQL Server迁移到MySQL 一些变化不再使用存储过程.视图.定时作业表结构变更,如采用自增id做主键,以及其他语法变更业务SQL改造,不使用 ...
Android—网络请求
import java.io.ByteArrayOutputStream; import java.io.InputStream; import java.net.HttpURLConnection; ...
Scratch编程与高中数学算法初步
scratch编程与高中数学算法初步一提到编程,大家可能觉得晦涩难懂,没有一定的英语和数学思维基础的人,一大串的编程代码让人望而步,何况是中小学生. Scratch是一款由麻省理工学院(MIT) ...
怎样解决Script error报错问题
如果脚本网址与网页网址不在同一个域(比如使用了 CDN), 那如果这个脚本执行报错了, 就会报:Script error. 由于同源策略, 浏览器禁止向外部脚本泄漏信息, 因此不会提供完整的报错信息, ...

python3 wordcloud词云

python3 wordcloud词云的更多相关文章

随机推荐

热门专题