(电脑烧掉了主板,地方上的所有门店全部关闭了,幸好现在京东还通物流,总算是进行把电脑拿回来了。对于一些东西无法实际操作真的是很难受,言归正传,说一下Wordcloud)


Wordcloud安装(全局安装)

  Wordcloud是python的一个第三方模块,其最大的特点就是可以通过我们的内容直接统计出单词出次数,随后以图形化的形式直观的展示给用户(按照大小,出现次数越多,显示的形状越大),这样就对于我们直观的进行查看显的特别方便了。

  对于Wordcloud的安装,一般我们首先会考虑到使用pip进行安装,如果你足够幸运,那就可以进行直接的安装,否则会出现各种各样的问题。不要想着去解决这些问题,否则你会更加的烦躁,所以,安装的方法应该是这样的。

  因为国内的网络访问国外延迟很高,所以在安装的过程中会出现一系列的超时问题,即使你是用了从镜像网站中进行下载暗账,也还是会出现其依赖的其他模块无法安装的问题。所以,这个时候我们可以使用国内的镜像加速器进行安装。比如使用阿里云的镜像加速器。可使用以下命令进行安装。

  1. pip install --user wordcloud -i http://mirrors.aliyun.com/pypi/simple --trusted-host mirrors.aliyun.com

  如果在安装过程中出现以下问题,则说明目前阿里云中没有与你python版本对应的wordcloud版本。

  那么你需要到 官方网址 或者 相关镜像网站 进行对应版本的下载,然后使用win+R进入cmd进行pip安装。值得注意的是,如果在此过程中出现一些其他模块的安装失败问题,则任然优先使用阿里云源加速器进行安装,否则到光放网站中或者进入相关镜像网站进行安装。安装成功如下图所示。


wordcloud使用

  根据以上安装,就可以正常使用wordcloud模块了。下面以一个小例子进行wordcloud的使用介绍。

  在使用慈云之前,我们应该知道的是词云是按照词云规范的模式进行处理的,即:数据处理的过程中,词云不能够通过内容出现的次数(数值)进行直接统计,而是将这些数值转换为单词,并且在同样的单词之间使用  空格  进行连接。

  1. '''
  2. @Description:
  3. @Version: 1.0
  4. @Autor: Montoin Yan
  5. @Date: 2020-02-16 01:05:39
  6. @LastEditors: Montoin Yan
  7. @LastEditTime: 2020-02-16 11:42:42
  8. '''
  9.  
  10. import wordcloud
  11. SAVE_PATH = "test.png"
  12.  
  13. def main():
  14. data = dict(小明=10, 小花=30, 老王=100, 老李=70) # 统计结果
  15. results = {} # 用来保存统计结果
  16. for key, value in data.items(): # 使用元组进行键值对的取出
  17. # print(key,value)
  18. for num in range(value): # 通过value确定单词的比重
  19. results[key] = results.get(key, " ") + " " + key.strip()
  20. # clouds = WordCloud(
  21. # collocations=
  22. # )
  23. clouds = wordcloud.WordCloud(
  24. collocations=False, # 去掉重复的词
  25. font_path="c:/Windows/Fonts/simfang.ttf", # 设置字体所在路径
  26. background_color="white",
  27. width=1000,
  28. height=380)
  29.  
  30. print(" ".join(results.values())) # 输出结果
  31. clouds.generate_from_text(" ".join(results.values()))
  32. clouds.to_file(SAVE_PATH)
  33.  
  34. if __name__ == "__main__":
  35. main()

  结果会生成一.png的图片,如下:、

'''
@Description: 
@Version: 1.0
@Autor: Montoin Yan
@Date: 2020-02-16 01:05:39
@LastEditors: Montoin Yan
@LastEditTime: 2020-02-16 11:42:42
'''
import wordcloud
SAVE_PATH = "test.png"
def main():
    data = dict(小明=10, 小花=30, 老王=100, 老李=70)  # 统计结果
    results = {}  # 用来保存统计结果
    for key, value in data.items():  # 使用元组进行键值对的取出
        # print(key,value)
        for num in range(value):  # 通过value确定单词的比重
            results[key] = results.get(key, " ") + " " + key.strip()
    # clouds = WordCloud(
    #     collocations=
    # )
    clouds = wordcloud.WordCloud(
        collocations=False,  # 去掉重复的词
        font_path="c:/Windows/Fonts/simfang.ttf",  # 设置字体所在路径
        background_color="white",
        width=1000,
        height=380)
    print(" ".join(results.values()))  # 输出结果
    clouds.generate_from_text(" ".join(results.values()))
    clouds.to_file(SAVE_PATH)
if __name__ == "__main__":
    main()

Wordcloud(词云)安装使用以及vscode搭建虚拟环境的更多相关文章

  1. python爬虫——京东评论、jieba分词、wordcloud词云统计

    接上一章,动态页面抓取——抓取京东评论区内容. url=‘https://club.jd.com/comment/productPageComments.action?callback=fetchJS ...

  2. 数字、字符串、列表、字典,jieba库,wordcloud词云

    一.基本数据类型 什么是数据类型 变量:描述世间万物的事物的属性状态 为了描述世间万物的状态,所以有了数据类型,对数据分类 为什么要对数据分类 针对不同的状态需要不同的数据类型标识 数据类型的分类 二 ...

  3. wordcloud词云模块

    wordcloud词云模块 下载 pip install wordcloud 使用 import wordcloud##调用整个模块 form wordcloud import WordCloud## ...

  4. python3 wordcloud词云

    wordclou:根据文本生成词云 一.词云设置 wc=WordCloud(width=400, height=200, #画布长.宽,默认(400,200)像素 margin=1, #字与字之间的距 ...

  5. WordCloud词云包的安装

    1,下载 https://www.lfd.uci.edu/~gohlke/pythonlibs/#wordcloud 2,安装 (window环境安装) 找的下载文件的路径 安装 pip instal ...

  6. python 制作wordcloud词云

    pip install wordcloud 需要用到numpy  pillow matplotlib 安装完成以后 wordcloud_cli --text in.txt --imagefile ou ...

  7. jieba分词wordcloud词云

    1.jieba库的基本介绍 (1).jieba是优秀的中文分词第三方库 中文文本需要通过分词获得单个的词语 jieba是优秀的中文分词第三方库,需要额外安装 jieba库提供三种分词模式,最简单只需掌 ...

  8. wordcloud词云

    借鉴别人的一个小例子,快速生成词云的代码: from wordcloud import WordCloud f = open(u'txt/AliceEN.txt','r').read() wordcl ...

  9. wordcloud词云--可视化

    import jieba import wordcloud f = open("新时代中国特色社会主义.txt", "r", encoding="gb ...

随机推荐

  1. 201871030138-杨蕊媛 实验二 个人项目—《D{0-1}背包问题》项目报告

    项目 内容 课程班级博客链接 https://edu.cnblogs.com/campus/xbsf/2018CST 这个作业要求链接 https://www.cnblogs.com/nwnu-dai ...

  2. publicPath路径问题

    output: { filename: "[name].js", path:path.resolve(__dirname,"build") } 如果没有指定pu ...

  3. 从单一图像中提取文档图像:ICCV2019论文解读

    从单一图像中提取文档图像:ICCV2019论文解读 DewarpNet: Single-Image Document Unwarping With Stacked 3D and 2D Regressi ...

  4. Netty 框架学习 —— ByteBuf

    概述 网络数据的基本单位总是字节,Java NIO 提供了 ByteBuffer 作为它的字节容器,但这个类的使用过于复杂.Netty 的 ByteBuf 具有卓越的功能性和灵活性,可以作为 Byte ...

  5. Redis的过期键删除策略

    文章首发于公众号:蘑菇睡不着,欢迎来看看 前言 Redis 中都是键值对的存储形式,键都是字符串类型的,而值有很多种类型,如 string.list.hash.set.sorted set等类型.当设 ...

  6. Typora 配置码云图床

    目录 在码云创建一个项目作为自己床图 设置私人令牌 下载安装 PigGo Typora中设置图片上传选项 在码云创建一个项目作为自己床图 创建的项目必须为公开项目,创建的过程不细说了. 设置私人令牌 ...

  7. 谁能干掉了if else

    很多人觉得自己写的是业务代码,按照逻辑写下去,再把公用的方法抽出来复用就可以了,设计模式根本就没必要用,更没必要学. 一开始的时候,我也是这么想,直到我遇到... 举个例子 我们先看一个普通的下单拦截 ...

  8. Visual Studio 2019本地不能运行Azure Functions

    最近一个项目,需要维护同事写得代码,主要是一堆基于 .net core 3.1 的 Azure Functions.想起2年前第一次接触 Azure Functions(那次是基于.net frame ...

  9. 使⽤Swagger2构建强⼤的RESTful API⽂档

    使⽤Swagger2构建强⼤的RESTful API⽂档 导语: 由于Spring Boot能够快速开发.便捷部署等特性,相信有很⼤⼀部分Spring Boot的⽤户会⽤来构建RESTful API. ...

  10. excel VBA中正则模块vbscript.regexp的用法

    一.是一个对象,用于执行 正则表达式! 二.有三个属性:      1. Global属性: True or False, 指明模式是匹配整个字符串中所有与之相符的地方还是只匹配第一次出现的地方.默认 ...