欢迎访问我的个人博客:原文链接

前言

人生苦短,我用python。学习python怎么能不搞一下词云呢是不是(ง •̀_•́)ง

于是便有了这篇边实践边记录的笔记。

环境:VMware 12pro + CentOS7 + Python 2.7.5

安装系统

之前一直用的是win10子系统,现在试试CentOS,CentOS官网下载最新系统dvd版 安装到VMware 12pro。网上很多教程。例如这个链接。等待安装完成后开始。

第一个命令

用Ubuntu的时候没有的命令会提示你安装,感觉很简单的事。但是到CentOS上却变得很头痛。

打开终端在执行以下命令安装python-pip时提示。

  1. sudo yum install python-pip
  2. 没有可用软件包 python-pip

google了一下说是这个包在EPEL源里,要添加EPEL源才可以。

执行下面两个命令就安装好了。

  1. yum install epel-release.noarch
  2. yum install python-pip

python库安装

接下来安装一个词云wordcloud

  1. pip install -i https://pypi.tuna.tsinghua.edu.cn/simple wordcloud
  2. 截取部分提示错误信息
  3. unable to execute gcc: No such file or directory
  4. error: command 'gcc' failed with exit status 1
  5. gcc都没有(ง •̀_•́)ง。先安装gcc
  6. yum install gcc

gcc装完后继续安装wordcloud!又报了下面的错误

  1. _posixsubprocess.c:3:20: 致命错误:Python.h:没有那个文件或目录
  2. 于是需要先安装python-devel
  3. sudo yum install python-devel  #注意这里不是python-dev

CentOS 下叫做 python-devel,Ubuntu 下还是叫做 python-dev

wordcloud安装完毕

代码

生成词云一份代码,并且随便找一份英文(我在ChinaDaily找的文章 Recruiters starting to employ social media 放到 txt/word.txt中

  1. # -*- coding: UTF-8 -*-
  2. import matplotlib
  3. # Force matplotlib to not use any Xwindows backend.
  4. #matplotlib.use('Agg')
  5. from wordcloud import WordCloud
  6. textfile = open(u'txt/word.txt','r').read()
  7. wordcloud = WordCloud(background_color="white",width=800, height=600, margin=5).generate(textfile)
  8. # width,height,margin可以设置图片属性
  9. # generate 可以对全部文本进行自动分词,但是它对中文支持不好
  10. #background_color参数为设置背景颜色,默认颜色为黑色
  11. wordcloud.to_file('word.png')

执行命令运行 python clouddemo.py 报错提示

  1. SyntaxError: Non-ASCII character '\xe5' in file clouddemo.py on line 6,
  2. but no encoding declared; see http://www.python.org/peps/pep-0263.html for details

原因如下

Python默认是以ASCII作为编码方式的,如果在Python源码中包含了中文(或者其他非英语系的语言),此时即使你把自己编写的Python源文件以UTF-8格式保存,但实际上,这依然是不行的。

解决办法很简单,只要在文件开头加入下面代码;指定文件的编码格式为utf-8。上面的代码我已经加好了(。・`ω´・)。

  1. # -*- coding: UTF-8 -*-

编码问题解决了。接下来重新运行。

还是报错!!!

  1. ImportError: No module named Tkinter

首先yum list installed | grep ^tk

查看是否存在相应模块,如果不存在则通过yum install tkinter 和yum install -y tk-devel下载相应模块。

重新执行命令提示下一个错误

  1. _tkinter.TclError: no display name and no $DISPLAY environment variable

虽然一波N折,但是最后还是成功了!!!看看源代码目录下的词云图!

效果图如下:

从CentOS安装完成到生成词云python学习日记的更多相关文章

  1. 根据词频生成词云(Python wordcloud实现)

    网上大多数词云的代码都是基于原始文本生成,这里写一个根据词频生成词云的小例子,都是基于现成的函数. 另外有个在线制作词云的网站也很不错,推荐使用:WordArt 安装词云与画图包 pip3 insta ...

  2. Python3+pdfminer+jieba+wordcloud+matplotlib生成词云(以深圳十三五规划纲要为例)

    一.各库功能说明 pdfminer----用于读取pdf文件的内容,python3安装pdfminer3k jieba----用于中文分词 wordcloud----用于生成词云 matplotlib ...

  3. python 基于 wordcloud + jieba + matplotlib 生成词云

    词云 词云是啥?词云突出一个数据可视化,酷炫.以前以为很复杂,不想python已经有成熟的工具来做词云.而我们要做的就是准备关键词数据,挑一款字体,挑一张模板图片,非常非常无脑.准备好了吗,快跟我一起 ...

  4. wordcloud + jieba 生成词云

    利用jieba库和wordcloud生成中文词云. jieba库:中文分词第三方库 分词原理: 利用中文词库,确定汉字之间的关联概率,关联概率大的生成词组 三种分词模式: 1.精确模式:把文本精确的切 ...

  5. 已知词频生成词云图(数据库到生成词云)--generate_from_frequencies(WordCloud)

    词云图是根据词出现的频率生成词云,词的字体大小表现了其频率大小. 写在前面: 用wc.generate(text)直接生成词频的方法使用很多,所以不再赘述. 但是对于根据generate_from_f ...

  6. Python 情人节超强技能 导出微信聊天记录生成词云

    前言 本文的文字及图片来源于网络,仅供学习.交流使用,不具有任何商业用途,版权归原作者所有,如有问题请及时联系我们以作处理. 作者: Python实用宝典 PS:如有需要Python学习资料的小伙伴可 ...

  7. 【python】itchat登录微信获取好友签名并生成词云

    在知乎上看到一篇关于如何使用itchat统计微信好友男女比例并使用plt生成柱状图以及获取微信好友签名并生成词云的文章https://zhuanlan.zhihu.com/p/36361397,感觉挺 ...

  8. Python统计excel表格中文本的词频,生成词云图片

    import xlrd import jieba import pymysql import matplotlib.pylab as plt from wordcloud import WordClo ...

  9. 【python3】爬取简书评论生成词云

    一.起因: 昨天在简书上看到这么一篇文章<中国的父母,大都有毛病>,看完之后个人是比较认同作者的观点. 不过,翻了下评论,发现评论区争议颇大,基本两极化.好奇,想看看整体的评论是个什么样, ...

随机推荐

  1. 快速排序算法分析--C++版

    快速排序由于排序效率在同为O(N*logN)的几种排序方法中效率较高,因此经常被采用,再加上快速排序思想----分治法也确实实用,因此很多软件公司的笔试面试喜欢考这个. 快速排序是C.R.A.Hoar ...

  2. Kotlin——最详细的数据类型介绍

    任意一种开发语言都有其数据类型,并且数据类型对于一门开发语言来说是最基本的构成,同时也是最基础的语法.当然,kotlin也不例外.kotlin的数据类型和Java是大致相同的,但是他们的写法不同,并且 ...

  3. Kotlin——最详细的控制语句使用

    在前面 的章节中讲解了Kotlin语言中的数据类型.变量与常量的定义.不了解请参见前面的内容: Kotlin从无到有系列之数据类型介绍. Kotlin从无到有系列之变量.常量.注释的使用. 下面详细为 ...

  4. 求最小生成树——Kruskal算法

    给定一个带权值的无向图,要求权值之和最小的生成树,常用的算法有Kruskal算法和Prim算法.这篇文章先介绍Kruskal算法. Kruskal算法的基本思想:先将所有边按权值从小到大排序,然后按顺 ...

  5. 在vmware 中使用桥连接 连接到网络

    vMware虚拟机以后,连不上网,通过ifconfig命令,查看结果,如图所示: 然后,我想尝试一下,在虚拟机中ping 本地物理机地址,结果如图. 总结起来,主要有4步: 1.使用chkconfig ...

  6. BootStrap Table和Mybatis Plus实现服务端分页

    一.后台java代码(Mybatis Plus分页) (1)Mybatis Plus分页的配置,在mybatis的xml文件中增加如下配置(Mybatis Plus官方文档:http://baomid ...

  7. 修改Jupyter notebook的启动目录

    修改Jupyter notebook的启动目录 1. 在控制台输入以下命令,检查Jupyter notebook的安装目录 jupyter notebook --generate-config ​ 如 ...

  8. C++ 空间配置器(allocator)

    C++ 空间配置器(allocator) 在STL中,Memory Allocator 处于最底层的位置,为一切的 Container 提供存储服务,是一切其他组件的基石.对于一般使用 STL 的用户 ...

  9. Towers CodeForces - 229D

    The city of D consists of n towers, built consecutively on a straight line. The height of the tower ...

  10. css相关 细节 优化 备忘

    <p>标签不能再包含<p>,也不能包含<div>,<div>可以包含<p> a 和 img 标签是特殊的行内元素,a标签可以包含div等,几 ...