作家王小波其实也是我国最早期的程序员,突发奇想,王小波写情书最喜欢用哪些词呢?用Python词云分析下!

直接上代码吧,有注释很好理解。输出的图片设置的比较大,所以运行的比较慢,可以适当把图片尺寸改小点。

  1. 1 import jieba
  2. 2 from stylecloud import gen_stylecloud
  3. 3
  4. 4 def jieba_cloud(file_name, icon):
  5. 5 with open(file_name, 'r', encoding='utf8') as f:
  6. 6 word_list = jieba.cut(f.read())
  7. 7
  8. 8 result = " ".join(word_list) # 分词用 隔开
  9. 9
  10. 10 # 设置停用词
  11. 11 stopwords_file = open('stopwords.txt', 'r', encoding='utf-8')
  12. 12 stopwords = [words.strip() for words in stopwords_file.readlines()]
  13. 13
  14. 14
  15. 15 # 制作中文词云
  16. 16 icon_name = " "
  17. 17 if icon == "1":
  18. 18 icon_name = "fas fa-thumbs-up"
  19. 19 elif icon == "2":
  20. 20 icon_name = "fas fa-heartbeat"
  21. 21 elif icon == "3":
  22. 22 icon_name = "fas fa-dog"
  23. 23 elif icon == "4":
  24. 24 icon_name = "fas fa-cat"
  25. 25 elif icon == "5":
  26. 26 icon_name = "fas fa-bug"
  27. 27 elif icon == "6":
  28. 28 icon_name = "fab fa-qq"
  29. 29 pic = str(icon) + '.png'
  30. 30 if icon_name is not None and len(icon_name) > 0:
  31. 31 gen_stylecloud(text=result,
  32. 32 size=2048, # stylecloud 的大小(长度和宽度)
  33. 33 icon_name=icon_name,
  34. 34 font_path='simsun.ttc',
  35. 35 max_font_size=400, # stylecloud 中的最大字号
  36. 36 max_words=3000, # stylecloud 可包含的最大单词数
  37. 37 custom_stopwords=stopwords, #定制停用词列表
  38. 38 output_name=pic)
  39. 39 else:
  40. 40 gen_stylecloud(text=result, font_path='simsun.ttc', output_name=pic)
  41. 41 return pic
  42. 42
  43. 43
  44. 44 # 主函数
  45. 45 if __name__ == '__main__':
  46. 46
  47. 47 jieba_cloud("王小波与李银河书信集.txt", "1")
  48. 48 jieba_cloud("王小波与李银河书信集.txt", "2")
  49. 49 jieba_cloud("王小波与李银河书信集.txt", "3")
  50. 50 jieba_cloud("王小波与李银河书信集.txt", "4")
  51. 51 jieba_cloud("王小波与李银河书信集.txt", "5")
  52. 52 jieba_cloud("王小波与李银河书信集.txt", "6")

炫酷的词云来了:


用Python分析下王小波与李银河写情书最爱用哪些词的更多相关文章

  1. 欣赏<沉默的大多数>——王小波

    君特·格拉斯在<铁皮鼓>里,写了一个不肯长大的人.小奥斯卡发现周围的世界太过荒诞,就暗下决心要永远做小孩子.在冥冥之中,有一种力量成全了他的决心,所以他就成了个侏儒.这个故事太过神奇,但很 ...

  2. matlab 小波工具箱

    wavemenu --- >wavelet ---->wavelet packet1-D Matlab小波工具箱的使用1 转载▼ http://blog.sina.com.cn/s/blo ...

  3. 好吧,左小波出山了——ie8兼容indexOf问题

    我,还是一个不懂世事的毛头小子,第一次写博.万事开头难,没事咱慢慢来.咳,练文笔吗.我觉得写东西最锻炼逻辑思维,我是一个不善于表达的人,可能是程序员的通病,但你看看人家王小波,八九十年代的作家兼职程序 ...

  4. 【转】小波与小波包、小波包分解与信号重构、小波包能量特征提取 暨 小波包分解后实现按频率大小分布重新排列(Matlab 程序详解)

    转:https://blog.csdn.net/cqfdcw/article/details/84995904 小波与小波包.小波包分解与信号重构.小波包能量特征提取   (Matlab 程序详解) ...

  5. ECG信号读出,检测QRS,P,T 波(小波去噪,并根据检测),基于BP辨识的神经网络

    这学期的课程选择神经网络.最后的作业处理ECG信号,并利用神经网络识别. 1  ECG引进和阅读ECG信号 1)ECG介绍  详细ECG背景应用就不介绍了,大家能够參考百度 谷歌.仅仅是简单说下ECG ...

  6. 小波神经网络(WNN)

    人工神经网络(ANN) 是对人脑若干基本特性通过数学方法进行的抽象和模拟,是一种模仿人脑结构及其功能的非线性信息处理系统. 具有较强的非线性逼近功能和自学习.自适应.并行处理的特点,具有良好的容错能力 ...

  7. [Python ]小波变化库——Pywalvets 学习笔记

    [Python ]小波变化库——Pywalvets 学习笔记 2017年03月20日 14:04:35 SNII_629 阅读数:24776 标签: python库pywavelets小波变换 更多 ...

  8. Python分析离散心率信号(下)

    Python分析离散心率信号(下) 如何使用动态阈值,信号过滤和离群值检测来改善峰值检测. 一些理论和背景 到目前为止,一直在研究如何分析心率信号并从中提取最广泛使用的时域和频域度量.但是,使用的信号 ...

  9. 基于python的小波阈值去噪算法

    https://blog.csdn.net/alwaystry/article/details/52756051 发表于 2018-01-10 16:32:17 嵌入式设计应用 +关注 小波图像去噪原 ...

随机推荐

  1. java中存储mysql数据库时间类型【date、time、datetime、timestamp】

    在MySQL中对于时间的存储自己见表的时候都是设置的varchar类型的,感觉挺方便的. 昨天拿别人建好的表写代码,发现这张表中时间类型为datetime的,凭感觉试了一下不行,网上查了刚开始试了好几 ...

  2. TVM量化小结手册

    TVM量化小结手册 文章目录 Offical References TVM quantization roadmap INT8 quantization proposal Quantization S ...

  3. 基于SSL(TLS)的HTTPS网页下载——如何编写健壮的可靠的网页下载

    源码下载地址案例开发环境:VS2010本案例未使用openssl库,内部提供了sslite.dll库进行TLS会话,该库提供了ISSLSession接口用于建立SSL会话. HTTP协议很简单,写个简 ...

  4. 编译原理-非确定有穷自动机(nondeterministic finite automata,NFA)

    是一个五元组,M=(S,∑,f,S0,F) S:有穷状态集 ∑:输入字母表(有穷) f:f(S,α)=S' 表示从一个状态S出发,识别了一个字α后,可以到达S'这个状态集合之间的某一个状态(可能的后继 ...

  5. 从一道高大上的面试题来学习位图算法BitMap

    今天我偶然刷到了一篇文章,"华为二面:一个文件里面有5亿个数据,一行一个,没有重复的,进行排序".不知道又是哪个无良媒体瞎起的标题,夺人眼球. 不过说归说,这题听着就很高大上,5亿 ...

  6. 【NX二次开发】Block UI 截面构建器

    属性说明 属性   类型   描述   常规           BlockID    String    控件ID    Enable    Logical    是否可操作    Group    ...

  7. 【NX二次开发】导出x_t、导入x_t例子,UF_PS_export_data、UF_PS_import_data

    获取blockUI 体收集器选择的体,导出x_t: std::vector<TaggedObject*>objects = bodySelect0->GetSelectedObjec ...

  8. 手把手使用Python语音识别,进行语音转文字

    0. 太长不看系列,直接使用 在1.2官网注册后拿到APISecret和APIKey,直接复制文章2.4demo代码,确定音频为wav格式,采样率为16K,在命令行执行 python single_s ...

  9. 6.17考试总结(NOIP模拟8)[星际旅行·砍树·超级树·求和]

    6.17考试总结(NOIP模拟8) 背景 考得不咋样,有一个非常遗憾的地方:最后一题少取膜了,\(100pts->40pts\),改了这么多年的错还是头一回看见以下的情景... T1星际旅行 前 ...

  10. Python变量小秘密

    变量全都是引用 跟其他编程语言不同,Python的变量不是盒子,不会存储数据,它们只是引用,就像标签一样,贴在对象上面. 比如: >>> a = [1, 2, 3] >> ...