R 语言词云wordcloud
来源:http://blog.chinaunix.net/uid-25135004-id-4311592.html
wordcloud函数--用于绘制词云图
用法:
wordcloud(words,freq,scale=c(4,.5),min.freq=3,max.words=Inf,random.order=TRUE, random.color=FALSE, rot.per=.1,
colors="black",ordered.colors=FALSE,use.r.layout=FALSE,fixed.asp=TRUE, ...)
参数
1)words --- 关键词列表
the words
2)freq---关键词对应的词频列表
their frequencies
3)scale---显示字体大小的范围,例如c(3,0.3),最大字体是3,最小字体是0.3
A vector of length 2 indicating the range of the size of the words
4)min.freq---最小词频,低于最小词频的词不会被显示
words with frequency below min.freq will not be plotted
5)max.words---显示的最大词数量。
Maximum number of words to be plotted. least frequent terms dropped
6)random.order---词在图上的排列顺序。T:词随机排列;F:词按频数从图中心位置往外降序排列,即频数大的词出现在中心位置。
plot words in random order. If false, they will be plotted in decreasing frequency
7)random.color---控制词的字体颜色。T:字体颜色随机分配;F:根据频数分配字体颜色。
choose colors randomly from the colors. If false, the color is chosen based on the frequency
8)rot.per---控制词摆放角度。T:旋转90度;F:水平摆放。
proportion words with 90 degree rotation
9)colors---字体颜色列表
color words from least to most frequent
10)ordered.colors---控制字体颜色使用顺序。T:按照指定的顺序给出每个关键词字体颜色,(似乎是要求颜色列表中每个颜色一一对应关键词列表);F:任意给出字体颜色。
if true, then colors are assigned to words in order
11)use.r.layout
if false, then c++ code is used for collision detection, otherwise R is used
12) fixed.asp
if TRUE, the aspect ratio is fixed. Variable aspect ratio only supported if rot.per==0
13) ...
Additional parameters to be passed to text (and strheight,strwidth).
Details
If freq is missing, then words can either be a character vector, or Corpus. If it is a vector and freq is
missing, standard stop words will be removed prior to plotting.
安装:
install.packages('wordcloud')
例子:
wordcloud(c(letters, LETTERS, 0:9), seq(1, 1000, len = 62))
具体使用例子:
1、直接显示图像的例子
点击(此处)折叠或打开
- #加载wordcloud包
- library(wordcloud)
- #指定字体颜色范围 或者使用R颜色程序包中现成的主题模板 colors=brewer.pal(8,"Dark2")
- colors=c('red','blue','green','yellow','purple')
- #读取数据
- data=read.table("/root/words.xa",header = F)
- #显示图形
- wordcloud(data$V2,data$V1,scale=c(5,0.3),min.freq=-Inf,max.words=60,colors=colors,random.order=F,random.color=F,ordered.colors=F)
2、把图像保存为png
点击(此处)折叠或打开
- #设置保存图像的目录
- setwd("/tmp/")
- #设置保存图像的名字,背景颜色,宽度和高度
- png(file="wordcloud.png", bg="white",width = 480, height = 480)
- #加载wordcloud包
- library(wordcloud)
- #指定字体颜色范围 或者自定义颜色范围 colors=c('red','blue','green','yellow','purple')
- colors=brewer.pal(8,"Dark2")
- #读取数据
- data=read.table("/root/words.xa",header = F)
- #显示图形
- wordcloud(data$V2,data$V1,scale=c(5,0.3),min.freq=-Inf,max.words=60,colors=colors,random.order=F,random.color=F,ordered.colors=F)
- #结束符
- dev.off()
R 语言词云wordcloud的更多相关文章
- scrapy-redis爬取豆瓣电影短评,使用词云wordcloud展示
1.数据是使用scrapy-redis爬取的,存放在redis里面,爬取的是最近大热电影<海王> 2.使用了jieba中文分词解析库 3.使用了停用词stopwords,过滤掉一些无意义的 ...
- 大数据工具比较:R 语言和 Spark 谁更胜一筹?
本文有两重目的,一是在性能方面快速对比下R语言和Spark,二是想向大家介绍下Spark的机器学习库 背景介绍 由于R语言本身是单线程的,所以可能从性能方面对比Spark和R并不是很明智的做法.即使这 ...
- 掌握R语言中的apply函数族(转)
转自:http://blog.fens.me/r-apply/ 前言 刚开始接触R语言时,会听到各种的R语言使用技巧,其中最重要的一条就是不要用循环,效率特别低,要用向量计算代替循环计算. 那么,这是 ...
- 词云-wordcloud
import jiebabook = "2015.txt"txt = open(book).read()ex = {'不是','就是','的话','1.1','docin','ww ...
- R语言中的factor
对于初学者来说,R语言中的factor有些难以理解.如果直译factor为“因子”,使得其更加难以理解.我倾向于不要翻译,就称其为factor,然后从几个例子中理解: <span style=& ...
- R语言中apply函数
前言 刚开始接触R语言时,会听到各种的R语言使用技巧,其中最重要的一条就是不要用循环,效率特别低,要用向量计算代替循环计算. 那么,这是为什么呢?原因在于R的循环操作for和while,都是基于R语言 ...
- R语言中的MySQL操作
R语言中,针对MySQL数据库的操作执行其实也有很多中方式.本人觉得,熟练掌握一种便可,下面主要就个人的学习使用情况,总结其中一种情况-----使用RMySQL操作数据库. 1.下载DBI和RMySQ ...
- 词云wordcloud入门示例
整体简介: 词云图,也叫文字云,是对文本中出现频率较高的“关键词”予以视觉化的展现,词云图过滤掉大量的低频低质的文本信息,使得浏览者只要一眼扫过文本就可领略文本的主旨. 基于Python的词云生成类库 ...
- 词云wordcloud类介绍&python制作词云图&词云图乱码问题等小坑
词云图,大家一定见过,大数据时代大家经常见,我们今天就来用python的第三方库wordcloud,来制作一个大数据词云图,同时会降到这个过程中遇到的各种坑, 举个例子,下面是我从自己的微信上抓的微信 ...
随机推荐
- 这是我见过最厉害的--智能代码生成器、html+js+底层+sql全都有、瓦特平台
1:直接上图.图片有点多.我就没全部上传了. (demo.使用方法.数据库bak)下载:http://pan.baidu.com/s/1ntE5bDn 起源: 之前有好多人问我代码生成器的源码.我发了 ...
- 《Cracking the Coding Interview》——第16章:线程与锁——题目6
2014-04-27 20:25 题目:关于java中标有synchronized的成员方法? 解法:这代表同一个对象实例的synchronized方法不能被多个线程同时调用.注意有这么多个地方都加粗 ...
- windows 10的资源管理器不显示映射的网络驱动器怎么办?
最近在使用映射网络驱动器的时候出现一个奇怪的现象.事情源于我在资源管理器里面映射了来自多个不同账号的网络驱动器.使用的是win10系统.映射不同账号的网络驱动器是不允许的.于是只能删掉其他账号和凭证重 ...
- Python——数据类型之list、tuple
本篇主要内容 • list初识 • list元素的访问 • list内部所有的方法 • tuple介绍和与list用法的比较 我觉得Python里面用的最多的就是List了,感觉好强大.他能存 ...
- abp ef codefirst 设置默认值
public partial class tableIsWaringfiled : DbMigration { public override void Up() { //设置默认值为true Add ...
- jQuery基础知识点(上)
jQuery是一个优秀的.轻量级的js库 ,它兼容CSS3,还兼容各种浏览器(IE 6.0+, FF1.5+, Safari 2.0+, Opera 9.0+),而jQuery2.0及后续版本将不再支 ...
- 真·APIO2018滚粗记
有人说只有大佬才会说滚粗啊爆零啊…… 然而我真滚粗真爆零啊…… D1: 听课,然后夏眠. 咦折纸……哦好吧太神仙了. 咦AI……好妙啊好妙啊. 咦二分……哇还有wqs二分这种神奇操作,学学学. (我是 ...
- .ini配置读取
ini文件的格式 格式 INI文件由节.键.值组成. 节 [section] 参数(键=值) name=value 注解 注解使用分号表示(;).在分号后面的文字,直到该行结尾都全部为注解. ...
- MFC 按钮
((CButton *)GetDlgItem(IDC_RADIO1))->SetCheck(TRUE);//选上 ((CButton *)GetDlgItem(IDC_RADIO1))-> ...
- poj2728 最小比率生成树——01分数规划
题目大意: 有n个村庄,村庄在不同坐标和海拔,现在要对所有村庄供水, 只要两个村庄之间有一条路即可,建造水管距离为坐标之间的欧几里德距离,费用为海拔之差, 现在要求方案使得费用与距离的比值最小,很显然 ...