首页
Python
Java
IOS
Andorid
NodeJS
JavaScript
HTML5
R语言table 统计文本频次
2024-11-04
R语言 table()函数
table函数 用 table() 函数统计因子各水平的出现次数(称为频数或频率).也可以对一般的向量统计每个不同元素的出现次数.如 sex = c("女","女","女","男","男")table(sex) sex 男 女 2 3 对一个变量用 table 函数计数的结果是一个特殊的有元素名的向量,元素名是自变量的不同取值,结果的元素值是对应的频数.单个因子或单个向量的频数结果可以用向量的下标访问方法取
R语言table()函数
R语言table()函数比较有用,两个示例尤其是混淆矩阵这个案例比较有用: 例子一:统计频次 z<-c(1,2,2,4,2,7,1,1);z1<-table(z);summary(z1); z1#实现z中各数据频次的统计z1 2 4 7 3 3 1 1 names(z1)#居然是有名字的[1] "1" "2" "4" "7"例子二:实现混淆矩阵 t=table(c(1,0,1,1,1,0,0,1),c(0,0,1,
R语言︱常用统计方法包+机器学习包(名称、简介)
一.一些函数包大汇总 转载于:http://www.dataguru.cn/thread-116761-1-1.html 时间上有点过期,下面的资料供大家参考基本的R包已经实现了传统多元统计的很多功能,然而CRNA的许多其它包提供了更深入的多元统计方法,下面要综述的包主要分为以下几个部分: 1) 多元数据可视化(Visualising multivariate data): 绘图方法: 基本画图函数(如:pairs().coplot())和 lattice包里的画图函数(xyplot().spl
R语言 ETL+统计+可视化
这篇文章...还是看文章吧 导入QQ群信息,进行ETL,将其规范化 计算哪些QQ发言较多 计算一天中哪些时段发言较多 计算统计内所有天的日发言量 setwd("C:/Users/liyi/Desktop") a<-readLines("message2.txt",encoding = "UTF-8",skipNul=T) head(a,20) nchar(a) # 除去空白行 newa<-a[nchar(a)>1] length
R语言-分组统计
分组统计 1.假定有一组成绩数据,要求根据性别进行分组统计: > score ID score1 score2 Gender1 101 11.35321 0.9 male2 102 12.58654 0.6 male3 103 19.79380 0.9 female4 104 12.01352 0.4 female5 105 11.97081 0.4 female6 106 17.37480 0.7 female7 107 14
R语言描述性统计常用函数
R语言:文本(字符串)处理与正则表达式
R语言:文本(字符串)处理与正则表达式 (2014-03-27 16:40:44) 转载▼ 标签: 教育 分类: R 处理文本是每一种计算机语言都应该具备的功能,但不是每一种语言都侧重于处理文本.R语言是统计的语言,处理文本不是它的强项,perl语言这方面的功能比R不知要强多少倍.幸运的是R语言的可扩展能力很强,DNA/RNA/AA等生物序列现在已经可以使用R来处理. R语言处理文本的能力虽然不强,但适当用用还是可以大幅提高工作效率的,而且有些文本操作还不得不用.高效处理文本少不了正则表达式(r
R语言︱文本(字符串)处理与正则表达式
处理文本是每一种计算机语言都应该具备的功能,但不是每一种语言都侧重于处理文本.R语言是统计的语言,处理文本不是它的强项,perl语言这方面的功能比R不知要强多少倍.幸运的是R语言的可扩展能力很强,DNA/RNA/AA等生物序列现在已经可以使用R来处理. nchar 字符的个数 toupper 转换为大写字符 tolower 转换为小写字符 substr 求字符串的字串 grep 基于正则表达式的匹配 sub 基于正则表达式的替换 strsplit 字符串分割 paste 字符向量连接 match
R语言学习笔记:分析学生的考试成绩
孩子上初中时拿到过全年级一次考试所有科目的考试成绩表,正好可以用于R语言的统计分析学习.为了不泄漏孩子的姓名,就用学号代替了,感兴趣可以下载测试数据进行练习. num class chn math eng phy chem politics bio history geo pe0158 3 99 120 114 70 49.5 50 49 48.5 49.5 600442 7 107 120 118.5 68.6 43 49 48.5 48.5 49 560249 4 98 120 116 70
[转]概率基础和R语言
概率基础和R语言 R的极客理想系列文章,涵盖了R的思想,使用,工具,创新等的一系列要点,以我个人的学习和体验去诠释R的强大. R语言作为统计学一门语言,一直在小众领域闪耀着光芒.直到大数据的爆发,R语言变成了一门炙手可热的数据分析的利器.随着越来越多的工程背景的人的加入,R语言的社区在迅速扩大成长.现在已不仅仅是统计领域,教育,银行,电商,互联网….都在使用R语言. 要成为有理想的极客,我们不能停留在语法上,要掌握牢固的数学,概率,统计知识,同时还要有创新精神,把R语言发挥到各个领域.让我们一起
R语言介绍
R语言简介 R语言是一种为统计计算和图形显示而设计的语言环境,是贝尔实验室(Bell Laboratories)的Rick Becker.John Chambers和Allan Wilks开发的S语言的一种实现,提供了一系列统计和图形显示工具.S语言也是目前比较流行的统计软件S-PLUS的基础.http://hovertree.com/ R语言的创始人Ross Ihaka和Robert Gentleman,由于这两位“R之父”的名字都是以R开头,所以就称之为R语言. R语言是一组数据操作,计算和
R语言快速入门
R语言是针对统计分析和数据科学的功能全面的开源语言,R的官方网址:http://www.r-project.org/ 在Windows环境下安装R是很方便的 R语言的两种运行模式:交互模式和批处理模式:顾名思义交互模式是一条输入一条输出,而批处理模式则可让处理过程自动化 批处理模式演示: pdf("demo.pdf") #创建demo.pdf文件 hist(rnorm(1000)) #调用hist()画直方图,调用rnorm()生成随机数 dev.off() #将实际文件输出到磁盘上
R语言笔记
R语言笔记 学习R语言对我来说有好几个地方需要注意的,我觉得这样的经验也适用于学习其他的新的语言. 语言的目标 我理解语言的目标就是这个语言是用来做什么的,为什么样的任务服务的,也就是设计这个语言的动机.比如C++是为系统编程服务的,java是为企业级应用服务的.R语言是用于统计分析,这样在R的系统中有大量的库(或者是package)用来实现特定的统计方法. 基本的数据类型 学习各个语言的第一步是了解这个语言的最基本的数据类型,这决定如何使用变量进行计算. 基本数据类型是直接由语言本身所定义的变
R 语言开发环境搭建
R 语言在统计计算和画图方面有着显著的优势,因此在大数据领域也有其一席之地. 本文将演示怎样搭建R 语言开发环境. 搭建R 语言开发环境,主要有两个步骤: - 安装 R 到操作系统 - 安装支持 R 的IDE 详细步骤: [1] 安装 R 到操作系统 1. 对于Windows,安装包下载地址:http://ftp.ctex.org/mirrors/CRAN/bin/windows/base/R-3.1.1-win.exe 2. Install R,安装完后打开R console: 3. 能够输入
R语言︱集合运算——小而美法则
每每以为攀得众山小,可.每每又切实来到起点,大牛们,缓缓脚步来俺笔记葩分享一下吧,please~ --------------------------- 集合运算的一般规则如下: union(x,y) #求并集 intersect(x,y) #求交集 setdiff(x,y) #求属于x而不属于y的所有元素 setequal(x,y) #判断x与y是否相等 a %in% y #判断a是否为y中的元素 choose(n, k)
R语言学习笔记(五)绘图(1)
R是一个惊艳的图形构建平台,这也是R语言的强大之处.本文将分享R语言简单的绘图命令. 本文所使用的数据或者来自R语言自带的数据(mtcars)或者自行创建. 首先,让我们来看一个简单例子: dose <- c(20, 30, 40, 45, 60) drugA <- c(16,20,27,40,60) plot(dose, drugA) 绘制的图形如下: 我们有必要对上述代码做些说明:首句和第二条语句创建两个向量,第三条语句打开一个图形窗口并生成一幅散点图. 这也许是个极为
R语言入门:向量初探
R语言主要用于统计,因此引入了向量这个概念将更好地进行统计计算,在其他无法引入向量的语言当中则会使用循环来计算一些大规模的数据,在R语言当中则不需要,下面我们来看看R语言当中向量的具体用法吧! 首先,如果我们把x作为一个向量,将其赋值为拥有五个元素的向量,代码如下: > x <- c(1,2,3,4,5) > x [1] 1 2 3 4 5 > 我们可以看到x的值已经变成了1,2,3,4,5,其中进行向量赋值的时候,我们使用的是C()函数进行的向量化.当然,向量里面并不会像数学一样
R语言:用简单的文本处理方法优化我们的读书体验
博客总目录:http://www.cnblogs.com/weibaar/p/4507801.html 前言 延续之前的用R语言读琅琊榜小说,继续讲一下利用R语言做一些简单的文本处理.分词的事情.其实就是继续讲一下用R语言读书的事情啦,讲讲怎么用它里面简单的文本处理方法,来优化我们的读书体验,如果读邮件和读代码也算阅读的话..用的代码超级简单,不涉及其他包 这里讲两个示例,结尾再来吐槽和总结. 1)R-Blogger订阅邮件拆分 2) R代码库快速阅读方法 不在博客园上阅读时才会看到的,这篇博文
R语言实现︱局部敏感哈希算法(LSH)解决文本机械相似性的问题(二,textreuse介绍)
每每以为攀得众山小,可.每每又切实来到起点,大牛们,缓缓脚步来俺笔记葩分享一下吧,please~ --------------------------- 上一篇(R语言实现︱局部敏感哈希算法(LSH)解决文本机械相似性的问题(一,基本原理))讲解了LSH的基本原理,笔者在想这么牛气冲天的方法在R语言中能不能实现得了呢? 于是在网上搜索了一下,真的发现了一个叫textreuse的包可以实现这样的功能,而且该包较为完整,可以很好地满足要求. 现在的版本是 0.1.3,最近的更新的时间为 2016-0
R语言︱词典型情感分析文本操作技巧汇总(打标签、词典与数据匹配等)
每每以为攀得众山小,可.每每又切实来到起点,大牛们,缓缓脚步来俺笔记葩分享一下吧,please~ --------------------------- 笔者寄语:情感分析中对文本处理的数据的小技巧要求比较高,笔者在学习时候会为一些小技巧感到头疼不已. 主要包括以下内容: 1.批量读取txt字符文件(导入.文本内容逐行读取.加入文档名字). 2.文本清洗(一级清洗,去标点:二级清洗去内容:三级清洗,去停用词) 3.词典之间匹配(有主键join.词库匹配%in%) 4.分词之后档案id+label
热门专题
java 字符串的展开蓝桥杯
mybatis获取json字段为空
matlab怎么开启新图窗
scala调用java代码
android studio 手动给类添加包
win数据泵需要SYSDBA
授权目录的读写权限给另外的用户
点阵图 码 java
python 获取dnf窗口
map(number)如何执行
java @TableField的typeHandler
微信云开发数据库索引排序怎么排
jna对象转换二进制
mac 外接显示器 有时候不亮
岭回归的sklearn 实现实验心得
selenium 选radio
wps restart 命令
nexus3.46安装部署
css stick布局
linux给普通用户添加权限