R笔记1】的更多相关文章

#####开一个新的系列.关于R的一些笔记,就是遇到过的一些问题的简单整理.可能很基本,也可能没什么大的用处,作为一个记录而已.---------------------------------------------------------------------------R笔记(1):formula和Formula 1.基本的R公式对象formula 在R当中,公式fomula是一个把响应变量(在~左侧)和解释变量(在~右侧)联系起来的对象.formula可以用在线性/一般线性模型(如lm…
R语言与数据挖掘:公式:数据:方法 R语言特征 对大小写敏感 通常,数字,字母,. 和 _都是允许的(在一些国家还包括重音字母).不过,一个命名必须以 . 或者字母开头,并且如果以 . 开头,第二个字符不允许是数字. 基本命令要么是表达式(expressions)要么就是 赋值(assignments). 命令可以被 (;)隔开,或者另起一行. 基本命令可以通过大括弧({和}) 放在一起构成一个复合表达式(compound expression). 一行中,从井号(#)开始到句子收尾之间的语句就…
我们说Excel有难度的图表,可以考虑ggplot2是否更方便,本帖的例子就是用ggplot做玫瑰图. Excel做玫瑰图有一定难度,可以使用雷达图或圆环图来构建,我的博客上曾有多个帖子讨论这个,见 1.已被sohu隐藏 2.已被sohu隐藏 3.圆环图做南丁格尔玫瑰图:http://blog.sina.com.cn/s/blog_6bc5205e0101jk0r.html 但在ggplot2中做这个图表类型却是非常的简单方便. #读入你的数据.还是使用以前例子的数据,如下图: rose <-…
本文转载自cador<使用R语言进行异常检测> 本文结合R语言,展示了异常检测的案例,主要内容如下: (1)单变量的异常检测 (2)使用LOF(local outlier factor,局部异常因子)进行异常检测 (3)通过聚类进行异常检测 (4)对时间序列进行异常检测 一.单变量异常检测 本部分展示了一个单变量异常检测的例子,并且演示了如何将这种方法应用在多元数据上.在该例中,单变量异常检测通过boxplot.stats()函数实现,并且返回产生箱线图的统计量.在返回的结果中,有一个部分是o…
R语言学习笔记:日期处理 1.取出当前日期 Sys.Date() [1] "2014-10-29" date() #注意:这种方法返回的是字符串类型 [1] "Wed Oct 29 20:36:07 2014" 2.在R中日期实际是double类型,是从1970年1月1日以来的天数 typeof(Sys.Date()) [1] "double" 3.转换为日期 用as.Date()可以将一个字符串转换为日期值,默认格式是yyyy-mm-dd. a…
笔记: 1.R输入命令时速度不要太快,终究是个统计软件,不是编程! 2.memory.limit()查看当前操作系统分配内存给R的最大限度(单位是M?) 3.要经常 rm(object) 或者 rm(list=ls()) 和 gc()释放内存空间 4.尽量提前设置矩阵大小固定不变,矩阵每增长一次,即使赋给同名的变量,都需要新开辟一块更大的空间 5.尽量避免循环语句 6.用矩阵,而不是数据框 7.在大数据集运行前现在子数据集上测试程序 8.将数据保存到R的住内存之外的包:     biglm和sp…
R语言glm函数学习:  [转载时请注明来源]:http://www.cnblogs.com/runner-ljt/ Ljt 作为一个初学者,水平有限,欢迎交流指正. glm函数介绍: glm(formula, family=family.generator, data,control = list(...)) family:每一种响应分布(指数分布族)允许各种关联函数将均值和线性预测器关联起来. 常用的family: binomal(link='logit')         ----响应变量…
R的日记-给R加个编译器 转载▼ R是一款强大免费且开源的统计分析软件,这是R的长处,可也是其“缺陷”的根源:不似商业软件那样user-friendly.记得初学R时,给我留下最深印象的不是其功能的强大(体会到的其实是),而是其简洁如一张白纸的操作界面,再加上复杂而劳累的一遍遍敲击键盘,感觉用其做一点点统计分析都是噩梦.时至今日,R的编译界面,我依然觉得是用过的软件中最烂的那类.一个这么好的软件为什么就不做一个好用的界面呢? 幸运的是,到目前已经有好几个第三方的编译器可以和R联接.用这些编译器有…
内容概览 尽管R是一门以数值向量和矩阵为核心的统计语言,但字符串同样极为重要.从医疗研究数据里的出生日期到文本挖掘的应用,字符串数据在R程序中使用的频率非常高.R语言提供了很多字符串操作函数,本文仅简要以下几种常用的字符串函数. 字符串分割函数:strsplit( ) 字符串连接函数:paste( ) 计算字符串长度:nchar( ) 字符串截取函数:substr( )及substring( ) 字符串替换函数:chartr( ) 大小写转换函数:toupper( ).tolower( )及ca…
问题: R中提供的例子不太懂,为什么得出的结果是6  5  2  1  7  4 10  8  3  9呢? (ii <- order(x <- c(1,1,3:1,1:4,3), y <- c(9,9:1), z <-c(2,1:9)))##结果为 6  5  2  1  7  4 10  8  3  9    原始数据:x :   1    1    3    2    1    1    2    3    4     3.                   y:    9…