R笔记1
gsub format
> measurements<-c('3.95*3.99*2.43mm','3*3*5mm','2*2*2mm')
> measurements
[1] "3.95*3.99*2.43mm" "3*3*5mm" "2*2*2mm"
> # 去掉mm后缀
> a<-gsub('mm','',measurements)
> a
[1] "3.95*3.99*2.43" "3*3*5" "2*2*2"
> library(plyr)
> ?strsplit
> # 用 * 将数据分隔开,并将列表型数据转换为数据框格式
> strsplit(a,'[*]')
[[1]]
[1] "3.95" "3.99" "2.43"
[[2]]
[1] "3" "3" "5"
[[3]]
[1] "2" "2" "2"
> res <-ldply(strsplit(a,'[*]'))
> # 重命名数据框
> names(res)<-c('L','W','H')
> # 更改各个变量的数据类型为数值型
> res
L W H
1 3.95 3.99 2.43
2 3 3 5
3 2 2 2
> str(res)
'data.frame': 3 obs. of 3 variables:
$ L: chr "3.95" "3" "2"
$ W: chr "3.99" "3" "2"
$ H: chr "2.43" "5" "2"
> res<- as.data.frame(sapply(res,FUN=as.numeric))
> head(res)
L W H
1 3.95 3.99 2.43
2 3.00 3.00 5.00
3 2.00 2.00 2.00
> str(res)
'data.frame': 3 obs. of 3 variables:
$ L: num 3.95 3 2
$ W: num 3.99 3 2
$ H: num 2.43 5 2
> #从定性角度,通过可视化来进行数据的探索性分析,强烈推荐使用GGally包中的ggpairs()函数,
> #该函数将绘制两辆变量的相关系数、散点图,同时也绘制出单变量的密度分布图
> library(ggplot2)
> library(GGally)
> head(iris)
Sepal.Length Sepal.Width Petal.Length Petal.Width Species
1 5.1 3.5 1.4 0.2 setosa
2 4.9 3.0 1.4 0.2 setosa
3 4.7 3.2 1.3 0.2 setosa
4 4.6 3.1 1.5 0.2 setosa
5 5.0 3.6 1.4 0.2 setosa
6 5.4 3.9 1.7 0.4 setosa
> ggpairs(iris[,1:4])
> ggsave("aaaaa.png")
Saving 8.46 x 5.03 in image
> memory.limit() #查看系统规定的内存使用上限
[1] 4077
> memory.limit(newlimit)#更改到新的上限
Error in memory.limit(newlimit) : object 'newlimit' not found
> #养成清理内存的习惯
> rm(object) #删除变量
Warning message:
In rm(object) : object 'object' not found
> gc() #在rm()后,记得使用gc()做garbage collection ,否则内存是不会释放的,相当于没有做rm()
used (Mb) gc trigger (Mb) max used (Mb)
Ncells 1330209 71.1 2164898 115.7 2164898 115.7
Vcells 6475711 49.5 10202170 77.9 8435142 64.4
> td=data.frame(c('2016-01','2016-02'),stringsAsFactors =F)
> td
c..2016.01....2016.02..
1 2016-01
2 2016-02
> td2<- sapply(td,paste,"-01",sep="")
> td2
c..2016.01....2016.02..
[1,] "2016-01-01"
[2,] "2016-02-01"
> as.Date(td2[,1]) #画图用
[1] "2016-01-01" "2016-02-01"
> format(as.Date(td2[,1]),"%Y-%m")
[1] "2016-01" "2016-02"
R笔记1的更多相关文章
- R笔记(1):formula和Formula
#####开一个新的系列.关于R的一些笔记,就是遇到过的一些问题的简单整理.可能很基本,也可能没什么大的用处,作为一个记录而已.------------------------------------ ...
- 【R笔记】R语言函数总结
R语言与数据挖掘:公式:数据:方法 R语言特征 对大小写敏感 通常,数字,字母,. 和 _都是允许的(在一些国家还包括重音字母).不过,一个命名必须以 . 或者字母开头,并且如果以 . 开头,第二个字 ...
- R笔记4:ggplot绘制商务图表--玫瑰图
我们说Excel有难度的图表,可以考虑ggplot2是否更方便,本帖的例子就是用ggplot做玫瑰图. Excel做玫瑰图有一定难度,可以使用雷达图或圆环图来构建,我的博客上曾有多个帖子讨论这个,见 ...
- 【R笔记】使用R语言进行异常检测
本文转载自cador<使用R语言进行异常检测> 本文结合R语言,展示了异常检测的案例,主要内容如下: (1)单变量的异常检测 (2)使用LOF(local outlier factor,局 ...
- 【R笔记】日期处理
R语言学习笔记:日期处理 1.取出当前日期 Sys.Date() [1] "2014-10-29" date() #注意:这种方法返回的是字符串类型 [1] "Wed O ...
- 【R笔记】R的内存管理和垃圾清理
笔记: 1.R输入命令时速度不要太快,终究是个统计软件,不是编程! 2.memory.limit()查看当前操作系统分配内存给R的最大限度(单位是M?) 3.要经常 rm(object) 或者 rm( ...
- 【R笔记】glm函数报错原因及解析
R语言glm函数学习: [转载时请注明来源]:http://www.cnblogs.com/runner-ljt/ Ljt 作为一个初学者,水平有限,欢迎交流指正. glm函数介绍: glm(for ...
- 【R笔记】给R加个编译器——notepad++
R的日记-给R加个编译器 转载▼ R是一款强大免费且开源的统计分析软件,这是R的长处,可也是其“缺陷”的根源:不似商业软件那样user-friendly.记得初学R时,给我留下最深印象的不是其功能的强 ...
- 【R笔记】R语言中的字符串处理函数
内容概览 尽管R是一门以数值向量和矩阵为核心的统计语言,但字符串同样极为重要.从医疗研究数据里的出生日期到文本挖掘的应用,字符串数据在R程序中使用的频率非常高.R语言提供了很多字符串操作函数,本文仅简 ...
- 【R笔记】order函数例子
问题: R中提供的例子不太懂,为什么得出的结果是6 5 2 1 7 4 10 8 3 9呢? (ii <- order(x <- c(1,1,3:1,1:4,3), y & ...
随机推荐
- IAR使用记录
1. Project-->Options... 更改器件:General-->Target-->Device 添加其它需包含的目录:C/C++ Compiler-->Prepr ...
- RabbitMQ Exchange中的fanout类型
fanout 多播 在之前都是使用direct直连类型的交换机,通过routingkey来决定把消息推到哪个queue中. 而fanout则是把拿到消息推到与之绑定的所有queue中. 分析业务,怎样 ...
- CentOS编译安装nodejs
1. 从node.js官网下载最新版的node.js安装包,node.tar.gz wget https://nodejs.org/dist/v4.3.1/node-v4.3.1.tar.gz ...
- Beta版本冲刺第六天 12.12
一.站立式会议照片: 二.项目燃尽图: Android端 后台 三.项目进展: 成 员 昨天完成任务 今天完成任务 明天要做任务 问题困难 心得体会 胡泽善 邮箱验证和用户评价的填写 用户评价的查看以 ...
- mysql 某周的起始和结束日期
转自:http://bbs.csdn.net/topics/370096126 t_table有数据如下:year Week2011 22011 32011 42011 ...
- 64位centos下安装python的PIL模块
http://blog.csdn.net/xiaojun1288/article/details/8673529
- SSH项目与SSM项目的进入首页的方法
SSH项目中: jsp页面一般都是存放在WEB-INF下面的目录下,这样我们就不能直接访问到这些jsp页面了,保证了页面的安全性. 在struts的管理中,是利用action来实现页面的跳转,进入in ...
- BZOJ4522: [Cqoi2016]密钥破解
pollard's rho模板题. 调参调到160ms无能为力了,应该是写法问题,不玩了. #include<bits/stdc++.h> using namespace std; typ ...
- Objective-C复合
正所谓复合,便是定义的这个类中的成员是另外类的实例方法. 也就是把其他对象作为自身的题部分,以提升自身的功能, 就相当于C语言中的函数嵌套.下面是一段代码(多个文件放在一块了): /***Comput ...
- glade2支持C++代码的输出(3)
今天完成了glade-2生成configure.ac/Makefile.am等调整 代码为:cpp_out_4.patch.zip BaseObject类也做了一些小的调整:BaseObject.00 ...