使用R语言-操作data.frame】的更多相关文章

1 向一个data.frame指定列插入一列新数据 1.1 插入一列到指定位置 y<-1:4 data1 <-data.frame(x1=c(1,3,5,7), x2=c(2,4,6,8),x3=c(11,12,13,14),x4=c(15,16,17,18)) data2<-cbind(data1[,1:2],y,data1[,3:ncol(data1)]) 插到data1末尾 data2<-cbind(data1,y) 插到第一列 data2<-cbind(y,data1…
Merging Data Adding Columns To merge two data frames (datasets) horizontally,  use the merge function. In most cases, you join two data frames  by one or more common key variables (i.e., an inner join). # merge two data frames by ID   total <- merge(…
data.frame比较像表格,每一列是一个向量,即每列中的元素是同一类型:所有列具有相同的长度. x = 10:1 y = -4:5 q = c("Ha","oh","wow","yes","Noooo","wasami","cuckoo","sweet","candy","gloss") df1 = da…
在使用ARIMA模型来预测我们的销量的时候,如果保存预测版本进DB,以供后续分析呢 1. 在定义变量阶段我们定义了dfResult      <- data.frame() 这是一个data frame 2. 预测的结果通常是一个vector 例如我们预测90个期间的数据:pred <- predict(fit, n.ahead = 1*90) 3. 假设我们每天都保存一次预测版本,可以设置变量如下 strPredictVer <- format(Sys.Date(),"%Y-…
pathway_name = rownames(g1) tm <- list('P-value' = c(), 'Pathway_name' = c()) :dim(g1)[]){ results<- t.test(g1[i,],g2[i,])$p.value print(results) tm$`P-value`<-append(tm$`P-value`,results) tm$Pathway_name<- append(tm$Pathway_name,pathway_name[…
以下内容出自http://www.douban.com/note/172387172/ CRAN上有很多R的数据库支持包,使R能够对数据库进行读写操作.这些包有:RODBC.DBI.RMySQL.ROracle,.RPostgreSQL.RSQLite. RJDBC .RpgSQL等等,支持几乎市面上所有的数据库系统.实现的技术也包括ODBC和JDBC两大方面.其中RJDBC和RpgSQL(基于JDBC)都需要Java的支持. 因为选择很多,所以R操作数据库的方式也很灵活,我本人的电脑系统是64…
平时都是几百万的数据量,这段时间公司中了个大标,有上亿的数据量. 现在情况是数据已经在数据库里面了,需要用R分析,但是完全加载不进来内存. 面对现在这种情况,R提供了ff, ffbase , ETLUtils  的解决方案. 它可以很简单的加载,转换数据库的数据进入R内存,ETLUtils 包现在已经扩展了read.odbc.ffdf 方法用来查询Oracle, MySQL, PostgreSQL & sqlite databases.. 下面我们就来展示一个例子. require(ETLUti…
本文作者:任坤,厦门大学王亚南经济研究院金融硕士生,研究兴趣为计算统计和金融量化交易,pipeR,learnR,rlist等项目的作者. 近年来,非关系型数据逐渐获得了更广泛的关注和使用.下面分别列举了一个典型的关系型数据表和一个典型的非关系型数据集. 关系型数据:一组学生的基本数据,包括姓名(Name).性别(Gender).年龄(Age)以及专业(Major). NAME GENDER AGE MAJOR Ken Male 24 Finance Ashley Female 25 Statis…
R语言CSV文件 在R语言中,我们可以从存储在R环境外部的文件读取数据.还可以将数据写入由操作系统存储和访问的文件. R可以读取和写入各种文件格式,如:csv,excel,xml等. 在本章中,我们将学习如何从csv文件中读取数据,然后将数据写入csv文件. 该文件应该存在于当前工作目录中,以方便R可以读取它. 当然,也可以设置自己的目录,并从那里读取文件. 获取和设置工作目录 可以使用getwd()函数来检查R工作区指向哪个目录,使用setwd()函数设置新的工作目录. # Get and p…
1.       绩效评估 时间的确定 R测量时间是在最简单的方式提供是system.time性能. system.time(expr, gcFirst=TRUE) 这个函数会在不减少程序执行性能的情况下,执行表达式expr,gcFrist则是指定程序执行前是否先执行垃圾回收. do.stuff <- function(){ a <- 1:100000 for(i in 1:100000){ a[i] <- a[i]^2 } a } system.time(do.stuff()) 监控内…