本文作者:任坤,厦门大学王亚南经济研究院金融硕士生,研究兴趣为计算统计和金融量化交易,pipeR,learnR,rlist等项目的作者. 近年来,非关系型数据逐渐获得了更广泛的关注和使用.下面分别列举了一个典型的关系型数据表和一个典型的非关系型数据集. 关系型数据:一组学生的基本数据,包括姓名(Name).性别(Gender).年龄(Age)以及专业(Major). NAME GENDER AGE MAJOR Ken Male 24 Finance Ashley Female 25 Statis
在数据分析中,对缺失值的处理是很关键一步,一般用summary()函数 a<-c(,,,NA) B<-c("a","b","c","D") d<-data.frame(a,B) summary(d) a B Min. : 1st Qu.: Median : Mean : 3rd Qu.:2.5 Max. :3.0 NA's :1 但通过R语言的VIM包的aggr函数可以做缺失值的图形化展示: library(
R语言函数化学习笔记 1.apply函数 可以让list或者vector的元素依次执行一遍调用的函数,输出的结果是list格式 2.sapply函数 原理和list一样,但是输出的结果是一个向量的形式 3.vapply 这个函数输出的结果更加详细,但是函数使用的时候需要多写一个几个参数来控制 Use vapply Before you get your hands dirty with the third and last apply function that you'll learn abo