R语言实战读书笔记(五)高级数据管理
5.2.1 数据函数
abs:
sqrt:
ceiling:求不小于x的最小整数
floor:求不大于x的最大整数
trunc:向0的方向截取x中的整数部分
round:将x舍入为指定位的小数
signif:舍入为指定的有效数字位数
cos,sin,tan
acos,asin,atan:反正弦,反余弦,反正切
cosh,sinh,tanh:双曲余弦,双曲正弦和双曲正切
acosh,asinh,atanh:反双曲余弦,反双曲正弦和反双曲正切
log(x,n):以n为底
log:
log10:
exp:
5.2.2 统计函数
mean
median:中位数
sd:标准差
var:方差
mad:绝对中位差
quantile:分位数
range:求值域
sum:
diff:滞后差分
min:
max:
scale:中心化(center=TRUE)或标准化(center=TRUE,scale=TRUE),按列.默认是对指定列进行均值为0,标准差为1的标准化.
5.2.3 概率函数
dnorm:密度函数
pnorm:分布函数
qnorm:分位数函数
rnorm:随机数生成函数
set.seed:指定随机数种子
runif:生成0到1区间上服从均匀分布的伪随机数
mvrnorm:多元正态分布数据
5.2.4 字符处理函数
nchar:计算字符数量
substr(x,start,stop):提取或替换一个字符向量中的子串
x<-"abcdef"
substr(x,2,4)结果是bcd
substr(x,2,4)<-"22222" x变成a222ef
grep(pattern,x,ignore.case=FALSE,fixed=FALSE):搜索,fixed=FALSE,pattern是正则,fixed=TRUE,pattern是一个文本字符串
sub(pattern,replacement,x,ignore.case=FALSE,fixed=FALSE):替换
strsplit(x,split,fixed=FALSE):在split处分割字符向量x中的元素
paste(...,sep="")
toupper:
tolower:
5.2.5 其他函数
length
seq(from,to,by)
rep(x,n)
cut(x,n)
pretty(x,n):创建美观的分割点
cat(...):连接,会在要连接的对象之间创建空格,可以用\b去掉这个空格
apply(x,margin,fun)
5.6
t:转置
5.6.2 整合数据
aggregate(x,by,FUN):by是一个list,按by中的变量聚合
5.6.3 reshape
melt(data,id=c())
cast(md,formula,FUN)
R语言实战读书笔记(五)高级数据管理的更多相关文章
- R语言实战读书笔记(四)基本数据管理
4.2 创建新变量 几个运算符: ^或**:求幂 x%%y:求余 x%/%y:整数除 4.3 变量的重编码 with(): within():可以修改数据框 4.4 变量重命名 包reshape中有个 ...
- R语言实战读书笔记(二)创建数据集
2.2.2 矩阵 matrix(vector,nrow,ncol,byrow,dimnames,char_vector_rownames,char_vector_colnames) 其中: byrow ...
- R语言实战读书笔记(三)图形初阶
这篇简直是白写了,写到后面发现ggplot明显更好用 3.1 使用图形 attach(mtcars)plot(wt, mpg) #x轴wt,y轴pgabline(lm(mpg ~ wt)) #画线拟合 ...
- R语言实战读书笔记1—语言介绍
第一章 语言介绍 1.1 典型的数据分析步骤 1.2 获取帮助 help.start() help("which") help.search("which") ...
- R语言实战读书笔记2—创建数据集(上)
第二章 创建数据集 2.1 数据集的概念 不同的行业对于数据集的行和列叫法不同.统计学家称它们为观测(observation)和变量(variable) ,数据库分析师则称其为记录(record)和字 ...
- R语言实战读书笔记(八)回归
简单线性:用一个量化验的解释变量预测一个量化的响应变量 多项式:用一个量化的解决变量预测一个量化的响应变量,模型的关系是n阶多项式 多元线性:用两个或多个量化的解释变量预测一个量化的响应变量 多变量: ...
- R语言实战读书笔记(七)基本统计分析
summary() sapply(x,fun,options):对数据框或矩阵中的每一个向量进行统计 mean sd:标准差 var:方差 min: max: median: length: rang ...
- R语言实战读书笔记(一)R语言介绍
1.3.3 工作空间 getwd():显示当前工作目录 setwd():设置当前工作目录 ls():列出当前工作空间中的对象 rm():删除对象 1.3.4 输入与输出 source():执行脚本
- R语言实战读书笔记(十三)广义线性模型
# 婚外情数据集 data(Affairs, package = "AER") summary(Affairs) table(Affairs$affairs) # 用二值变量,是或 ...
随机推荐
- (链接保存)CentOS 6.6下yum快速升级内核
(因Docker建议3.8以上kernel版本)这个方法升级很方便,保存链接备用: http://www.dadclab.com/archives/5340.jiecao Docker Engine安 ...
- Mac下配置Maven
1.Java环境变量设置就不说. 但是配置Maven需要检查下Java环境变量的设置.需要检查JAVA_HOME环境变量以及Java命令 wanyakundeMacBook-Pro:Library w ...
- Nginx搭建flv视频点播服务器
Nginx搭建flv视频点播服务器 前一段时间使用Nginx搭建的多媒体服务器只能在缓冲过的时间区域内拖放, 而不能拖放到未缓冲的地方. 这就带来了一个问题: 如果视频限速的速率很小, 那么客户端观看 ...
- 充分发挥异步在 ASP.NET 中的强大优势
作者:Brij Bhushan Mishra 最近几年,异步编程受到极大关注,主要是出于两个关键原因:首先,它有助于提供更好的用户体验,因为不会阻塞 UI 线程,避免了处理结束前出现 UI 界面挂起. ...
- JQuery原理及深入解析--转载
总体架构 jQuery是个出色的javascript库,最近结合它写javascript,看了下源码. 先从整体.全局的看,jQuery的源码几乎都在下面的代码中: (function() { //… ...
- 【hadoop】mapreduce原理总结
看了两天的各种博客,终于把MapReduce的原理理解了个大概.花了1个小时画了个流程图.大家看看,有不对的地方欢迎指正. 关键步骤: Map, Reduce就不多说了.记录一下我看了很久的部分: 1 ...
- java基础知识回顾之javaIO类---FileInputStream和FileOutputStream字节流复制图片
package com.lp.ecjtu; import java.io.FileInputStream; import java.io.FileNotFoundException; import j ...
- 相对布局RelativeLayout
一. public class RelativeLayout extends ViewGroup java.lang.Object ↳ android.view.View ↳ an ...
- springmvc web应用程序 java
搭建普通 springmvc 1.如图建立相关文件 建立在WEB-INF下比较安全,不能直接访问资源. 2.建立Controller控制器,如图 3.需要导入的jar包 commons-logging ...
- (转)STL中set的用法
转载自here 1.关于set map容器是键-值对的集合,好比以人名为键的地址和电话号码.相反地,set容器只是单纯的键的集合.例如,某公司可能定义了一个名为bad_checks的set容器,用于记 ...