1. 创建新的变量 mydata<-data.frame(x1=c(2,2,6,4),x2=c(3,4,2,8)) #方法一 mydata$sumx<-mydata$x1+mydata$x2 mydata$meanx<-(mydata$x1+mydata$x2)/2 #方法二 attach(mydata) mydata$sumx <- x1+x2 mydata$meanx <- (x1+x2)/2 detach(mydata) #第三种方式 mydata<-transf…
主成分分析和探索性因子分析是用来探索和简化多变量复杂关系的常用方法,能解决信息过度复杂的多变量数据问题. 主成分分析PCA:一种数据降维技巧,将大量相关变量转化为一组很少的不相关变量,这些无关变量称为主成分 探索性因子分析EFA:用来发现一组变量的潜在结构的方法,通过寻找一组更小的,潜在的隐藏的结构来揭示已观测到的,显式的变量间的关系. R基础安装包中提供了PCA和EFA函数分别为princoomp()和factanal(), psych包中也提供了相关函数,它提供了比基础函数更加丰富和有用的选…
典型数据分析的步骤: R语言:为统计计算和绘图而生的语言和环境 数据分析:统计学,机器学习 R的使用 1. 区分大小写的解释型语言 2. R语句赋值:<- 3. R注释: # 4. 创建向量 c() 5. 观察演示 列表demo(),图形演示demo(graphics) 6. 帮助函数 7. getwd()查看当前工作目录, setwd()设定当前工作目录 setwd('E:\\') getwd() [1] "E:/" 8. 工作空间管理函数 9. 输入输出 1). 输入 sou…
1.  条形图 barplot() #载入vcd包 library(vcd) #table函数提取各个维度计数 counts <- table(Arthritis$Improved) counts #绘制简单Improved条形图 #1行2列 par(mfrow=c(1,2)) barplot(counts, main = "simple Bar plot", xlab = "Improved",ylab = "Frequency") #绘…
R中的数据结构:标量,向量,数组,数据框,列表 1. 向量:储存数值型,字符型,或者逻辑型数据的一维数组,用c()创建 **  R中没有标量,标量以单元素向量的形式出现 2. 矩阵:二维数组,和向量一样只能是相同模式, 可用matrix() 创建 #byrow指定是否按行填充,默认是按列填充,dimnames包含可选的字符向量型列名和行名 mymatrix <- matrix(vector, nrow = number_of_rows, ncol = number_of_columns, byr…
创建图形,保存图形,修改特征:标题,坐标轴,标签,颜色,线条,符号,文本标注. 1. 一个简单的例子 #输出到图形到pdf文件 pdf("mygrapg.pdf") attach(mtcars) #散点图 plot(wt~mpg) #添加趋势线 abline(lm(mpg~wt)) #添加标题 title("Regresion of mpg on weight") #输出到终端 dev.off() 2. 修改图形参数 par() 函数指定选项 符号和线条:pch:…
广义线性模型扩展了线性模型的框架,它包含了非正态的因变量分析 广义线性模型拟合形式: $$g(\mu_\lambda) = \beta_0 + \sum_{j=1}^m\beta_jX_j$$ $g(\mu_\lambda)为连接函数$. 假设响应变量服从指数分布族中某个分布(不仅仅是正态分布),极大扩展了标准线性模型,模型参数估计的推导依据是极大似然估计,而非最小二乘法. 可以放松Y为正态分布的假设,改为Y服从指数分布族中的一种分布即可 glm()函数:glm(formula,family=f…
1. 数值函数 1) 数学函数 2) 统计函数 3. 数据标准化 scale() 函数对矩阵或者数据框的指定列进行均值为0,标准化为1的标准化 mydata <- data.frame(c1=c(1,2,3),c2=c(4,5,6),c3=c(7,8,9)) #对所有列进行标准化 mydata <- scale(mydata) #对指定列进行标准化 mydata <- data.frame(c1=c(1,2,3),c2=c(4,5,6),c3=c(7,8,9)) mydata <-…
本文对应<R语言实战>第8章:回归 回归是一个广义的概念,通指那些用一个或多个预测变量(也称自变量或解释变量)来预测响应变量(也称因变量.效标变量或结果变量)的方法.通常,回归分析可以用来挑选与相应变量相关的解释变量,可以描述两者的关系,也可以生成一个等式,通过解释变量来预测响应变量. 回归分析的各种变体 回归类型 用途 简单线性 用一个量化的解释变量预测一个量化的响应变量 多项式 用一个量化的解释变量预测一个量化的响应变量,模型的关系是n阶多项式 多元线性 用两个或多个量化的解释变量预测一个…
一.基础操作 1.根据数据信息,创建数据框 > manager <- c(1,2,3,4,5) > date <- c("10/24/08","10/28/08","10/1/08","10/12/08","5/1/09") > country <- c("US","US","UK","UK"…