1、基本统计

summary函数:R中的summary函数根据输入的类提供输入的摘要。该函数根据输入对象的类调用各种函数。返回值也取决于输入对象。例如,如果输入是一个由数字数据组成的向量,它将为数据提供平均值、中值、最小值、最大值和四分位数,而如果输入是表格(数字)数据,它将为每一列提供类似的计算。

cov:用来计算相关性,通过为函数中的方法参数指定apt值,我们可以计算不同类型的相关系数,即Pearson、Spearman、Kendall等。

data(iris)
summary(iris)
mean(iris[,1])
sd(iris[,1])
cor(iris[,1],iris[,2]) #两个向量之间的相关性
cor(iris[,1],iris[,3])
Cov.mat <- cov(iris[,1:4])
View(Cov.mat)

2、缺失值处理

对于大多数这些函数,我们有可能使用na.rm参数。这使用户能够处理丢失的数据。如果我们的数据中缺少值(在R中称为NA),我们可以设置na.rm参数为真,计算只基于非na值。

a <- c(1:4, NA, 6)
mean(a) # returns NA,R不知道如何处理缺失值NA
mean(a, na.rm=TRUE) #3.2

3、 generate probability distributions

n.data <- rnorm(100, 1, 0.1)
hist(n.data)
plot(density(n.data))

4、统计检验

进行统计检验是为了评估研究或应用结果的重要性,并协助作出定量决定。这个想法是为了确定是否有足够的证据来拒绝对结果的推测。R中的内置函数允许对数据进行多次这样的测试。测试的选择取决于数据和被问到的问题。举例说明,当我们需要将一个组与一个假设值进行比较,并且我们的测量值遵循高斯分布时,我们可以使用一个样本t检验。然而,如果我们有两个组(两个测量值都遵循高斯分布)进行比较,我们可以使用双尾t检验。R有内置的函数来进行这样的测试。

4.1、t-test

t检验(在我们的例子中,它是两个样本t检验)计算的是统计的均值结果偏离实际均值的程度。这里,我们使用R中已经存在的睡眠数据。这些睡眠数据显示了两种药物在增加睡眠时间方面的效果,与10名对照组患者的睡眠数据相比。结果是一个包含9个元素的列表,如p值、置信区间、方法和平均值估计

data(sleep)
test <- t.test(sleep[,1]~sleep[,2])

4.2、卡方检验

cont <- matrix(c(14, 33, 7, 3), ncol = 2)
colnames(cont) <- c("Sedan", "Convertible")
rownames(cont) <- c("Male", "Female")
test <- chisq.test(as.table(cont))

4.3、Wilcoxon signed-rank test

x <- c(1.83, 0.50, 1.62, 2.48, 1.68, 1.88, 1.55, 3.06, 1.30)
y <- c(0.878, 0.647, 0.598, 2.05, 1.06, 1.29, 1.06, 3.14, 1.29)
test <- wilcox.test(x, y, paired = TRUE, alternative = "greater")
str(test)
test$p.value

用R进行统计学分析的更多相关文章

  1. 用R进行文本分析初探——以《红楼梦》为例

    一.写在前面的话~ 刚吃饭的时候同学问我,你为什么要用R做文本分析,你不是应该用R建模么,在我和她解释了一会儿后,她嘱咐我好好写这篇博文,嗯为了娟儿同学,细细说一会儿文本分析. 文本数据挖掘(Text ...

  2. 使用R进行相关性分析

    基于R进行相关性分析 一.相关性矩阵计算: [1] 加载数据: >data = read.csv("231-6057_2016-04-05-ZX_WD_2.csv",head ...

  3. R语言︱情感分析—词典型代码实践(最基础)(一)

    每每以为攀得众山小,可.每每又切实来到起点,大牛们,缓缓脚步来俺笔记葩分享一下吧,please~ --------------------------- 笔者寄语:词典型情感分析对词典要求极高,词典中 ...

  4. R语言︱情感分析—基于监督算法R语言实现(二)

    每每以为攀得众山小,可.每每又切实来到起点,大牛们,缓缓脚步来俺笔记葩分享一下吧,please~ --------------------------- 笔者寄语:本文大多内容来自未出版的<数据 ...

  5. 基于R进行相关性分析--转载

    https://www.cnblogs.com/fanling999/p/5857122.html 一.相关性矩阵计算: [1] 加载数据: >data = read.csv("231 ...

  6. 用R进行微博分析的初步尝试

    新浪微博如火如荼,基于微博的各种应用也层出不穷. 有一种共识似乎是:微博数据蕴含着丰富的信息,加以适当的挖掘.可以实现众多商业应用.恰好社会网络分析也是我之前有所了解并持续学习的一个领域,因此我做了微 ...

  7. SAS软件的使用和统计学分析的初步介绍

           一般而言我们都会使用Excel来统计测试结果,除了Excel之外,还有SAS等软件,也是可以统计测试结果的,本人也是SAS的初学者,现在我就给大家介绍一下SAS的简单使用,随着我不断的学 ...

  8. 用R理解统计学

    1.随机变量( random variable)概念的引入 该数据来自杰克逊实验室.2组数据,每组12只老鼠,一组普通食物,另一组高脂肪(hf)饮食.几周后,科学家们称了每只老鼠的体重,得到了这个数据 ...

  9. Java出现错误“Invalid escape sequence (valid ones are \b \t \n \f \r \" \' \\ )”的问题分析

    若出现:Invalid escape sequence (valid ones are  \b  \t  \n  \f  \r  \"  \'  \\ )这样的问题,一般是转义字符的问题,下 ...

随机推荐

  1. asp.net如何使用cookie(创建、保存、读取)

    Cookie的用法也和ASP中差不多.比如我们建立一个名为aspcn,值为大众的cookie HttpCookie cookie = new HttpCookie("aspcn") ...

  2. 实验 1 Java 运行环境的安装、配置与运行

    一.实验目的     1. 掌握下载 Java SDK 软件包.     2. 掌握设置 Java 程序运行环境的方法.     3. 掌握编写与运行 Java 程序的方法.     4. 了解 Ja ...

  3. WPF Demo8

    namespace Demo10 { public class Student { private string name; public string Name { get { return nam ...

  4. 关于 android 读取当前手机号码

    手机号码不是所有的都能获取.只是有一部分可以拿到.这个是由于移动运营商没有把手机号码的数据写入到sim卡中.SIM卡只有唯一的编号,供网络与设备识别那就是IMSI号码,手机的信号也可以说是通过这个号码 ...

  5. 通过shell进行数学计算

    对于基本运算,可以使用let, $(())和$[] 对于高级运算,使用expr和bc这两个工具 [hupeng@hupeng-vm shell]$n1= [hupeng@hupeng-vm shell ...

  6. SpringMVC中session的使用

    SpringMVC中仍然可以使用传统方式使用session /** * 使用session - 传统方式 */ @RequestMapping("/hello13.action") ...

  7. python unittest单元测试框架-3用例执行顺序、多级目录、装饰器、fixtures

    1.用例执行顺序 unittest默认会按照ascii码的顺序,依次执行.类名--方法名排序,使用discover也是默认排序.如果不想使用默认排序,就使用testsuite测试集的方式. impor ...

  8. 使用xmlHttprequest有感

    原文地址:http://my.oschina.net/LinBandit/blog/33160 之前一片日志说使用xmlhttprequest获取服务数据时,在IE下能通过而在chrome不能通过的问 ...

  9. Linux rpc 编程最简单实例

    通过rpcgen的man手册看到此工具的作用是把RPC源程序编译成C语言源程序,从而轻松实现远程过程调用.1.下面的例子程序的作用是客户端程序(fedora Linux下)取中心服务器也是Linux上 ...

  10. 推荐一个lamp的一键安装包

    本来我是一直用的nginx的,现在安全者的服务器是用的tengine,稳定性就不用多说了! 前段时间用thinkphp写了两个两个项目,刚开始放到了国外的服务器上,环境也是lnmp的,最后发现ngin ...