1.Kolmogorov-Smirnov正态性检验

Kolmogorov-Smirnov是比较一个频率分布f(x)与理论分布g(x)或者两个观测值分布的检验方法,若两者间的差距很小,则推论该样本取自某特定分布族或两个观测值分布相同

使用函数:ks.test()在默认安装的stats包中

说明:ks.test有四个参数,第一个参数x为观测值向量,第二个参数y为第二观测值向量或者累计分布函数或者一个真正的累积分布函数,如pnorm(正态分布函数,一般做正态检测的时候直接输入pnorm),只对连续CDF有效。第三个参数为指明是单侧检验还是双侧检验,exact参数为NULL或者一个逻辑值,表明是否需要计算精确的P值。

结果解释:结果中会出现统计量D值和p-value,
D值越小,越接近0,表示样本数据越接近正态分布
p值,如果p-value小于显著性水平α(0.05),则拒绝H0

注意:在做单样本K-S检验或者正态检验时,有时会有错误提示“Kolmogorov - Smirnov检验里不应该有连结”,这是因为K-S检验只对连续CDF有效,而连续CDF中出现相同值的概率为0,因此R会报错。这也提醒我们,在做正态性检验之前,要先对数据进行描述性分析,对数据整体要先有个大致的认识,这也才后续才能选择正确的检验方法。

2.Shapiro-Wilk检验

Shapiro-Wilk检验在小样本情况下,是很普通的正态性检验方法。

使用函数:Shapiro.test()在默认安装的stats包中

说明: Shapiro.test()只有一个参数x,并且只要是数字向量即可,也可以有缺失值,但是非缺失值数量必须在3-5000之间,这是R的规定。

结果解释:结果中会出现统计量W值和p-value:
W值越小,越接近0,表示样本数据越接近正态分布
p值,如果p-value小于显著性水平α(0.05),则拒绝H0

3.Lilliefor检验

是Kolmogorov-Smirnov正态性检验修正,可用于正态性检验

使用函数:lillie.test()在nortest包中

说明: lillie.test()只有一个参数x,只要是数字向量即可,也可以有缺失值,但是非缺失值数量必须>4,这是R的规定

结果解释:结果中会出现统计量D值和p-value:
D值越小,越接近0,表示样本数据越接近正态分布
p值,如果p-value小于显著性水平α(0.05),则拒绝H0

注意:在R中使用lillefor检验,就相当于在SPSS探索分析中的正态性检验的Kolmogorov-Smirnov的lilliefors的修正值,二者结果是相同的。

4.Anderson-Darling正态性检验

使用在nortest包中的ad.test()

使用函数:ad.test()在nortest包中

说明:ad.test()只有一个参数x,只要是数字向量即可,也可以有缺失值,但是非缺失值数量必须>7,这是R的规定

结果解释:结果中会出现统计量A值和p-value:
A值越小,越接近0,表示样本数据越接近正态分布
p值,如果p-value小于显著性水平α(0.05),则拒绝H0

5.Jarque-Bera正态性检验

Jarque Bera是基于偏度系数和峰度系数的统计量

使用函数:jarque.bera.test()在tseries包中
                 jb.norm.test()在nromtest包中
                ajb.norm.test()在nromtest包中

说明: jarque.bera.test()只有一个参数x,可以是数字向量或时间序列,不允许有遗漏值,但是R中也没有规定x的最小值,jb.norm.test()除了x之外,多了一个蒙特卡诺模拟值,默认是2000,ajb.norm.test()是J-B检测的修正,主要解决J-B统计量收敛速度慢的缺点。

结果解释:结果中会出现统计量X-squared或JB值、自由度df和p-value
X-squared值越小,越接近0,表示样本数据越接近正态分布
p值,如果p-value小于显著性水平α(0.05),则拒绝H0

R语言与正态性检验的更多相关文章

  1. R语言做正态性检验

    摘自:吴喜之:<非参数统计>(第二版),中国统计出版社,2006年10月:P164-165 1.ks.test()    例如零假设为N(15,0.2),则ks.test(x," ...

  2. 线性函数拟合R语言示例

    线性函数拟合(y=a+bx) 1.       R运行实例 R语言运行代码如下:绿色为要提供的数据,黄色标识信息为需要保存的. x<-c(0.10,0.11, 0.12, 0.13, 0.14, ...

  3. 数据分析与R语言

    数据结构 创建向量和矩阵 函数c(), length(), mode(), rbind(), cbind() 求平均值,和,连乘,最值,方差,标准差 函数mean(), sum(), min(), m ...

  4. 【R】正态检验与R语言

    正态检验与R语言 1.Kolmogorov–Smirnov test 统计学里, Kolmogorov–Smirnov 检验(亦称:K–S 检验)是用来检验数据是否符合某种分布的一种非参数检验,通过比 ...

  5. R语言函数总结(转)

    R语言特征 对大小写敏感 通常,数字,字母,. 和 _都是允许的(在一些国家还包括重音字母).不过,一个命名必须以 . 或者字母开头,并且如果以 . 开头,第二个字符不允许是数字. 基本命令要么是表达 ...

  6. 基于R语言的时间序列分析预测

    数据来源: R语言自带 Nile 数据集(尼罗河流量) 分析工具:R-3.5.0 & Rstudio-1.1.453 #清理环境,加载包 rm(list=ls()) library(forec ...

  7. 【R笔记】R语言函数总结

    R语言与数据挖掘:公式:数据:方法 R语言特征 对大小写敏感 通常,数字,字母,. 和 _都是允许的(在一些国家还包括重音字母).不过,一个命名必须以 . 或者字母开头,并且如果以 . 开头,第二个字 ...

  8. R语言笔记完整版

    [R笔记]R语言函数总结   R语言与数据挖掘:公式:数据:方法 R语言特征 对大小写敏感 通常,数字,字母,. 和 _都是允许的(在一些国家还包括重音字母).不过,一个命名必须以 . 或者字母开头, ...

  9. 数据分析,R语言

    数据结构 创建向量和矩阵 1 函数c(), length(), mode(), rbind(), cbind() 求平均值,和,连乘,最值,方差,标准差 1 函数mean(), sum(), min( ...

随机推荐

  1. SqlSever基础 datediff 计算两个时间相差多少年份

    镇场诗:---大梦谁觉,水月中建博客.百千磨难,才知世事无常.---今持佛语,技术无量愿学.愿尽所学,铸一良心博客.------------------------------------------ ...

  2. 【leetcode❤python】226. Invert Binary Tree

    #-*- coding: UTF-8 -*- # Definition for a binary tree node.# class TreeNode(object):#     def __init ...

  3. Java面试宝典2015版

    这套面试题主要目的是帮助那些还没有java软件开发实际工作经验,而正在努力寻找java软件开发工作的朋友在笔试时更好地赢得笔试和面试.由于这套面试题涉及的范围很泛,很广,很杂,大家不可能一天两天就看完 ...

  4. 构建一个简单的Maven项目

    这里用Maven Archetype插件从空白开始创建简单的项目. 熟悉Maven 项目和Maven的核心概念. 关键词:构建生命周期(build lifecycle), Maven仓库(reposi ...

  5. 学习Berkeley DB- 入门

    1 导言 首先,我们要了解Berkeley DB的一些基本特性,在IBM的开发网站上有篇文章对其有比较清晰的介绍: 这篇文章讲到了BDB的设计思想和核心数据结构.以及数据访问算法:并有常用函数使用范例 ...

  6. STORM_0003_linux_zookeeper_storm_遇到的几个问题

    1. 首先是花费时间在windows的eclipse下面安装fatjar因为是新版的缘故,装了很久才装上. 后来发现其实mvn可以打包出没有依赖的jar包 2. 然后是按照在ubuntu环境中的mvn ...

  7. Spring管理bean的生命周期

    1: bean的创建:   如果我们默认的scope配置为Singleton的话, bean的创建实在Spring容器创建的时候创建: 如果scope的配置为Prototype的话,bena的创建是在 ...

  8. iOS - CoreMotion

    前言 NS_CLASS_AVAILABLE(NA,4_0) @interface CMMotionManager : NSObject @available(iOS 4.0, *) public cl ...

  9. [转载] Google数据中心网络技术漫谈

    原文: http://www.sdnlab.com/12700.html?from=timeline&isappinstalled=0#10006-weixin-1-52626-6b3bffd ...

  10. poj2079Triangle(N点中三点组成三角形面积最大)

    链接 根据旋转卡壳的思想,找到当前边的最远点. 确定i,j找到最远的k使 cross(i,j,k)最大,那么i,j+1时只需从k+1开始找即可 . #include <iostream> ...