假设检验的标准步骤:

1、建立假设:根据问题的需要提出原假设H0,以及其对立面备择假设H1

2、确立检验水准:即设立小概率事件的界值α。

3、进行试验:得到用于统计分析的样本,以该试验的结果作为假设检验的根据。

4、选定检验方法,计算检验统计量。

5、确定P值。

原假设也称为零假设,备择假设也称为对立假设。对立假设就是对立于原假设,备择假设的意思是,一旦你决定不采纳原假设,则这假设可备你选择。

根据统计学观点,接受原假设和否定原假设,二者的意义并非对等。接受原假设只是意味着,按所获数据来看,并无足够的根据认为原假设不对,而不是说,从所获数据证明了原假设是对的,因此,问题多少仍处于未决的局面。反之,否定原假设则意味着,按所获数据有充足理由(而非绝对地证明,因为数据有随机性)认为原假设不对,即有充足理由认为对立假设成立。故在一定限度内,可以说问题由了一个明确的结论。

假设检验的基本思想是统计学的“小概率反证法”原理:对于一个小概率事件而言,其对立面发生的可能性显然要大大高于这一小概率事件,可以认为小概率事件在一次试验中不应当发生。

假设检验除了分为单/双侧检验外,还可以分为参数检验和非参数检验。参数检验是已知数据的分布形式,只是不了解相应参数时的检验形式。如果数据的分布形式不了解,就必须使用非参数检验确定数据的分布形式。下面将介绍几种常用分布的假设检验。

一、正态分布的检验

正太分布的考察方法有:通过计算偏度系数和峰度系数加以考察;通过绘制直方图、PP图等图形工具来考察;也可以进行各种假设检验。最常用的就是K-S单样本检验。

K-S检验通过对两个分布之间的差异的分析,判断样本的观察结果是否来自制定分布的总体。计算P值的公式比较复杂,可不必深究。

分析者可以直接使用K-S检验对样本数据进行正态分布的检验,但值得推荐的第一步是对样本数据进行图形描述,图形可以给分析者一个直观的印象:该数据可能服从什么样的分布类型。

文彤老师的书中对消费者信心指数进行了K-S检验,大致步骤是“分析”——“非参数检验”——“单样本”……,当然首先要选择个案:数据——选择个案——如果条件满足time=200704。然后再进行K-S检验,我的SPSS可能由于版本问题,运行时出现“停止执行该命令”。但是使用旧对话框是可以的,分析——非参数检验——旧对话框——1样本K-S。

文彤老师对检验结果的批注很值得一读:既然此处拒绝了正态分布假设,那么分析时还可以使用如t检验等对变量分布有要求的方法吗?事实上,K-S检验从实用性角度来说远不如图形工具,因为在样本量少的时候它不够敏感,而样本量大时又总是过于敏感。本例就属于敏感过头的情况,实际上读者们只需要绘制P-P图就可以发现,该数据实际上是基本符合正态分布趋势的,进行后续数据分析时遵循正态分布的分析思路应当不会有任何问题。

二、二项分布检验

二项分布检验是对二分类变量的拟合优度检验,用于考察每个类别中观察值的频数与特定分布下的预期频数间是否存在统计学差异。例子详见参考资料1。

三、游程检验

游程检验是对二分变量的随机检验,判断观察值的顺序是否为随机的。

文彤老师提醒: 在对连续性变量进行游程检验时,采用不同的分割点,就可能得到截然不同的分析结果,因此在实际分析中,应当尽可能多取几个在专业背景上有实际意义的数值作为分割点,比较其游程检验的结果,以得到对序列随机性更为稳健和客观的结论。

参考资料:

1. 张文彤. 《SPSS统计分析基础教程》

2. 陈希孺. 《统计学漫话》

SPSS 分布类型的检验的更多相关文章

  1. t分布与t检验的一点理解

    最近又遇到了t分布及t检验方面的内容,发现有些地方自己当初没有很明白,就又查了些资料,加深了一下自己的理解,这里也将自己的一些理解记录下来. 1. 理论基础--大数定理与中心极限定理        在 ...

  2. SPSS数据分析——t检验

    SPSS中t检验全都集中在分析—比较均值菜单中.关于t检验再简单说一下,我们知道一个统计结果需要表达三部分内容,即集中性.变异性.显著性. 集中性的表现指标是均值变异的的表现指标是方差.标准差或标准误 ...

  3. 柯尔莫可洛夫-斯米洛夫检验(Kolmogorov–Smirnov test,K-S test)

    柯尔莫哥洛夫-斯米尔诺夫检验(Колмогоров-Смирнов检验)基于累计分布函数,用以检验两个经验分布是否不同或一个经验分布与另一个理想分布是否不同. 在进行cumulative probab ...

  4. SPSS-非参数检验—两独立样本检验 案例解析

    今天跟大家研究和分享一下:spss非参数检验——两独立样本检验, 我还是引用教程里面的案例,以:一种产品有两种不同的工艺生产方法,那他们的使用寿命分别是否相同 下面进行假设:1:一种产品两种不同的工艺 ...

  5. Tests for normality正态分布检验

    欢迎关注博主主页,学习python视频资源,还有大量免费python经典文章 sklearn实战-乳腺癌细胞数据挖掘(博主亲自录制视频教程) https://study.163.com/course/ ...

  6. 常见的概率分布类型(Probability Distribution)

    统计学中最常见的几种概率分布分别是正态分布(normal distribution),t分布(t distribution),F分布(F distribution)和卡方分布(χ2 distribut ...

  7. SPSS-比较均值-独立样本T检验 案例解析

    在使用SPSS进行单样本T检验时,很多人都会问,如果数据不符合正太分布,那还能够进行T检验吗?而大样本,我们一般会认为它是符合正太分布的,在鈡型图看来,正太分布,基本左右是对称的,一般具备两个参数,数 ...

  8. 《spss统计分析与行业应用案例详解》:实例十二 卡方检验

    卡方检验的功能与意义 SPSS的卡方检验是非参数检验方法的一种,其基本功能足通过样本的 频数分布来推断总体是否服从某种理论分布或某种假设分布,这种检验过程是通过分析实际的频数与理论的频数之间的差别或是 ...

  9. Python验证数据的抽样分布类型

    假如要对一份统计数据进行分析,一般其来源来自于社会调研/普查,所以数据不是总体而是一定程度的抽样.对于抽样数据的分析,就可以结合上篇统计量及其抽样分布的内容,判断数据符合哪种分布.使用已知分布特性,可 ...

随机推荐

  1. Unmet dependencies. Try 'apt-get -f install' with no packages

    在ubuntu14.04上用sudo apt-get install percona-xtrabackup安装xtrabackup时提示 zhj@my-SERVER:~$ sudo apt-get i ...

  2. javascript 之 valueOf

    var m = { i:10, toString:function () { console.log('toString'); return this.i; }, valueOf:function ( ...

  3. 以EJB谈J2EE规范

    版权声明:本文为博主原创文章,未经博主同意不得转载. https://blog.csdn.net/xiaoduishenghuogo/article/details/24800703 接触J2EE的时 ...

  4. 『HTML5实现人工智能』小游戏《井字棋》发布,据说IQ上200才能赢【算法&代码讲解+资源打包下载】

    一,什么是TicTacToe(井字棋) 本游戏为在下用lufylegend开发的第二款小游戏.此游戏是大家想必大家小时候都玩过,因为玩它很简单,只需要一张草稿纸和一只笔就能开始游戏,所以广受儿童欢迎. ...

  5. 升级wampserver3.0的PHP版本到7.1

    windows系统下,目前wampserver的最高版本为3.0.6,其中的PHP最高版本为7.0.10,博主想要安装laravel5.6最新版本,却看到需要PHP版本>=7.1.3,无奈之下, ...

  6. kettle配置命名参数

    bat 调度文件如下 cd D:/Program Files/kettle700/data-integrationKitchen.bat /rep repository /dir /TEST /job ...

  7. IISExpress 站点信息

    目录:C:\Users\huxl16\Documents\IISExpress\config applicationhost:applicationhost.config

  8. 一步一步学EF系列四【升级篇 实体与数据库的映射】

    之前的三张为基础篇,如果不考虑架构问题,做一般的小程序,以足够用了.基本的增删改查也都有了.但是作为学习显然是不够的.通过之前三章的学习,有没有发现这样写有什么问题,有没有觉得繁琐的?可能有人会说,之 ...

  9. XDU 1032

    #include<cstdio> typedef long long ll; ; ll feima(ll a,ll b) { ll c=; while(b) { ) c=c*a%mod; ...

  10. Winter-2-STL-D The Blocks Problem 解题报告及测试数据

    Time Limit:3000MS     Memory Limit:0KB Description Background Many areas of Computer Science use sim ...