卡方检验(chi-square test)是英国统计学家Pearson提出的一种主要用于分析分类变量数据的假设检验方法,该方法主要目的是推断两个或多个总体率或构成比之间有无差别。

卡方分布界值表的依据是卡方分布,其分布是连续型分布,而计数资料中的实际频数为分类资料,是不连续的。因此,计算出来的卡方值查界值表所得的概率P偏小,特别是对自由度为1的四格表资料的影响更大。 为此,美国统计学家F.Yates(1934年)提出了计算卡方的连续性校正法(correction for continuity)

在实际工作中,对于四格表资料,通常规定为:

四格表资料的Fisher确切概率法

该法是一种直接计算概率的假设检验方法,其理论依据是超几何分布(hypergeometric distribution)。四格表的确切概率法不属于卡方检验的范畴,但常作为四格表资料假设检验的补充。

多个样本率间多重比较

当多个样本率比较的推断结论拒绝H0、接受H1时,只说明各总体率之间有差别,但不能说明任两个总体率之间有差别。多个样本率间的两两比较若直接用四格表资料的卡方检验进行多重比较,将会增加犯I类错误的概率。为此,需要采用多个样本率的多重比较方法。

多个样本率间的多重比较有卡方分割法、Scheffe可信区间法和Bonferroni方法,应用这些方法能够保证假设检验中I类错误α的概率不变。

最简单的是Bonferroni方法,其基本思想是根据重复检验的次数重新规定检验水准α'。这是一种比较保守的方法,比较的组数不宜过多,实际中通常有两种情况。

一是多个实验组间的两两比较,二是实验组与同一个对照组的比较,而各实验组间不需要比较

RxC表卡方检验的注意事项

1、一般认为,RxC表中各格子的理论频数不应小于1,并且1<=T<5的格子数不宜超过格子总数的1/5。若出现这种情况,可通过以下方法解决:增加样本含量,使理论频数增大;根据专业知识,考虑删去或合并理论频数太小的行或列;改用RxC表的Fisher确切概率法

2、多个样本率比较,若统计推断结果拒绝H0,接受H1时,只说明各总体率之间总的来说有别,但并不能说明任两个总体率之间均有差别。要进一步推断,需做多个样本率的多重比较。

3、RxC表的卡方检验与分类结果的排序无关。对于有序RxC表,如果分析的目的不是对构成比进行比较,例如比较两组的疗效,试验结果为“痊愈、显效、有效、无效”,则不宜使用卡方检验,对此可以选用非参数秩和检验方法

SAS学习笔记27 卡方检验的更多相关文章

  1. SAS学习笔记之《SAS编程与数据挖掘商业案例》(5)SAS宏语言、SQL过程

    SAS学习笔记之<SAS编程与数据挖掘商业案例>(5)SAS宏语言.SQL过程 1. 一个SAS程序可能包含一个或几个语言成分: DATA步或PROC步 全程语句 SAS组件语言(SCL) ...

  2. SAS学习笔记之《SAS编程与数据挖掘商业案例》(4)DATA步循环与控制、常用全程语句、输出控制

    SAS学习笔记之<SAS编程与数据挖掘商业案例>(4)DATA步循环与控制.常用全程语句.输出控制 1. 各种循环与控制 DO组 创建一个执行语句块 DO循环 根据下标变量重复执行DO和E ...

  3. SAS学习笔记之《SAS编程与数据挖掘商业案例》(3)变量操作、观测值操作、SAS数据集管理

    SAS学习笔记之<SAS编程与数据挖掘商业案例>(3)变量操作.观测值操作.SAS数据集管理 1. SAS变量操作的常用语句 ASSIGNMENT 创建或修改变量 SUM 累加变量或表达式 ...

  4. SAS学习笔记之《SAS编程与数据挖掘商业案例》(2)数据获取与数据集操作

    SAS学习笔记之<SAS编程与数据挖掘商业案例>(2)数据获取与数据集操作 1. SET/SET效率高,建立的主表和建表索引的查询表一般不排序, 2. BY语句,DATA步中,BY语句规定 ...

  5. SAS学习笔记之《SAS编程与数据挖掘商业案例》(1)系统简介和编程基础

    SAS学习笔记之<SAS编程与数据挖掘商业案例>(1)系统简介和编程基础 1. SAS系统简介 1.1 SAS是先编译后执行的语言,data步标志着编译的开始. 数据指针:当前内存缓存区, ...

  6. [原创]java WEB学习笔记27:深入理解面向接口编程

    本博客为原创:综合 尚硅谷(http://www.atguigu.com)的系统教程(深表感谢)和 网络上的现有资源(博客,文档,图书等),资源的出处我会标明 本博客的目的:①总结自己的学习过程,相当 ...

  7. SAS学习笔记22 t检验、卡方检验

  8. SAS学习笔记<一>

    三个周末的SAS课程宣告结束, 总结下来 第一周的统计原理简介 第二周/第三周讲解SAS的基本操作. 总体下来,对自己的知识结构有了一个新的梳理,对比大学时期,某个老师一上来就教我们SAS编程,而未考 ...

  9. SAS学习笔记

    一.            在SAS中进行随机抽样: 1. 在实际数据处理中常常需要进行样本抽样,在实践中主要有两种情况: (1)简单无重复抽样(2)分层抽样   a.等比例分层抽样  b. 不等比例 ...

随机推荐

  1. SpringCloud介绍及入门(二)

    接口的实现 在user_service_interface中添加一个User的类. 增加私有属性 id,name , 并利用快捷键Alt+Insert 实现get,set的快速生成. 实体类User ...

  2. IDEA 同时打开多个项目

    打开IDEA Settings-->System Settings-->Open project in new wodow

  3. legend3---17、如何抽象和复用控制器中的方法

    legend3---17.如何抽象和复用控制器中的方法 一.总结 一句话总结: 比如不同的控制器中都用了检查手机号是否已经注册,是否没注册这样的功能,我应该如何抽象和复用方法 新建一个处理手机号码的模 ...

  4. Linux工程管理器——make

    一.定义 工程管理器,顾名思义,是指管理较多的文件 Make工程管理器也就是个“自动编译管理器”,这里的“自动”是指它能构根据文件时间戳自动发现更新过的文件而减少编译的工作量,同时,它通过读入Make ...

  5. Feed流系统设计-总纲

    https://mp.weixin.qq.com/s/ccxM2thPbzg5vDWgGVJ5vQ 作者:少强 简介 差不多十年前,随着功能机的淘汰和智能机的普及,互联网开始进入移动互联网时代,最具代 ...

  6. c3p0数据库连接池 原创: Java之行 Java之行 5月8日 一、连接池概述 实际开发中“获得连接”或“释放资源”是非常消耗系统资源的两个过程

    c3p0数据库连接池 原创: Java之行 Java之行 5月8日 一.连接池概述 实际开发中“获得连接”或“释放资源”是非常消耗系统资源的两个过程 DB连接池HikariCP为什么如此快 原创: D ...

  7. 阶段5 3.微服务项目【学成在线】_day17 用户认证 Zuul_05-用户认证-认证服务查询数据库-调用查询用户接口

    用户认证服务调用根据账号查询用户的信息 怎么远程调用呢?要创建一个客户端,这个客户端其实就是一个接口 标明服务的名称是ucenter服务 这是ucenter服务里面 复制过来接口的定义,GetMapp ...

  8. PAT 甲级 1037 Magic Coupon (25 分) (较简单,贪心)

    1037 Magic Coupon (25 分)   The magic shop in Mars is offering some magic coupons. Each coupon has an ...

  9. topK问题

    概述 在N个乱序数字中查找第K大的数字,时间复杂度可以减小至O(N). 可能存在的限制条件: 要求时间和空间消耗最小.海量数据.待排序的数据可能是浮点型等. 方法 方法一 对所有元素进行排序,之后取出 ...

  10. DTCMS,添加文章时,内容中第一张图片作缩略图,并且等比例缩放图片

    DTCMS,添加文章时,内容中第一张图片作缩略图 admin/article/article_edit.aspx.cs 导入: using System.Drawing;using System.Dr ...