SAS学习笔记27 卡方检验
卡方检验(chi-square test)是英国统计学家Pearson提出的一种主要用于分析分类变量数据的假设检验方法,该方法主要目的是推断两个或多个总体率或构成比之间有无差别。
卡方分布界值表的依据是卡方分布,其分布是连续型分布,而计数资料中的实际频数为分类资料,是不连续的。因此,计算出来的卡方值查界值表所得的概率P偏小,特别是对自由度为1的四格表资料的影响更大。 为此,美国统计学家F.Yates(1934年)提出了计算卡方的连续性校正法(correction for continuity)
在实际工作中,对于四格表资料,通常规定为:
四格表资料的Fisher确切概率法
该法是一种直接计算概率的假设检验方法,其理论依据是超几何分布(hypergeometric distribution)。四格表的确切概率法不属于卡方检验的范畴,但常作为四格表资料假设检验的补充。
多个样本率间多重比较
当多个样本率比较的推断结论拒绝H0、接受H1时,只说明各总体率之间有差别,但不能说明任两个总体率之间有差别。多个样本率间的两两比较若直接用四格表资料的卡方检验进行多重比较,将会增加犯I类错误的概率。为此,需要采用多个样本率的多重比较方法。
多个样本率间的多重比较有卡方分割法、Scheffe可信区间法和Bonferroni方法,应用这些方法能够保证假设检验中I类错误α的概率不变。
最简单的是Bonferroni方法,其基本思想是根据重复检验的次数重新规定检验水准α'。这是一种比较保守的方法,比较的组数不宜过多,实际中通常有两种情况。
一是多个实验组间的两两比较,二是实验组与同一个对照组的比较,而各实验组间不需要比较
RxC表卡方检验的注意事项
1、一般认为,RxC表中各格子的理论频数不应小于1,并且1<=T<5的格子数不宜超过格子总数的1/5。若出现这种情况,可通过以下方法解决:增加样本含量,使理论频数增大;根据专业知识,考虑删去或合并理论频数太小的行或列;改用RxC表的Fisher确切概率法
2、多个样本率比较,若统计推断结果拒绝H0,接受H1时,只说明各总体率之间总的来说有别,但并不能说明任两个总体率之间均有差别。要进一步推断,需做多个样本率的多重比较。
3、RxC表的卡方检验与分类结果的排序无关。对于有序RxC表,如果分析的目的不是对构成比进行比较,例如比较两组的疗效,试验结果为“痊愈、显效、有效、无效”,则不宜使用卡方检验,对此可以选用非参数秩和检验方法
SAS学习笔记27 卡方检验的更多相关文章
- SAS学习笔记之《SAS编程与数据挖掘商业案例》(5)SAS宏语言、SQL过程
SAS学习笔记之<SAS编程与数据挖掘商业案例>(5)SAS宏语言.SQL过程 1. 一个SAS程序可能包含一个或几个语言成分: DATA步或PROC步 全程语句 SAS组件语言(SCL) ...
- SAS学习笔记之《SAS编程与数据挖掘商业案例》(4)DATA步循环与控制、常用全程语句、输出控制
SAS学习笔记之<SAS编程与数据挖掘商业案例>(4)DATA步循环与控制.常用全程语句.输出控制 1. 各种循环与控制 DO组 创建一个执行语句块 DO循环 根据下标变量重复执行DO和E ...
- SAS学习笔记之《SAS编程与数据挖掘商业案例》(3)变量操作、观测值操作、SAS数据集管理
SAS学习笔记之<SAS编程与数据挖掘商业案例>(3)变量操作.观测值操作.SAS数据集管理 1. SAS变量操作的常用语句 ASSIGNMENT 创建或修改变量 SUM 累加变量或表达式 ...
- SAS学习笔记之《SAS编程与数据挖掘商业案例》(2)数据获取与数据集操作
SAS学习笔记之<SAS编程与数据挖掘商业案例>(2)数据获取与数据集操作 1. SET/SET效率高,建立的主表和建表索引的查询表一般不排序, 2. BY语句,DATA步中,BY语句规定 ...
- SAS学习笔记之《SAS编程与数据挖掘商业案例》(1)系统简介和编程基础
SAS学习笔记之<SAS编程与数据挖掘商业案例>(1)系统简介和编程基础 1. SAS系统简介 1.1 SAS是先编译后执行的语言,data步标志着编译的开始. 数据指针:当前内存缓存区, ...
- [原创]java WEB学习笔记27:深入理解面向接口编程
本博客为原创:综合 尚硅谷(http://www.atguigu.com)的系统教程(深表感谢)和 网络上的现有资源(博客,文档,图书等),资源的出处我会标明 本博客的目的:①总结自己的学习过程,相当 ...
- SAS学习笔记22 t检验、卡方检验
- SAS学习笔记<一>
三个周末的SAS课程宣告结束, 总结下来 第一周的统计原理简介 第二周/第三周讲解SAS的基本操作. 总体下来,对自己的知识结构有了一个新的梳理,对比大学时期,某个老师一上来就教我们SAS编程,而未考 ...
- SAS学习笔记
一. 在SAS中进行随机抽样: 1. 在实际数据处理中常常需要进行样本抽样,在实践中主要有两种情况: (1)简单无重复抽样(2)分层抽样 a.等比例分层抽样 b. 不等比例 ...
随机推荐
- rpm包和deb分别是什么?
一.RMP 是 LINUX 下的一种软件的可执行程序,你只要安装它就可以了.这种软件安装包通常是一个RPM包(Redhat Linux Packet Manager,就是Redhat的包管理器),后缀 ...
- Windows安装Centos7双系统后Windows启动项消失
原文: https://www.cnblogs.com/xinglichao/p/9999049.html https://blog.csdn.net/yingzinanfei/article/det ...
- 【源码】openresty 限流
小结: 1.在连接环节计数,有清零环节 有3个参量 maxburst unit_delay https://github.com/openresty/lua-resty-limit-traffic/b ...
- ubuntu server 18.04 有线网卡默认关闭,需要手工配置才能使用的方法
1.安装完ubuntu server 18.04 后,笔记本电脑的有线网卡已经识别了,但是没有ip, 并且插上网线后端口灯不亮. 解决方法: 第一步.配置端口链路状态为 up # ip link se ...
- Java 8 Lambda表达式学习和理解
Java 8 Lambda表达式和理解 说明:部分资料来源于网络 时间:20190704 Lambda 表达式,也可称为闭包,它是推动 Java 8 发布的最重要新特性.Lambda 允许把函数作为一 ...
- plupload上传大文件
大容量文件上传早已不是什么新鲜问题,在.net 2.0时代,HTML5也还没有问世,要实现这样的功能,要么是改web.config,要么是用flash,要么是用一些第三方控件,然而这些解决问题的方法要 ...
- 配置Apache运行在event事件驱动模式下
(1)启用MPM Include conf/extra/httpd-mpm.conf (2)配置evnet MPM参数 <IfModule event.c> #default 3 Ser ...
- Mysql coalesce()函数认识和用法
Mysql coalesce()函数认识和用法 coalesce()解释:返回参数中的第一个非空表达式(从左向右): 鉴于在mysql中没有nvl()函数, 我们用coalesce()来代替 ...
- MySQL复制表结构
示例SQL: create table testdb.test_table_back like testdb.test_table
- application.properties在Spring Boot项目中的位置
application.properties可以放在如下位置: 当前目录的 "/config"的子目录下 当前目录下 classpath根目录的"/config" ...