SAS学习笔记27 卡方检验
卡方检验(chi-square test)是英国统计学家Pearson提出的一种主要用于分析分类变量数据的假设检验方法,该方法主要目的是推断两个或多个总体率或构成比之间有无差别。
卡方分布界值表的依据是卡方分布,其分布是连续型分布,而计数资料中的实际频数为分类资料,是不连续的。因此,计算出来的卡方值查界值表所得的概率P偏小,特别是对自由度为1的四格表资料的影响更大。 为此,美国统计学家F.Yates(1934年)提出了计算卡方的连续性校正法(correction for continuity)
在实际工作中,对于四格表资料,通常规定为:
四格表资料的Fisher确切概率法
该法是一种直接计算概率的假设检验方法,其理论依据是超几何分布(hypergeometric distribution)。四格表的确切概率法不属于卡方检验的范畴,但常作为四格表资料假设检验的补充。
多个样本率间多重比较
当多个样本率比较的推断结论拒绝H0、接受H1时,只说明各总体率之间有差别,但不能说明任两个总体率之间有差别。多个样本率间的两两比较若直接用四格表资料的卡方检验进行多重比较,将会增加犯I类错误的概率。为此,需要采用多个样本率的多重比较方法。
多个样本率间的多重比较有卡方分割法、Scheffe可信区间法和Bonferroni方法,应用这些方法能够保证假设检验中I类错误α的概率不变。
最简单的是Bonferroni方法,其基本思想是根据重复检验的次数重新规定检验水准α'。这是一种比较保守的方法,比较的组数不宜过多,实际中通常有两种情况。
一是多个实验组间的两两比较,二是实验组与同一个对照组的比较,而各实验组间不需要比较
RxC表卡方检验的注意事项
1、一般认为,RxC表中各格子的理论频数不应小于1,并且1<=T<5的格子数不宜超过格子总数的1/5。若出现这种情况,可通过以下方法解决:增加样本含量,使理论频数增大;根据专业知识,考虑删去或合并理论频数太小的行或列;改用RxC表的Fisher确切概率法
2、多个样本率比较,若统计推断结果拒绝H0,接受H1时,只说明各总体率之间总的来说有别,但并不能说明任两个总体率之间均有差别。要进一步推断,需做多个样本率的多重比较。
3、RxC表的卡方检验与分类结果的排序无关。对于有序RxC表,如果分析的目的不是对构成比进行比较,例如比较两组的疗效,试验结果为“痊愈、显效、有效、无效”,则不宜使用卡方检验,对此可以选用非参数秩和检验方法
SAS学习笔记27 卡方检验的更多相关文章
- SAS学习笔记之《SAS编程与数据挖掘商业案例》(5)SAS宏语言、SQL过程
SAS学习笔记之<SAS编程与数据挖掘商业案例>(5)SAS宏语言.SQL过程 1. 一个SAS程序可能包含一个或几个语言成分: DATA步或PROC步 全程语句 SAS组件语言(SCL) ...
- SAS学习笔记之《SAS编程与数据挖掘商业案例》(4)DATA步循环与控制、常用全程语句、输出控制
SAS学习笔记之<SAS编程与数据挖掘商业案例>(4)DATA步循环与控制.常用全程语句.输出控制 1. 各种循环与控制 DO组 创建一个执行语句块 DO循环 根据下标变量重复执行DO和E ...
- SAS学习笔记之《SAS编程与数据挖掘商业案例》(3)变量操作、观测值操作、SAS数据集管理
SAS学习笔记之<SAS编程与数据挖掘商业案例>(3)变量操作.观测值操作.SAS数据集管理 1. SAS变量操作的常用语句 ASSIGNMENT 创建或修改变量 SUM 累加变量或表达式 ...
- SAS学习笔记之《SAS编程与数据挖掘商业案例》(2)数据获取与数据集操作
SAS学习笔记之<SAS编程与数据挖掘商业案例>(2)数据获取与数据集操作 1. SET/SET效率高,建立的主表和建表索引的查询表一般不排序, 2. BY语句,DATA步中,BY语句规定 ...
- SAS学习笔记之《SAS编程与数据挖掘商业案例》(1)系统简介和编程基础
SAS学习笔记之<SAS编程与数据挖掘商业案例>(1)系统简介和编程基础 1. SAS系统简介 1.1 SAS是先编译后执行的语言,data步标志着编译的开始. 数据指针:当前内存缓存区, ...
- [原创]java WEB学习笔记27:深入理解面向接口编程
本博客为原创:综合 尚硅谷(http://www.atguigu.com)的系统教程(深表感谢)和 网络上的现有资源(博客,文档,图书等),资源的出处我会标明 本博客的目的:①总结自己的学习过程,相当 ...
- SAS学习笔记22 t检验、卡方检验
- SAS学习笔记<一>
三个周末的SAS课程宣告结束, 总结下来 第一周的统计原理简介 第二周/第三周讲解SAS的基本操作. 总体下来,对自己的知识结构有了一个新的梳理,对比大学时期,某个老师一上来就教我们SAS编程,而未考 ...
- SAS学习笔记
一. 在SAS中进行随机抽样: 1. 在实际数据处理中常常需要进行样本抽样,在实践中主要有两种情况: (1)简单无重复抽样(2)分层抽样 a.等比例分层抽样 b. 不等比例 ...
随机推荐
- Maven私服使用经验总结
我是使用nexus2.11.2在centos6.5上搭建的私服,以下是总结我这几天的经验. 1.当你修改pom.xml的时候,eclipse检查的是你本地仓库里的jar包,如果有了,pom.xml文件 ...
- Spring框架中不同类型的事件
ContextRefreshedEvent,ApplicationContext初始化或者被更新是会触发,ConfigurableApplicationContext接口中的refresh()方法被调 ...
- linux下如何删除乱码文件
首先执行ls -i命令,此时在文件前面会出现一个数字,这个数字是文件的节点号 接着,执行命令 find -inum 节点号 -delete 即可将乱码文件成功删除
- 2019 DDCTF 部分writeup
网上的wp已经很多了,但wp普遍很简略.我尽量写的详细一点. 一.WEB 滴~ 拿到题目后首先右键查看源代码,发现图片是以base64传送的 而且看url发现里面应该是包含了文件名,并且用了某个编码. ...
- Oracle 中的 Profile
一.目的: Oracle系统中的profile可以用来对用户所能使用的数据库资源进行限制,使用Create Profile命令创建一个Profile,用它来实现对数据库资源的限制使用,如果把该prof ...
- keras Dense 层
文档地址:https://keras.io/layers/core/#dense keras.layers.Dense(units, activation=None, use_bias=True, k ...
- pytorch常用损失函数
损失函数的基本用法: criterion = LossCriterion() #构造函数有自己的参数 loss = criterion(x, y) #调用标准时也有参数 得到的loss结果已经对min ...
- SpringCloud学习成长之路三 服务消费者(Feign)
一.Feign简介 Feign是一个声明式的伪Http客户端,它使得写Http客户端变得更简单.使用Feign,只需要创建一个接口并注解. 它具有可插拔的注解特性,可使用Feign 注解和JAX-RS ...
- 单层反查BOM
*&---------------------------------------------------------------------* *& Report YCX_001 * ...
- 根据DELTA自动生成SQL语句
上传客户端的CLIENTDATASET.delta到服务器的clientdataset.data,服务端解析clientdataset的数据生成相应的SQL语句. 相对于直接调用datasetprov ...