一、假设检验

假设检验的基本思路是:

设立零假设(null hypothesis)H0,以及与零假设H0相对应的非零假设(alternative hypothesis)H1,在假设H0成立的前提下,计算出H0发生的概率,若H0的发生概率很低,基于小概率事件几乎不可能发生,所以可以拒绝零假设。

科学研究一般会把我们希望得到的结论当作非零假设,而期望否定的结论当作零假设。只要我们证明零假设发生的概率很小,我们就有理由拒绝零假设,从而接受非零假设。

例如,我希望得到的结论是早上能够八点起床。那么零假设可以设为:早上八点起不来,如果我计算出来早上八点起不来床的概率非常低,我们就可以接受非零假设:我能够八点起床。

二、假阳性

假阳性:简单打个比喻,就是你本来健健康康的,却被辣鸡医院检测出来你得了病,这就是假阳性。

假阳性率:是对于所有阳性的样本而言,其中是假阳性的有多少。比如,公司体检100个人,检测出来10个人有病,但真正有病的是8个人,那么假阳性率就是0.2。

三、 p值和q值

p值衡量的是原本我们应该接受H0,但实际接受的是H1的概率,它是针对单次统计推断的一个置信度评估。还是之前的例子,如果p=0.05,意味着:能够八点起床 这个假设出错的概率为5%。

q值衡量的是在进行多次统计推断后的假阳性率。

四、 FDR校正

之前的例子中,如果我们检验次数多达10000次,那么犯错的概率将500多次。这里虽然犯错的概率没变(5%),但是随着检验次数的增多,我们犯错的次数增多了。因此就需要多重检验校正来减低假阳性的次数。

FDR校正就是为了控制假阳性率。例如,对应于脑网络研究中,假设大脑总共有10000个体素,通过假设检验发现有2000个体素的P<0.05。那么FDR<0.02说的是在2000个激活的体素中,假阳性的体素不超过2000*0.02=40个。

五、 如何计算FDR

使用最多的是Benjaminiand Hochberg的方法,简称BH法。

BH 方法首先对p值进行升序排列,对于给定的阈值的,找到最大的k值,使得:q = (p*m)/k <α成立

其中的p为p值,m为检验次数,k为此次检验的p值在所有检验次数中的排名。

假设检验了5次 ,阈值α=0.05 ,按p值的大小升序排列

p(1) = 0.01 p(2) = 0.015 p(3) = 0.02 p(4) = 0.025 p(5) = 0.03

q(1) = (0.01*5)/1 = 0.05 q(2) = (0.015*5)/2 = 0.0375

q(3) = (0.02*5)/3 = 0.0333 q(4) = (0.025*5)/4 = 0.03125

q(5) = (0.03*5)/5 = 0.03

所以最大的k为3,即认为在FDR<0.05的情况下,1、2、3可以视作为真阳性。对应于脑网络中的那个例子,原本是五个体素都激活,但

经过FDR校正之后,只有3个激活了。

FDR校正的更多相关文章

  1. 学习笔记50—多重假设检验与Bonferroni校正、FDR校正

    总结起来就三句话: (1)当同一个数据集有n次(n>=2)假设检验时,要做多重假设检验校正 (2)对于Bonferroni校正,是将p-value的cutoff除以n做校正,这样差异基因筛选的p ...

  2. matlab FDR校正

    http://home.52brain.com/forum.php?mod=viewthread&tid=27066&page=1#pid170857 http://www.mathw ...

  3. SPM FDR校正

    来源: http://blog.sciencenet.cn/blog-479412-572049.html,http://52brain.com/thread-15512-1-1.html SPM8允 ...

  4. 学习笔记49—matlab FDR校正

    matlab自带函数mafdr,当ttest数较多时,可直接用[FDR, Q]=mafdr(P):但是Storey procedure在p值少于1000个时会崩溃,此时应改用BH FDR方法:mafd ...

  5. 假设检验:p-value,FDR,q-value

    来源:http://blog.sina.com.cn/s/blog_6b1c9ed50101l02a.html,http://wenku.baidu.com/link?url=3mRTbARl0uPH ...

  6. MCP|MZL|Accurate Estimation of Context- Dependent False Discovery Rates in Top- Down Proteomics 在自顶向下蛋白组学中精确设定评估条件估计假阳性

    一. 概述: 自顶向下的蛋白质组学技术近年来也发展成为高通量蛋白定性定量手段.该技术可以在一次的实验中定性上千种蛋白,然而缺乏一个可靠的假阳性控制方法阻碍了该技术的发展.在大规模流程化的假阳性控制手段 ...

  7. 浅谈多重检验校正FDR

    浅谈多重检验校正FDR Posted: 四月 12, 2017  Under: Basic  By Kai  no Comments 例如,在我们对鉴定到的差异蛋白做GO功能注释后,通常会计算一个p值 ...

  8. FDR错误发现率-P值校正学习[转载]

    转自:https://baike.baidu.com/item/FDR/16312044?fr=aladdin  https://blog.csdn.net/taojiea1014/article/d ...

  9. regression | p-value | Simple (bivariate) linear model | 线性回归 | 多重检验 | FDR | BH | R代码

    P122, 这是IQR method课的第一次作业,需要统计检验,x和y是否显著的有线性关系. Assignment 1 1) Find a small bivariate dataset (pref ...

随机推荐

  1. Java学习的第五十三天

    1.例9.5引用静态数据成员 public class Cjava { public static void main(String[]args) { Box b[] = {new Box(12,15 ...

  2. 使用 IDEA 查看 JDK8 源码

    使用 idea 查看 oracle jdk 8 源码时发现 Unsafe 没有源码. 解决方法: 到 openjdk-8 下载页面:http://jdk.java.net/java-se-ri/8-M ...

  3. numpy的统计分析

    一.排序 间接排序(argsort,lexsort) 根据一个或多个数据集进行排序 1.Sort() --对数值直接进行排序 a.一维排序 b.二维排序 c.axis的认知 2.argsort() - ...

  4. 解决nginx中js修改不生效的问题

    最近在做商城项目,使用nginx实现动静分离.结果在修改nginx文件夹下的js文件,浏览器访问网址现实的还是原来的旧的js文件.清理浏览器缓存,重启nginx均无效,最后在网上找到解决方案

  5. 如何优雅阻止view UI 的 Switch 切换?

    一.官方文档提供的方法 个人觉得官方提供的方法有时候不能够满足现实需求,第二点是view UI版本必须是4.0.0版本及以上才能使用这个开关组件. 二.自定义方法解决 ①将开关禁用掉  加一个 dis ...

  6. python-找不到tk包

    找不到-tk包 直接sudo apt-get install python3-tk 或者sudo apt-get install python-tk 百度上的方法不可信,还是直接这样一句命令来的实在

  7. CDN技术的原理及优缺点

    CDN的全称是Content Delivery Network,即内容分发网络.其基本思路是尽可能避开互联网上有可能影响数据传输速度和稳定性的瓶颈和环节,使内容传输的更快.更稳定.通过在网络各处放置节 ...

  8. VMware虚拟机 - 如何让鼠标从虚拟机中返回到个人计算机中

    最简单的方式 按快捷键:ctrl+alt即可 彻底解决问题的方法:安装VMware Tools 前提条件 开启虚拟机 确认客户机操作系统正在运行 因为 VMware Tools 安装程序是使用 Per ...

  9. <连接器和加载器>——概述连接器和加载器

    0.涉及术语 (1)地址绑定 将抽象的符号与更抽象的符号绑定,如 sqrt 符号与地址 0x0020010绑定. (2)符号解析 程序相互作用通过符号进行,如主程序调用库函数sqrt,连接器通过表明分 ...

  10. 常见mysql后台线程

     1.IO THREAD  MySQL有很多后台线程 其中包括了负责IO的相关线程IO THREAD 1. 参数innodb_write_io_threads  写线程 默认四个,负责数据块的写入 2 ...