GWAS

GWAS的数据形式：SNP数据，即各个SNP位点的aa,Aa,AA基因型与疾病状态（0正常，1患病）的样例-对照数据。

在遗传流行病学上，全基因组关联研究（Genome Wide Association Studies,GWAS）是一种检测特定物种中不同个体间的全部或大部分基因，从而了解不同个体间的基因变化有多大的一种方法。不同的变化带来不同的性状，如各种疾病的不同。

这些研究通常比较两组参与者的DNA：有疾病的人（病例）和相同条件的无该疾病的人（对照）。每个人都提供些作为样本的细胞，如从口腔内侧擦下的表皮细胞，可以从这些细胞中提取DNA，并涂布在基因芯片上，该芯片上可以读取上百万个DNA序列。这些芯片被读入计算机，在那里通过生物信息学技术对其进行分析，而不是阅读的全部DNA序列，这些系统通常读的是各个SNP，这些SNP便是成组的DNA变异（单倍型）的标记。

如果在患者中某基因型的变异很频繁，那么就说该变异与该疾病“相关”。相关的遗传变异所在的人类基因组区域被视为标示点，基因组的该区域可能是致病原因的所在。有两种方法用来寻找疾病相关的突变：假说驱动和非假设驱动的方法。假设驱动的方法为一开始假设一个特殊的基因可能与某种疾病有关，并试图找出关联。非假设驱动的研究用蛮力的方法来扫描整个基因组，看哪些基因与该病有关联。GWAS一般采用非假说驱动。

令人惊讶的是，与疾病相关的SNP变异大多不是在编码蛋白质的DNA区域。相反，他们通常位于染色体上编码基因间的大型非编码区域上，或者位于编码基因的内含子上，该内含子通常在蛋白质的表达过程中被剪切掉。这些是有控制其他基因能力的可能的DNA序列。但通常，他们的蛋白质功能是不知道的。

GWAS为人们打开了一扇通往研究复杂疾病的大门，将在患者全基因组范围内检测出的SNP位点与对照组进行比较，找出所有的变异等位基因频率，从而避免了像候选基因策略一样需要预先假设致病基因。同时，GWAS研究让我们找到了许多从前未曾发现的基因以及染色体区域，为复杂疾病的发病机制提供了更多的线索。

分析原理

基于无关个体的关联分析

病例对照研究设计：主要用来研究质量性状，即是否患病。

基于随机人群的关联分析：主要用来研究数量性状。

基于家系的关联研究

在研究基于家系的样本时，采用传递不平衡检验（TDT）分析遗传标记与疾病数量表型和质量表型的关联可以排除人群混杂对于关联分析的影响，但其在发现阳性关联的检验方面不如相同样本量的病例对照研究有效。

FBAT是运用十分广泛的基于家系的统计分析工具，能够分析质量性状及数量性状、调整混杂因素、分析基因-环境相互作用、分析单倍型、调整多重比较等。

单倍型分析研究的必要性：多位点单倍型分析能够发现单倍型-疾病表型之间的关联，这种关联要明显强于单个位点-疾病表型之间的关联。

单倍型分析能够发现非TagSNPs与疾病之间的因果关系。

表型选择

选择遗传度较高的疾病或者表型进行检测能够提升遗传学关联研究的把握度。

由于有时病症很难测量或是多种病症混杂在一起造成疾病状态的分辨困难，研究疾病相关的数量表型要优于研究疾病状态。

由于测量数量表型的难易程度和该表型的遗传度相关，通过控制测量误差、噪音和总体变异能够加强数量表型变异与遗传因素的比例关系，因此一般选择测量简单准确并且遗传度相对较高的数量表型。

设计类型

单个阶段研究

单个阶段研究即在有了足够大的病例和对照样本数量后，一次性地对其所有选中的SNP进行基因分型，然后分析每个SNP与基本的关联，计算其关联强度和OR值。由于样本数量需求量大，单阶段研究基因分型一般耗资巨大。

两个或多个阶段研究

采用小样本数量进行第一阶段的全基因组范围SNP基因分型，统计分析过后一般能够筛选少量阳性SNPs，之后的第二阶段再在更大数量的样本中对这些阳性SNPs进行基因分型，最后整合两个阶段的结果进行分析。研究证明DNA pool和微阵列试剂盒均能够降低基因分型的工作量，能够进行低成本高效益的SNP筛选。

多重假设

Bonferroni校正法

递减调整法（Step-Down Adjustment）

模拟运算法(Permutation)

控制错误发现率法(False discovery rate)

GWAS的更多相关文章

【GWAS文献】基于GWAS与群体进化分析挖掘大豆相关基因
Resequencing 302 wild and cultivated accessions identifies genes related to domestication and improv ...
GWAS Simulation
comvert hmp to ped1, ped2, map fileSB1.ped, SB2.ped, SB.map 1, choose 20 markers for 30 times(WD: /s ...
GWAS群体分层校正，该选用多少个PCA
前言关于选用多少个PCA做群体分层校正,各大期刊并没有一个统一的说法. 故做了如下综述. 1 随心所欲型,想选多少就选多少 PCA想选多少就选多少,这个真的不是开玩笑.有文献出处有真相! 比如下面文 ...
GWAS后续分析：多基因风险评分(Polygenic Risk Score)的计算
一.什么是多基因风险评分传统的GWAS研究只计算单个SNP位点与表型之间的关联性,再用Bonferroni校正,通过给定的阈值,筛选出显著的SNP位点. 这样会存在两个问题,第一.Bonferron ...
GWAS：拒绝假阳性之case和control数量比例严重失衡的解决方案（SAIGE模型的应用）
一.为什么要校正case和control数量比例不平衡情况试问作为生信届人员,最怕的是什么,当然是统计结果不靠谱.统计结果不靠谱包括两方面:一个是假阴性,一个是假阳性.假阴性可以理解为白天鹅被误当成 ...
GWAS研究中case和control的比例是有讲究的？
GWAS研究中,表型分两种.第一种是线性的表型,如果身高.体重.智力等:第二种是二元的表型,比如患病和未患病,即通常所说的case和control.对于表型是线性的样本来说,是不存在case和cont ...
GWAS后续分析：LocusZoom图的绘制
LocusZoom图几乎是GWAS文章的必备图形之一,其主要作用是可以快速可视化GWAS找出来的信号在基因组的具体信息:比如周围有没有高度连锁的位点,高度连锁的位点是否也显著. 下面是locuszoo ...
GWAS基因芯片数据预处理：质量控制（quality control）
一.数据为什么要做质量控制比起表观学研究,GWAS研究很少有引起偏差的来源,一般来说,一个人的基因型终其一生几乎不会改变的,因此很少存在同时影响表型又影响基因型的变异.但即便这样,我们在做GWAS时 ...
GWAS: 阿尔兹海默症和代谢指标在大规模全基因组数据的遗传共享研究
今天要讲的一篇是发表于 Hum Genet 的 "Shared genetic architecture between metabolic traits and Alzheimer's d ...

随机推荐

MDK下调试时提示AXF文件无法导入的解决方法（转）
源:http://blog.163.com/zhaojun_xf/blog/static/3005058020117784643555/ 在开发ARM项目中,很多工程师都不太喜欢使用MDK的调试模式, ...
GPRS管理与创建APN拨号连接（转）
源:http://www.cnblogs.com/michael-zhangyu/archive/2009/07/04/1516797.html 本文主要介绍一些GPRS管理与创建APN拨号连接相关的 ...
FZU Problem 2150 Fire Game（bfs）
这个题真要好好说一下了,比赛的时候怎么过都过不了,压点总是出错(vis应该初始化为inf,但是我初始化成了-1....),wa了n次,后来想到完全可以避免这个问题,只要入队列的时候判断一下就行了. 由 ...
log4j输出到指定日志文件
log4j.properties: log4j.logger.myTest=DEBUG,console,FILE log4j.appender.console=org.apache.log4j.Con ...
linux下的安装百度云网盘
linux下的百度网盘 (2014-10-20 18:01:14) 标签: linux 百度网盘网盘百度 forlinux 分类: 技术博文百度网盘说实话,其实我挺喜欢的,好处什么的,就不说了, ...
mysql 赋给用户权限 grant all privileges on
遇到了 SQLException: access denied for @'localhost' (using password: no) 解决办法 grant all privileges o ...
Firebug Console 与命令行全集
Console API 当打开 firebug (也包括 Chrome 等浏览器的自带调试工具),window 下面会注册一个叫做 console 的对象,它提供多种方法向控制台输出信息,供开发人员调 ...
Struts2--Action属性接收参数
1. JSP文件调用格式: <a href="user/user!add?name=a&age=8">添加用户</a> 2. struts.xml文 ...
Extjs4---Cannot read property 'addCls' of null - heirenheiren的专栏 - 博客频道 - CSDN.NET
body { font-family: 微软雅黑,"Microsoft YaHei", Georgia,Helvetica,Arial,sans-serif,宋体, PMingLi ...
input限定文件上传类型：Microsoft Office MIME types
<input id = " " name = " " type = " file " accept=" ? ? ? &quo ...