相关文章:

A Unified Framework for Association Analysis with Multiple Related Phenotypes

太重要了,不得不单独拿出来分析一下。本review高度总结了GWAS这10年的成绩、以及现在的局限性。每个搞统计遗传的都必须要好好看看。

第一篇GWAS是什么时候?谁提出的?The first successful GWAS published in 2002 studied myocardial infarction. Ozaki

trans-ethnic和meta analysis的区别?不同人种和整合分析,概念不一样,目的不一样

Twin study是什么?优势是什么?用于估计heritability。本质就是控制变量,同卵双胞胎share了同样的遗传物质,所以他们的表型差异完全可以归结为非genetic的环境变异。"identical" or monozygotic (MZ) twins share essentially 100% of their genes, which means that most differences between the twins (such as height, susceptibility to boredom, intelligence, depression, etc.) are due to experiences that one twin has but not the other twin.

GWAS里面cohort study是什么?The importance of cohort studies in the postGWAS era

LD和correlation的联系和区别?LD表征的是一个SNP的特征,correlation是两个对象之间的相关性。LD就是某个SNP的1M区域内,其所有阈值超过0.5的r2的总和。

heritability是什么?在GWAS中如何计算?heritability在不同人群中是会变的,因为GE interaction会变,看wiki定义。

在GWAS实验设计中,有哪些因素会影响power?如何计算power和控制power?见下文

什么是genetic architecture?the joint distribution of effect size and allele frequency

GWAS的SNP arrays通常包含多少个SNP位点,是如何选择出这些位点的?minor allele frequency (MAF) typically larger than 1%.

为什么要做SNP imputation,根据什么来做?haplotype

什么情况下WGS能检测出rare variant与trait的association?sample size足够,或者effect size足够,最终还是要power足够。

burden testing of rare variant是什么?以基因为单位,检验rare variant在case和control中的差异是否显著。

10 Years of GWAS Discovery: Biology, Function, and Translation

之前的第一个五年总结:Five Years of GWAS Discovery

The GWAS is an experimental design used to detect associations between genetic variants and traits in samples from populations. 可以说genetic variants,也可以说gene,或者loci。

GWAS其实是一种包含了实验设计和分析的整合方法,主要用于complex-trait的控制基因定位。如果是单基因病monogenic disease的话,就没必要做GWAS了。

对于正常的性状,比如身高,定位到的就是控制身高的一些loci;对于疾病就是定位到导致疾病的一些variant上。

variant有很多种,目前GWAS主要关注的是SNP,其实还有InDel、CNV和SV。

这就是我的主要工作,学学别人的措辞:

The path from GWAS to biology is not straightforward because an association between a genetic variant at a genomic locus and a trait is not directly informative with respect to the target gene or the mechanism whereby the variant is associated with phenotypic differences.

The statistical power to detect associations between DNA variants and a trait depends on the experimental sample size, the distribution of effect sizes of (unknown) causal genetic variants that are segregating in the population, the frequency of those variants, and the LD between observed genotyped DNA variants and the unknown causal variants.

In addition, other genome-wide scans, such as WES and WGS studies, allow testing for a burden of rare variants across shared functional units (e.g., genes) in a way that is not accessible to GWASs.

Burden Testing of Rare Variants Identified through Exome Sequencing via Publicly Available Control Data

这个视频讲得很好,由浅及深:BroadE: Statistical Genetics - Rare variants

以下是本review的框架:

复杂性状的高度多基因性Complex Traits Are Highly Polygenic

phenotype可以很general,大到身高、小到基因表达、表观变化。

Polygenic就是控制复杂性状的基因或loci是很多的,如何整合解释它们整体的影响非常重要。

多效性是普遍存在的Pleiotropy Is Pervasive

多效性就是一个位点的突变可能影响了多种表现,这也就是为什么很多表型具有高度的相关性。

新的分析方法学New Analysis Methodology Underpinning New Discovery

GWAS的后续研究主要有以下四个方面:

(1) methods of better modeling population structure and relatedness between individuals in a sample during association analyses,28–34
(2) methods of detecting novel variants and gene loci on the basis of GWAS summary statistics, 35–37
(3) methods of estimating and partitioning genetic (co)variance,38,39 and
(4) methods of inferring causality.40–42

常见变异解释了大部分的累积遗传变异Common Variants Together Tag a Substantial Proportion of Additive Genetic Variance

Additive Genetic Variance就是指AA、Aa、aa之间的表型是线性的,而不是显性和隐性的关系。

遗传预测方法The Utility of GWAS-Derived Genetic Predictors

polygenic risk score (PRS),就是根据每个个体的变异和effect size,给每一个个体一个具体的患某疾病的打分。

公共数据库的应用The Public Availability of Data Has Enabled Novel Research and Discoveries

GWAS Catalog - EMBL-EBI,最有名的数据库。

UK Biobank

从GWAS到生物学From GWAS to Biology

如何填补这个gap,于是出现了很多数据库:ENCODE Epigenome RoadMap, and GTEx

三个成功的GWAS案例Three Exemplars of GWAS Success

值得一看,如何用精简的语言高度总结一个项目。

GWAS这十年 | 10 Years of GWAS Discovery: Biology, Function, and Translation的更多相关文章

  1. angular学习笔记(三十)-指令(10)-require和controller

    本篇介绍指令的最后两个属性,require和controller 当一个指令需要和父元素指令进行通信的时候,它们就会用到这两个属性,什么意思还是要看栗子: html: <outer‐direct ...

  2. GWAS+自然选择:62个样本的GWAS分析,没信号,如何巧妙的发文章

    欢迎来到"bio生物信息"的世界 6天前,BMC Genomics 推了一篇文献"Population history and genetic adaptation of ...

  3. python基础-第十篇-10.1HTML基础

    htyper text markup language 即超文本标记语言 超文本:就是指页面内可以包含图片.链接,甚至音乐,程序等非文字元素 标记语言:标记(标签)构成的语言 网页==HTML文档,由 ...

  4. python基础-第十篇-10.2CSS基础

    CSS是Cascading Style Sheet的简称,中文为层叠样式表 属性和属性值用冒号隔开,以分号结尾 引入方式 行内式--在标签的style属性中设定CSS样式 <body> & ...

  5. 第10课 std::bind和std::function(1)_可调用对象

    1. 几种可调用对象(Callable Objects) (1)普通函数指针或类成员的函数指针 (2)具有operator()成员函数的类对象(仿函数).如c++11中的std::function类模 ...

  6. Rare-Variant Association Analysis | 罕见变异的关联分析

    Rare-Variant Association Analysis: Study Designs and Statistical Tests 10 Years of GWAS Discovery: B ...

  7. Google云平台使用方法 | Hail | GWAS | 分布式回归 | LASSO

    参考: Hail Hail - Tutorial  windows也可以安装:Spark在Windows下的环境搭建 spark-2.2.0-bin-hadoop2.7 - Hail依赖的平台,并行处 ...

  8. 全基因组关联分析学习资料(GWAS tutorial)

    前言 很多人问我有没有关于全基因组关联分析(GWAS)原理的书籍或者文章推荐. 其实我个人觉得,做这个分析,先从跑流程开始,再去看原理. 为什么这么说呢,因为对于初学者来说,跑流程就像一个大黑洞,学习 ...

  9. Python之路【第十八章】:Django基础

    Django基本配置 Python的WEB框架有Django.Tornado.Flask 等多种,Django相较与其他WEB框架其优势为:大而全,框架本身集成了ORM.模型绑定.模板引擎.缓存.Se ...

随机推荐

  1. linux 显示不可见字符

    在Linux中,cat -A file可以把文件中的所有可见的和不可见的字符都显示出来,在Vim中,如何将不可见字符也显示出来呢?当然,如果只是想在Vim中查看的话,可以这样:%!cat -A在Vim ...

  2. 生成1~n的排列(模板),生成可重集的排列(对应紫书P184, P185)

    生成1~n的排列: #include<iostream> using namespace std; void print_permutation(int n, int *A, int cu ...

  3. java连接Oracle数据库的操作说明

    在测试中,我们常常需要连接Oracle数据库来进行查询对比.下面,我们就来看看,如何使用java代码来连接数据库,并且取出我们想要的数值. 首先,java中如果要连接Oracle数据库,需要jdbc的 ...

  4. Redis中如何保证数据库和缓存双写时的数据的一致性?

    简单的场景: 直接使用 1. 使用Cache Aside pattern 读取的时候,先读取缓存中是否有数据,缓存中没有数据,再去数据库中进行查询,查询出来以后,然后再存入到缓存中 更新的时候,先删除 ...

  5. mysql占用内存过高调优方法

    最近测试一个站点,用mysql 5.6+mencache  内存16GB,但是进行查询的时候还是导致CPU占用过高,达到80%左右,所以想办法如何进行调优.以下几个参数进行参考选择 优化mysql数据 ...

  6. centOS下实践查询版本/CPU/内存/硬盘容量等硬件信息

    更详细参考: https://blog.csdn.net/dream_broken/article/details/52883883 1.查看内存 DirectMap2M: 33544192 kB [ ...

  7. python - 使用psutils

    oshelper.py #encoding=utf-8 import psutil import datetime #查看cpu的信息 print u"CPU 个数 %s"%psu ...

  8. cube.js 学习(六)cube.js segments 说明

    segments 是你需要查询的数据的子集,实际上filter 也可以做类似的事情,但是,目前这个设计估计是为了更好的数据 查询吧,同时在操作界面上我们也可以看出来 参考格式 segments: { ...

  9. Bash基本功能:输入输出重定向

    输入输出重定向的作用: 输出重定向就是把命令的执行结果保存到文件,便于查看. 输入重定向就是把原先由键盘的输入改为由文件输入. 案例1:把ls显示的结果输入到 date文件里面:包括ls的正确和错误信 ...

  10. 计数器的原理,设计及verilog实现

    若计数器由n个触发器组成,则计数器的位数为n,所能计数的最大模数为2的n次幂.以下为同步二进制加法计数器电路; 驱动方程:状态图 状态方程(此时的Q0,Q1为上一次状态值): 下例是同步4位2进制计数 ...