中国农业大学等多家单位2017年合作发表在《遗传》杂志上的综述,笔记之。

作者中还有李宁院士,不胜唏嘘。

1.概述

  • GS的两大难题:基因组分型的成本,基因组育种值(genomic estimted breeding value, GEBV)的准确性。
  • 基于个体的基因组估计育种值GEBV比传统基于系谱的估计育种值(estimted breeding value, EBV)准确性更高。
  • GS实施示意图:

基于单点SNP标记的GEBV估计方法

  • 一类基于估计等位基因效应来计算GEBV:

    ①最小二乘法

    ②岭回归-最佳线性无偏预测(ridge regression best linear unbiased prediction, RR-BLUP)

    ③贝叶斯方法

  • 另一类基于SNP构建基因组关系矩阵(GRM/G矩阵),再用线性混合模型估计GEBV:

    ①基因组最佳线性无偏预测法(genomic best linear unbiased prediction, GBLUP)

    ②一步法GBLUP(ssBLUP)

基于单倍型的GEBV 预测模型

  • 随着个体数和标记密度提升,传统基于单点SNP 信息的统计模型无法利用所有个体表型数据或所有标记位点信息。
  • 基于单倍型的GEBV 预测模型:通过将已知功能的基因组学信息,包括基因结构、甲基化区域、转录因子调控结合位点、选择信号候选区域等信息,以单倍型信息整合GEBV 预测模型,从而提高准确性(这辈子都可能看不到~)。
  • 其他模型:增加显性、上位性、印记效应等。

2.基因型

高密度SNP芯片

代表:Illumina的Infinium 技术和Affymetrix的Axiom 技术



简化基因组测序:

  • 如RAD-seq 、GBS、2b-RAD、GGRS、CroPS、RRL、MSG等,不同建库方法,但原理都是:通过合适的限制性内切酶对基因组进行酶切,然后连接二代测序平台所需的接头序列,再选择一定范围内的连接产物进行测序。
  • GBS、RAD-seq 、2b-RAD最常用,区别在于是否在接头连接后进行片段选择,以及PCR后是否进行片段选择。

基因组重测序

  • GS2.0(Hickey, 2013):基于基因组重测序的GS,区别基于芯片的GS1.0。
  • GS2.0另一种策略:首先对群体中遗传贡献较大的个体进行10~30x的中高覆盖度的重测序,结合单倍型估计技术构建群体主要的单倍型库;对于大多数个体采用SNP高密芯片或简化基因组测序技术进行分型,通过基因型填充获得全基因组的遗传变异,从而用GEBV的预测。
  • 高密度SNP芯片的单价从几百到上千人民币不等,主要取决于定制量、位点密度等;简化基因组测序的单价通常芯片低,主要取决于所研究物种的基因组大小和所选择的内切酶。
  • 也可以选20~30个代表性的个体进行重测序,获得这

    个群体具有一定代表性的SNP数据集,利用这些数据设计芯片,从而进行“廉价”的大规模基因分型。

  • 挑战:分型的准确性和分析时效性。准确性可通过优化测序方案和基因型填充,时效性依靠硬件加速。

3.统计模型

贝叶斯

  • BayesA 假设所有SNP都有效应,且所有SNP 效应的方差服从尺度逆卡方分布的正态分布,其中自由度和尺度参数这两个参数与遗传结构直接相关,能够确定遗传结构。BayesA 使用MCMC(马尔科夫链蒙特卡洛方法)方法构建Gibbs 抽样链,在模型中对标记效应进行求解。
  • BayesB 只有一小部分标记位点有效应(有效应位点比例预先设定,一般为0.05,其效应方差服从的分布同BayesA),其他大部分染色体片段效应为0。BayesB使用混合分布作为标记效应方差的先验。
  • BayesC 模型中,有/无效应位点比例是未知的,需要在模型中求解得到,其他同BayesB。
  • BayesCπ 假设有效应位点的效应方差相同,而BayesC 假设其效应方差是不同的。
  • Bayes LASSO 假定标记效应服从Laplace(拉普拉斯)分布,即等价于方差服从指数分布的正态分布。
  • 以上是目前广泛应用的贝叶斯算法,结果稳定,准确性较高,此外有其他贝叶斯模型:BayesDπ,Bayes SSVS、fBayesB、wBSR 、BAL/IAL 、emBayesR 、EBL 、BayesRS、Bayes TA等。都是在基础模型上对先验假设进行变换和模型中的参数进行优化,以期寻找最适合群体的假设模型和参数

GBLUP

  • 通过构建基因组关系矩阵(G矩阵)替换基于系谱信息构建的分子血缘关系矩阵(NRM或A矩阵),进而使用最佳线性无偏预测(BLUP)方法估计GEBV。

  • VanRaden构建G矩阵:先编码{1,0,1},减去哈温平衡时均值,得到Z矩阵,如下计算G矩阵,根据MME求解育种值:

  • 与贝叶斯方法相比,GBLUP不需要先利用参考群体估计标记效应,再计算GEBV;而是可以直接将有表型及无表型个体可以放在同一个模型中,同时估计出有表型和无表型个体的GEBV及其准确性。

ssGBLUP

  • 基于系谱的BLUP(A矩阵)+ 基于SNP的GBLUP(G矩阵)= HBLUP(H矩阵)

  • H矩阵:



  • ssGBLUP能将无基因型个体的系谱及表型数据和有基因型的个体的基因组信息结合起来,大大提高基因组选择的准确性。

4.应用

奶牛:

应用最早最成熟,重点在缩短育种周期,难在扩大参考群和基因型鉴定。

猪:

重点在提高GEBV估计的准确性(因为世代间隔在现有育种体系中已经很短)。

难点是对传统育种中选择准确性低的性状预测,如繁殖性状、屠宰性状、肉质性状、抗病性状等。

GS 对猪的生长或胴体性状具有很好的预测准确性。

在母猪的繁殖性状(遗传力低)中应用受限于参考群体的大小。

鸡:

限制和难点是个体价值远小于基因分型成本(这个在植物中更加明显)。

【GS文献】基因组选择技术在农业动物育种中的应用的更多相关文章

  1. 【百奥云GS专栏】1-全基因组选择介绍

    目录 什么是基因组选择? 基因组选择技术的发展 基因组选择的原理和流程 基因组选择的模型 基因组选择的展望 参考资料 什么是基因组选择? 基因组选择(Genomic Selection,简称GS)这一 ...

  2. 【GS文献】植物全基因组选择育种技术原理与研究进展

    目录 1. 优势杂交育种预测 2. GS育种原理与模型算法 岭回归和LASSO回归 贝叶斯方法 GBLUP和RRBLUP 偏最小二乘法 支持向量机/支持向量回归 其他方法 3. 模型预测能力验证 4. ...

  3. 【GS文献】植物育种中基因组选择的方法、模型及展望

    目录 1. GS/GP在植物育种中的角色 2. GP模型应用 3. GP模型的准确性 4. 植物育种的GS展望 5. 小结 Genomic SelectioninPlant Breeding: Met ...

  4. 【GS文献】全基因组选择模型研究进展及展望

    目录 1. GS概况 2. GS模型 1)直接法 GBLUP 直接法的模型改进 ①单随机效应 ②多随机效应 2)间接法 间接法模型 基于间接法的模型改进 3. GS模型比较 模型比较结论 4.问题及展 ...

  5. 【GS文献】从家畜到植物,通过基因组选择提高遗传增益

    目录 说明 1.前言 2.植物GS瓶颈 3.提高GS预测的准确性 4.GS与现代育种技术结合 5.GS开源育种网络 说明 Enhancing Genetic Gain through Genomic ...

  6. 【百奥云GS专栏】全基因组选择之工具篇

    目录 1. 免费开源包/库 1.1 R包 1.2 Python库 2. 成熟软件 3. WEB/GUI工具 前面我们已经介绍了基因组选择的各类模型,今天主要来了解一下做GS有哪些可用的软件和工具.基因 ...

  7. 【百奥云GS专栏】全基因组选择之模型篇

    目录 1. 前言 2. BLUP方法 ABLUP GBLUP ssGBLUP RRBLUP 3. 贝叶斯方法 BayesA BayesB BayesC/Cπ/Dπ Bayesian Lasso 4. ...

  8. 【GS基础】植物基因组选择研究人员及数量遗传学发展一览

    目录 1.GS研究 2.数量遗传发展 GS应用主要在国外大型动物和种企,国内仍以学术为主.近期整理相关学术文献,了解到一些相关研究人员,记录下备忘查询,但不可能全面. 1.GS研究 Theo Meuw ...

  9. 全基因组选择育种(GS)简介

    全基因组选择(Genomic selection, GS)是一种利用覆盖全基因组的高密度标记进行选择育种的新方法,可通过早期选择缩短世代间隔,提高育种值(Genomic Estimated Breed ...

随机推荐

  1. 期望dp好题选做

    前言: 最近连考两场期望dp的题目,sir说十分板子的题目我竟然一点也不会,而且讲过以后也觉得很不可改.于是开个坑. 1.晚测10 T2 大佬(kat) 明明有\(O(mlog)\)的写法,但是\(m ...

  2. IDEA插件开发,我是如何把公司的发布系统搬到IDEA里的

    不得不说JetBrains公司直的非常的牛B,每一个程序员都能在JetBrains的官方网站找到一款属于自己的开发工具.这些开发工具在工作中给我们带来了巨大的便利.各种各样的基础插件,第三方插件,真是 ...

  3. 第01课 OpenGL窗口(3)

    接下来的代码段创建我们的OpenGL窗口.我花了很多时间来做决定是否创建固定的全屏模式这样不需要许多额外的代码,还是创建一个容易定制的友好的窗口但需要更多的代码.当然最后我选择了后者.我经常在EMai ...

  4. Navicat15 For Mysql最新版完美破解图文教程(支持Win和Mac)

    Navicat15 For Mysql最新版完美破解 欢迎关注博主公众号[跟着Mic学架构],专注于分享Java领域技术干货,回复关键字 [面试资料] 可以获得海量面试资料. 申明,本教程 Navic ...

  5. Vue&Element开发框架中增加工作流处理,查看申请单中整合多个处理类型的处理

    关于我在Winform框架.混合框架.Bootstrap开发框架中的简易审批性工作流模块,我写过不少文章,有兴趣可以参考<工作流模块>的随笔进行了解,本篇随笔在完成了Vue&Ele ...

  6. Linux部署Apollo+.Net Core简单使用

    Apollo官方网站非常详细,以下只是本人学习过程的整理 一.概念 Apollo(阿波罗)是一款可靠的分布式配置管理中心,能够集中化管理应用不同环境.不同集群的配置,配置修改后能够实时推送到应用端,并 ...

  7. Vue&Element开发框架中增加工作流处理,工作流的各个管理页面的界面处理

    我在起前面的几篇随笔中,大概介绍了工作流的一些场景化处理,包括如何把具体业务表单组件化,并在查看和编辑界面中,动态加载组件内容,以及对于查看申请单的主页面,把审批.取消.发起会签.会签.批示分阅.阅办 ...

  8. GoLang设计模式12 - 空对象模式

    空对象设计模式是一种行为型设计模式,主要用于应对空对象的检查.使用这种设计模式可以避免对空对象进行检查.也就是说,在这种模式下,使用空对象不会造成异常. 空对象模式的组件包括: Entity:接口,定 ...

  9. 五(二)、spring 声明式事务xml配置

    概述: 接着上一节内容,把注解配置@@Transactional形式改为xml配置形式: 一.配置步骤 1.配置事务管理器 1 <!-- 1配置事务管理器 --> 2 <bean i ...

  10. robotframework定位页面内Frame框架里的元素

    在自动化开发中,会遇到在页面内部点开一个新的页面后,新的页面元素无法定位到的情况,如点击下图的上传图片,弹出的界面无法直接定位到: 遇到这种情况需要查看弹出界面是否是Frame框架页面:打开火狐浏览器 ...