全基因组选择育种(GS)简介
全基因组选择(Genomic selection, GS)是一种利用覆盖全基因组的高密度标记进行选择育种的新方法,可通过早期选择缩短世代间隔,提高育种值(Genomic Estimated Breeding Value, GEBV)估计准确性等加快遗传进展,尤其对低遗传力、难测定的复杂性状具有较好的预测效果,真正实现了基因组技术指导育种实践。
原理
常规育种手段主要利用性状记录值、基于系谱计算的个体间亲缘关系,通过最佳线性无偏估计(best linear unbiased predication,BLUP)来估计各性状个体育种值(EBVs),通过加权获得个体综合选择指数,根据综合选择指数高低进行选留。
标记辅助选择(marker assisted selection, MAS)育种,利用遗传标记,将部分功能验证的候选标记联合BLUP计算育种值,这样不仅可以提高育种值估计的准确性,而且可以在能够获得DNA时进行早期选择,缩短世代间隔,加快遗传进展。
而GS则通过覆盖全基因组范围内的高密度标记进行育种值估计,继而进行排序、选择,简单可以理解为全基因组范围内的标记辅助选择,主要方法是通过全基因组中大量的遗传标记估计出不同染色体片段或单个标记效应值,然后将个体全基因组范围内片段或标记效应值累加,获得基因组估计育种值(GEBV),其理论假设是在分布于全基因组的高密度SNP标记中,至少有一个SNP能够与影响该目标性状的数量遗传位点(quantitative trait loci, QTL)处于连锁不平衡(linkage disequilibrium, LD)状态,这样使得每个QTL的效应都可以通过SNP得到反映。
相比BLUP方法,全基因组选择可以有效降低计算个体亲缘关系时孟德尔抽样误差的影响;相比MAS方法,全基因组选择模型中包括了覆盖于全基因组的标记,能更好地解释表型变异。
技术路线
- 植物GS路线
- 动物GS路线
GS预期效果:
- 缩短育种周期,实现待选群体的低世代选留
- 提高育种值估计准确性
- 降低育种成本,减少表型鉴定的数量
- 预测亲本杂交后代,选择最佳杂交优势组合
统计模型
统计模型是GS的核心,极大地影响了基因组预测的准确度和效率。根据统计模型的不同,全基因组选择的模型大体可分为两大类:
1. 直接法
此方法把个体作为随机效应,参考群体和预测群体遗传信息构建的亲缘关系矩阵作为方差协方差矩阵,通过迭代法估计方差组分,进而求解混合模型获取待预测个体的估计育种值;
2. 间接法
此方法则首先在参考群中估计标记效应,然后结合预测群的基因型信息将标记效应累加,获得预测群的个体估计育种值。
直接法 VS 间接法
性状遗传构建复杂多样,目前还没有一种模型能广泛适用于所有性状。随着全基因组选择统计模型的不断改进优化,模型的稳定性及准确性不断提高,但是依然面临两个重要的挑战,即计算准确性和计算效率。
直接法(GBLUP为代表)计算效率较高,但是计算准确性略差于间接法(BayesB为代表),虽然学者对直接法进行了改进,但是由于改进的策略中人为设定参数较多,因此模型的预测准确性受主观因素影响较大;
间接法计算准确性较高,但是由于参数求解过程中计算量庞大,且无法实现并行运算,而育种讲求时效性,所以难以高效指导育种实践;
因此,如何优化模型,尽可能减少人为设定参数,与机器学习方法有效结合,并融入高效可并行运算,既能保证较高准确性的同时,大大提升计算效率,是未来全基因组选择模型优化的方向。
GS的局限
1)GS主要考虑加性效应,对于显性效应及互作效应等未纳入到育种值估计模型中;
2)GS目前主要在品种内进行,品种间由于遗传背景不同,跨品种预测准确性难以保证;
3)同品种间亲缘关系太远的个体育种值预测效果也不理想,如不同育种公司间由于育种策略不同,选择方向差异,导致同品种间遗传背景也不同,难以实现跨公司预测;
4)GS只用到基因组信息,大量的多组学研究结果利用不够充分,如何将多组学信息进行整合,通过整合组学提高选择准确度也是目前待解决的问题;
5)GS的分型个体数目越来越大,相比传统BLUP的稀疏矩阵,利用基因组信息计算的稠密矩阵给混合模型参数估计及模型求解带来了巨大的挑战,通过数学或着计算机手段简化计算复杂度,才能更高效利用庞大的基因组数据甚至其他各组学数据;
6)个体分型主要是芯片技术,芯片分型具有良好的稳定性,但由于密度不足,使得全基因组选择对LD的依赖性强,通过测序手段可以得到较高密度SNP标记从而减少对LD的依赖,同时测序方法可以捕获不同品种间所有遗传变异,可能实现跨品种预测,并且测序能够得到更丰富的遗传信息,如CNV等,对于亲缘关系较近的群体,可以通过填充技术将芯片个体标记密度填充到测序水平。因此,测序技术的应用将成为全基因组选择新时代的转折点。
GS未来发展
尽管测序技术对GS有利,但高质量的测序结果需要更高的测序深度,意味着测序成本更昂贵,并且测序数据庞大,主流的分析软件处理速度较慢,使用复杂繁琐,对于计算资源的配置需求较高,因此如何快速、有效地储存、处理及分析数据是测序技术应用于全基因组育种的重要挑战,另外,测序只能检测参考基因组中已知的序列和基因信息,对于未知的基因序列和基因还不能进一步深入研究。
随着测序方法和芯片技术的不断成熟,未来个体分型费用将不断降低,分型准确性不断提高,GS将逐步替代传统育种方法。
Ref:http://www.xml-data.org/XMSYXB/html/2019/2/20190201.htm
http://www.lifescience.net.cn/html/201810/20181013.htm
http://blog.sciencenet.cn/blog-2577109-1201959.html
http://www.kangpusen.com/Server/1.html
全基因组选择育种(GS)简介的更多相关文章
- 【GS文献】植物全基因组选择育种技术原理与研究进展
目录 1. 优势杂交育种预测 2. GS育种原理与模型算法 岭回归和LASSO回归 贝叶斯方法 GBLUP和RRBLUP 偏最小二乘法 支持向量机/支持向量回归 其他方法 3. 模型预测能力验证 4. ...
- 【GS文献】全基因组选择模型研究进展及展望
目录 1. GS概况 2. GS模型 1)直接法 GBLUP 直接法的模型改进 ①单随机效应 ②多随机效应 2)间接法 间接法模型 基于间接法的模型改进 3. GS模型比较 模型比较结论 4.问题及展 ...
- 【百奥云GS专栏】全基因组选择之工具篇
目录 1. 免费开源包/库 1.1 R包 1.2 Python库 2. 成熟软件 3. WEB/GUI工具 前面我们已经介绍了基因组选择的各类模型,今天主要来了解一下做GS有哪些可用的软件和工具.基因 ...
- 【百奥云GS专栏】全基因组选择之模型篇
目录 1. 前言 2. BLUP方法 ABLUP GBLUP ssGBLUP RRBLUP 3. 贝叶斯方法 BayesA BayesB BayesC/Cπ/Dπ Bayesian Lasso 4. ...
- 【GS模型】全基因组选择之rrBLUP
目录 1. 理论 2. 实操 2.1 rrBLUP包简介 2.2 实操 3. 补充说明 关于模型 关于交叉验证 参考资料 1. 理论 rrBLUP是基因组选择最常用的模型之一,也是间接法模型的代表.回 ...
- 【百奥云GS专栏】1-全基因组选择介绍
目录 什么是基因组选择? 基因组选择技术的发展 基因组选择的原理和流程 基因组选择的模型 基因组选择的展望 参考资料 什么是基因组选择? 基因组选择(Genomic Selection,简称GS)这一 ...
- 【GS文献】基因组选择在植物分子育种应用的最新综述(2020)
目录 1. 简介 2. BLUP类模型 3. Bayesian类模型 4. 机器学习 5. GWAS辅助的GS 6. 杂交育种 7. 多性状 8. 长期选择 9. 预测准确性评估 10. GS到植物育 ...
- 【GS文献】植物育种中基因组选择的方法、模型及展望
目录 1. GS/GP在植物育种中的角色 2. GP模型应用 3. GP模型的准确性 4. 植物育种的GS展望 5. 小结 Genomic SelectioninPlant Breeding: Met ...
- 【GS文献】基因组选择技术在农业动物育种中的应用
中国农业大学等多家单位2017年合作发表在<遗传>杂志上的综述,笔记之. 作者中还有李宁院士,不胜唏嘘. 1.概述 GS的两大难题:基因组分型的成本,基因组育种值(genomic esti ...
随机推荐
- 攻防世界 杂项 7.Aesop_secret
打开发现是个gif,以为有个二维码扫一下就给flag,结果被欺骗.呜呜呜 好了,还是使用编辑器看一下吧 发现了好玩的,U2FsdGVkX19QwGkcgD0fTjZxgijRzQOGbCWALh4sR ...
- 你知道怎么使用Google两步验证保护账户安全吗?
目录 为什么我们需要使用它? 对有些人来说,盗取密码比您想象的更简单 什么是Google两步验证? 多一道安全防线 什么是Google Authenticator ? 使用Google两步验证的好处 ...
- 身份证归属地查询免费api接口
描写叙述 :依据身份证编号 查询归属地信息. 调用地址: http://api.k780.com:88/? app=idcard.get&idcard=510103195309280011&a ...
- prometheus(7)之数据类型与PromQL语法
Prometheus的四种数据类型 counter (只增不减 计数) Gauge (常规数值 可变化大小) histogram (柱状图 小于上边界的 总数与次数) summary (分位数 小于 ...
- Django 中间件 详细总结
一.什么是中间件 中间件顾名思义,是介于request与response处理之间的一道处理过程,相对比较轻量级,并且在全局上改变django的输入与输出.因为改变的是全局,所以需要谨慎实用,用不好会影 ...
- PTA甲级1094 The Largest Generation (25分)
PTA甲级1094 The Largest Generation (25分) A family hierarchy is usually presented by a pedigree tree wh ...
- 经过4次优化我把python代码耗时减少95%
背景交代 团队做大学英语四六级考试相关服务.业务中有一个care服务,购买了care服务考试不过可以全额退款,不过有一个前提是要完成care服务的任务,比如坚持背单词N天,完成指定的试卷. 在这个背景 ...
- 反射的妙用:C#通过反射动态生成类型继承接口并实现
起因 最近想自己鼓捣个RPC,想着简化RPC调用方式,直接申明接口,然后根据接口的属性去配置RPC调用的相关信息.有一种说法叫申明式调用. 简单来说就是,申明一个interface,动态继承并实例化, ...
- 关于使用idea工具debug时,断点颜色由红色变成灰色
在使用断点调试的时候,发现断点由原来的红色变成灰色的,后来发现是由于错误操作将Debug断点t调试禁用了 ,只需要点击禁用按钮取消就可以了
- Part 29 AngularJS intellisense in visual studio
In the previous videos if you have noticed as we were typing the angular code in Script.js file we w ...