【GS文献】植物育种中基因组选择的方法、模型及展望
Genomic SelectioninPlant Breeding: Methods,Models,and Perspectives
国际玉米小麦改良中心(CIMMYT)José Crossa 2017年发表在《Trends in Plant Science》上的综述。
1. GS/GP在植物育种中的角色
过去的植物育种主要借助分子标记辅助选择法(MAS)来进行表型选择(Phenotype selection, PS)。对于简单性状,使用QTL关联标记具有主效应,但对复杂性状、多环境及不同遗传背景的应用则显得困难。QTL定位的连锁分析主要基于双亲群体,与性状关联的标记效应较低(染色体重组率低)。
研究者又开始专注于非双亲群体和染色体片段的精细定位(高重组率),但针对的是一些重要的经济性状。微效的QTL受环境影响大,但高密度SNP芯片给了标记性状关联准确性的希望。
基因组选择(Genomic selection,GS)或基因组预测(Genomic-enabledprediction,GP)利用了所有的分子标记来进行表型的选择。
GS/GP有两个方面应用:一是育种程式中早期世代的加性效应预测(比如双亲杂交的F2代选择),这种方法育种家更关注加性值(Additive values,BVs),而非整个遗传值,因此利用加性线性模型来评估标记效应就够了;另一个应用是预测个体的全部遗传值,同时考虑加性效应和非加性效应(显性和上位性效应)来评价品种的表现。使用多个环境的试验来预测品系的遗传值。
G矩阵特点是分子标记远大于群体数目(在机器学习中就是特征大于案例),预测的难度和训练群体大小、性状遗传力、分子标记数目有关。
GS流程:TRN训练群体(又称参考群体)需要表型和基因型,TST测试群体(又称候选群体)只需基因型。
GS和玉米常规DH育种比较:一年两季
2. GP模型应用
GP准确性受几个遗传因素影响:
- 训练群的大小和遗传多样性,以及与测试群的亲缘关系;
- 性状的遗传力。低遗传力和低标记效应的复杂性状对GS是适用的,但高遗传力的复杂性状很少能用高效应的少量标记来预测。
- 针对不具有LD的大量分子标记控制的复杂性状,GP准确性较低,当遗传力和训练群体大小增加时,准确性上升。
将环境因素考虑进模型,构建多性状、多环境的方差-协方差矩阵与环境、性状及其互作之间的遗传相关性。
GP模型中p>>n(标记远远大于群体)的特点使得鉴定困难,易出现过拟合,可通过惩罚回归、变量选择、降维以及赋予GP模型权重等方法来优化。(作者在文章附件中提供了GS模型复杂度及解决办法,但我没找到)
从GBLUP到神经网络,一堆废话描述。
3. GP模型的准确性
RR-BLUP,KinshipGAUSS,BayesCp,BayesB,BaysianLASSO,random forest,regression,RFR等各种模型对于目标性状的预测准确性还算好,也没有太大差异,但把群体结构等因素考虑进去,准确性并没有提升多少。
动物育种中GP的模型一般是基于单一环境,但在植物育种中GxE互作是影响非常大的。
GxE 互作:基因型与环境互作
MxE 互作:分子标记与环境互作
分解标记效应到每一个环境中,环境视为固定效应(不知道理解的是否正确,详细信息只有在附件中查看)
机器学习:
一些研究应用机器学习中的分类器,如多层感知机MLP、概率神经网络PNN等来预测个体表现(如分类上、中、下三等),AUC评价指标。
CIMMYT的实践:
与传统育种相比,GS目的就是以更低的成本和更少的时间来实现更大的遗传增益,CIMMYT已经在玉米的双亲和多亲群体中进行了GS实施,来快速提升遗传增益。(*具体如何实施需要找更详细的资料**)
4. 植物育种的GS展望
将多性状多环境的GS与高通量表型相结合:
高通量表型平台(High-ThroughputPhenotyping,HTP)减少表型调查的成本,同时与系谱结合起来提升准确性。
种质资源的GS应用:
种质资源骨干材料选择,结合多性状、多环境选择,提高种质资源基因库,以便后续直接使用。
5. 小结
- 线性模型(如GBLUP)和机器学习算法已经能识别复杂模式,做出正确决策;基于核的方法(如RKHS)已广泛应用于植物基因组预测;在GBLUP基础上结合基因组和系谱的GxE,优化的几种统计模型在预测个体的准确性方面有了提升。
- 使用HTP如高强度高光谱图像技术,结合早期测试中的基因组和系谱信息,共同用于统计模型,通过增加选择强度来加速遗传增益。
- 深度学习,如神经网络的方法似乎有望提高基因组预测。基因组选择超过了家系繁育和MAS增强复杂性状的遗传增益,具有明显的优势。
- 开发基因库登录的GP模型对于未开发的访问以及繁殖计划的多样性将很重要,以加快发展并释放新基因型。
这篇综述有点长,有点啰嗦,本身没提供太多信息,最有价值的部分可能是它的附件。当有需要时,可查看其中引用的相应文献。
【GS文献】植物育种中基因组选择的方法、模型及展望的更多相关文章
- 【GS文献】从家畜到植物,通过基因组选择提高遗传增益
目录 说明 1.前言 2.植物GS瓶颈 3.提高GS预测的准确性 4.GS与现代育种技术结合 5.GS开源育种网络 说明 Enhancing Genetic Gain through Genomic ...
- 【GS文献】测序时代植物复杂性状育种之基因组选择
综述:Genomic Selection in the Era of Next Generation Sequencing for Complex Traits in Plant Breeding 要 ...
- 【GS文献】基因组选择在植物分子育种应用的最新综述(2020)
目录 1. 简介 2. BLUP类模型 3. Bayesian类模型 4. 机器学习 5. GWAS辅助的GS 6. 杂交育种 7. 多性状 8. 长期选择 9. 预测准确性评估 10. GS到植物育 ...
- 【GS基础】植物基因组选择研究人员及数量遗传学发展一览
目录 1.GS研究 2.数量遗传发展 GS应用主要在国外大型动物和种企,国内仍以学术为主.近期整理相关学术文献,了解到一些相关研究人员,记录下备忘查询,但不可能全面. 1.GS研究 Theo Meuw ...
- 【百奥云GS专栏】全基因组选择之工具篇
目录 1. 免费开源包/库 1.1 R包 1.2 Python库 2. 成熟软件 3. WEB/GUI工具 前面我们已经介绍了基因组选择的各类模型,今天主要来了解一下做GS有哪些可用的软件和工具.基因 ...
- 【百奥云GS专栏】全基因组选择之模型篇
目录 1. 前言 2. BLUP方法 ABLUP GBLUP ssGBLUP RRBLUP 3. 贝叶斯方法 BayesA BayesB BayesC/Cπ/Dπ Bayesian Lasso 4. ...
- 【百奥云GS专栏】1-全基因组选择介绍
目录 什么是基因组选择? 基因组选择技术的发展 基因组选择的原理和流程 基因组选择的模型 基因组选择的展望 参考资料 什么是基因组选择? 基因组选择(Genomic Selection,简称GS)这一 ...
- 【GS文献】植物全基因组选择育种技术原理与研究进展
目录 1. 优势杂交育种预测 2. GS育种原理与模型算法 岭回归和LASSO回归 贝叶斯方法 GBLUP和RRBLUP 偏最小二乘法 支持向量机/支持向量回归 其他方法 3. 模型预测能力验证 4. ...
- 【GS文献】基因组选择技术在农业动物育种中的应用
中国农业大学等多家单位2017年合作发表在<遗传>杂志上的综述,笔记之. 作者中还有李宁院士,不胜唏嘘. 1.概述 GS的两大难题:基因组分型的成本,基因组育种值(genomic esti ...
随机推荐
- 大闸蟹的项目分析——CSDN APP
大闸蟹的软件案例分析 项目 内容 这个作业属于那个课程 班级博客 这个作业的要求在哪里 作业要求 我在这个课程的目标是 学习软件工程的相关知识 这个作业在哪个具体方面帮我实现目标 从多角度分析软件 一 ...
- Spring Cloud Alibaba 介绍及工程准备
简介 SpringCloud Alibaba是阿里巴巴集团开源的一套微服务架构解决方案. 微服务架构是为了更好的分布式系统开发,将一个应用拆分成多个子应用,每一个服务都是可以独立运行的子工程.其中涵盖 ...
- 《基于SD-SEIR模型的实验室人员不安全行为传播研究》
My Focus:基于SD-SEIR模型的实验室人员不安全行为的传播; 建模与实验仿真 Title: Study on Porpagation of Unsafe Bhavior of Laborat ...
- hdu 1506 Largest Rectangle in a Histogram(DP)
题意: 有一个柱状图,有N条柱子.每一条柱子宽度都为1,长度为h1...hN. 在这N条柱子所构成的区域中找到一个最大面积,每平方米3块钱,问最多赚多少钱. 输入: 1<=N<=10000 ...
- 面试官问我JVM内存结构,我真的是
面试官:今天来聊聊JVM的内存结构吧? 候选者:嗯,好的 候选者:前几次面试的时候也提到了:class文件会被类加载器装载至JVM中,并且JVM会负责程序「运行时」的「内存管理」 候选者:而JVM的内 ...
- C# StringBuilder和string
StringBuilder和string 1.string是引用类型还是值类型 MSDN官方说string是引用类型: 引用类型:引用分配栈内存,引用类型本身的数据存储在堆中: 值类型:在函数中创建, ...
- docker中镜像的作用
镜像原理镜像 镜像到底是什么?镜像是一种轻量级.可执行的独立软件包,用来打包软件运行环境和基于运行环境开发的软件,它包含运行某个软件所需的所有内容,包括代码.运行时.库.环境变量和配置文件.1.Uni ...
- 攻防世界 WEB 高手进阶区 easytornado Writeup
攻防世界 WEB 高手进阶区 easytornado Writeup 题目介绍 题目考点 Python模板 tornado 模板注入 Writeup 进入题目, 目录遍历得到 /flag.txt /w ...
- SQL注入之猫舍
第一步:先查看是否存在注入点:构造?id=1 and 1=1 回车后发现页面正常 构造?id=1 and 1=2 发现页面异常,得出结论:存在注入点 第二步:判断字段数 当输入order by 1和o ...
- Spark中资源调度和任务调度
Spark比MR快的原因 1.Spark基于内存的计算 2.粗粒度资源调度 3.DAG有向无环图:可以根据宽窄依赖划分出可以并行计算的task 细粒度资源调度 MR是属于细粒度资源调度 优点:每个ta ...