【豆科基因组】利马豆/洋扁豆Lima bean(Phaseolus lunatus L.)基因组2021NC
一、来源
单位:Departamento de Agronomía,Facultad de Ciencias Agrarias,哥伦比亚国立大学
菜豆属 Phaseolus genus中包含70个物种,其中5种被驯化,包括P. acutifolius A. Gray (tepary bean), P. coccineus L. (ayocote or runner bean), P. dumosus Macfady (num, piloy, or year bean), P. lunatus L. (Lima bean), and P. vulgaris L. (common bean),扁豆/利马豆 ( Phaseolus lunatus L. )和菜豆/普通豆P. vulgaris L. (common bean)是其中最重要的两种,都是2n = 2x = 22。扁豆营养丰富,含20%的蛋白质,50%以上的碳水化合物,与普通豆相比,它表现出对更广泛的生态条件适应性和干旱压力。虽然两个物种之间的已经被证明有高度共线性,扁豆依赖菜豆基因组参考序列可能会对下游多样性分析产生影响,导致信息丢失,甚至可能误导与性状相关的基因组位点的预测。
野生扁豆主要有三个基因库:两个中美洲(MI 和 MII)和一个安第斯 (AI) 基因库。起源中心尚未确定。扁豆至少有两个驯化过程,一个在中美洲,一个在安第斯山脉。安第斯驯化发生在基因库 AI 并产生了以大而扁平种子为特征的安第斯品种,第二个事件发生在墨西哥中西部的基因库 MI,并产生了具有圆形或椭圆形种子的中美洲品种。利马豆是趋同进化的一个很好的例子,因为中美洲和安第斯地方品种在驯化下进化出相似的特征,主要是更大的豆荚和种子,豆荚开裂减少或丧失,种子休眠丧失,确定的生长习性和抗营养种子化合物含量减少。
主要结果:
- 三代+二代+遗传图谱进行染色体水平基因组组装。
- 28,326 个基因模型的注释显示 1917 个基因具有与抗病性相关的保守域的高度多样性。
- 对 22,180 个与普通豆的直系同源物进行结构比较,揭示了高度共线性和五个大的染色体内重排。
- 种群多样性分析将扁豆聚成六个独立的亚群,中美洲地方品种可以进一步细分为三个子群。
- RNA-seq 数据分析发掘 4275 个差异表达的基因,与豆荚开裂和种子发育有关。
二、结果
扁豆的染色体水平高质量组装
材料G27455,来自哥伦比亚北部收集的中美洲基因库 MI 的驯化品系。
数据:WGS,GBS,10X,RNAseq
PacBio WGS初步组装,Illumina抛光,遗传图谱挂载。
a RIL 群体的利马豆参考基因组上按物理位置 (Mbp) 划分的遗传距离 (cM) 和重组率 (cM/Mbp)。染色体被标记为Pl01-Pl11。b 染色体长度和着丝粒周围区域。c 重复元素的密度。d 基因模型的密度。e SNP 的密度。f-i RIL 群体中筛选出的四个不同性状的 QTL 的 LOD 分数。彩色区域LOD大于 3,determinacy (绿色)、开花时间(蓝色)、百粒重(红色)和挥发性氰化物(黄色) 。j RIL 群体中性状的表型分布,垂直线表示亲本表型。
BUSCO评估98.8%。
重复序列注释基于 796个TE的菜豆库。共656,928 events were identified covering 225 Mbp (41% of the assembly)。这些区域的一半以上 (174 Mbp) 被长末端重复序列 (LTR) 覆盖。
三个组织两个发育阶段的RNAseq结合菜豆公开的阿RNAseq数据,共预测了28,326个基因和 35,881 个转录本,基因和蛋白质长度的分布与菜豆的基因注释一致。
GO注释率76%,功能类别包括对压力的反应、不同的代谢过程、运输、解剖结构发展、信号转导、细胞成分组装和体内平衡;KEGG注释率80%。93%的基因至少在一个RNAseq数据集中表达,78%的基因与菜豆直系同源基因具有共线性,即95%的基因模型有直接证据。
扁豆相关农艺性状的QTL定位
Determinacy(不知怎么翻译~)和三个数量性状(开花时间,FT;百粒重,HSW;和氰化物含量),四个性状在双亲群体中鉴定出九个QTL(见circos图),分别说明。
直系/旁系同源的演化和物种形成事件
预测蛋白相互比对来构建3499个旁系同源簇,代表着从不同基因组进化过程产生的基因家族。旁系同源关系的分类和染色体间同线性分析揭示了 1647 个具有旁系同源的基因,这些基因是由豆科历史上记载的古代全基因组复制事件产生的。从这些旁系同源物中推断出的染色体配对与菜豆基因组是一致的(cricos图中中间连线)。
总共有 7285 个基因的染色体内复制事件。即使去除了高度重复的基因(具有十多个旁系同源物),仍有 5849 个基因参与了染色体内复制事件。它们的Ks 值明显小于全基因组重复 (WGD) 旁系同源物的 Ks 值,说明染色体内复制比WGD 旁系同源物更新。通过计算旁系同源物对之间的 Ka/Ks 比率来评估两种类型的旁系同源物之间的蛋白质进化,以确定选择模式。与 Ks 值相反,染色体内复制的 Ka/Ks 值显着大于 WGD 旁系同源物,这意味着这些重复比 WGD 旁系同源物发散得更快。此外,12% 的局部重复似乎经历了快速序列发散,显示 Ka/Ks 比值高于 1。
根据扁豆和菜豆两个物种和同线性块之间的直系同源物的鉴定,对它们的基因组进行了比较。可以鉴定出 25,564 (94%) 个菜豆P. vulgaris基因和 26,009 (92%) 个扁豆P. lunatus基因的直系同源物。二者具有高度共线性。最重要的结构事件是:染色体 P110 短臂的倒位和 Pv02 着丝粒周围区域在染色体 P102 短臂内的大量易位。其中一些重排可能与生殖隔离有关。
a Ks 和b Ka/Ks 统计数据用于P. lunatus和G. max旁系同源物,以及P. lunatus和P. vulgaris之间的直向同源物以及P. lunatus和V. unguiculata之间的直向同源物。WGD:全基因组复制。样本大小 (N) 对应于基因对。c P. lunatus和P. vulgaris之间染色体共线性重排。P. lunatus染色体被标记为 Pl01-Pl11,而P. vulgaris染色体被标记为 Pv01-Pv11。d 染色体中抗性基因同源物的数量。e NJ 树图显示 LRR 型抗性基因之间的遗传变异性。浅蓝色是具有 NB-ARC 和 LRR 域的蛋白质,紫色是具有 TIR、NB-ARC 和 LRR 域的蛋白质,橙色是具有 TIR 和 LRR 域的蛋白质。
与农艺性状相关基因的直系同源物
通过与其他作物中农艺性状相关基因的直系同源关系预测农艺兴趣基因,确定了 30 个基因的扁豆直系同源物,其中 27 个在普通豆中报告。
分布在 11 条染色体上的 1917 个基因与基于生物信息学分析预测的生物胁迫抗性以及 LRR(富含亮氨酸的重复序列)和其他重要的抗病域(如 Toll/白细胞介素)存在相关。此外,631 个基因包含 LRR 结构域,151 个基因包含 NB-ARC 结构域,以及 91 个两个结构域。大量预测的抗病基因定位于染色体Pl02、Pl04、Pl08、Pl10和Pl11。
具有 LRR 结构域的基因子集倾向于聚集在基因组的离散区域中。对于大多数与生物胁迫抗性相关的预测基因,鉴定了常见的豆类直系同源物,它们位于相同的染色体上并具共线性。
群体结构分析揭示扁豆遗传簇
结合先前分析的来自 270 个利马豆种质的GBS数据,使用 212 个额外样本的 GBS 数据来增加数据量。从原始的 116,030 个双等位基因 SNV 中,选择了 12,398 个进行多样性分析。
应用了不同的统计和启发式聚类分析,包括 NJ、主成分判别分析 (DAPC) 和贝叶斯聚类 (STRUCTURE)。根据 BIC 的减少,最佳簇数在K = 5 和K = 6 之间,而 STRUCTURE 结果表明最佳K为 6。
在野生种质中,MI 种质根据其地理来源分为两个亚组:一个亚组(紫色簇)包括 55 个种质;另一个亚组亚组(粉红色簇)包括 34 个种质。MII 种质也被分为两个亚群:其中一个(浅绿色集群),另一个(深绿色)。
Fst 值显示基因库之间的高度遗传分化,与此一致,单倍型基因渗入分析将大部分种质聚集在其各自的基因库中。图 3d显示了 58 个大于 5 Mbp 的染色体片段,并在 15 个种质中观察到。这些片段中的大多数代表中美洲基因库(MI 和 MII)之间或安第斯基因库(AI 和 AII)之间的遗传贡献,而在中美洲和安第斯基因库之间的遗传贡献较少。可能是野生和驯化品系之间或不同来源的驯化品系之间最近接触的结果。
对美洲收集的 482 个野生和驯化扁豆种质之间的遗传变异性进行结构分析。
a 野生种质(从左到右)成南北地理模式。DOM 驯化,MEX 墨西哥,GUA 危地马拉,CR 哥斯达黎加,COL 哥伦比亚。显示了加入基因库 MI、MII、AI 或 AI 的分类。
b 野生和驯化品系不同亚群内的连锁不平衡衰减。DOM 驯化,DOM-AND 安第斯地方品种。
c 根据fineSTRUCTURE 进行的分析,482 个种质的径向聚类。主要基因库以不同颜色显示(紫色簇:来自墨西哥西北部(北墨西哥)的野生 MI;粉色簇:来自墨西哥西南部(南墨西哥)的野生 MI;中蓝色簇:来自南美洲的驯化 MI;深色蓝色簇:来自墨西哥和中美洲 (MEXICO/CA) 的驯化 MI;浅蓝色簇:来自尤卡坦半岛的驯化 MI;黄色簇:AII 基因库;红色簇:AI 基因库;绿色簇:来自中部尤卡坦半岛的 MII 基因库美国和哥伦比亚 (YUCATAN COL-CR);浅绿色簇:来自墨西哥南部和中部的 MII 基因库。
d 一组 15 个野生和驯化品系中不同基因库贡献的染色体片段分布。野生种质以粗体标记。利马豆染色体被标记为Pl01-Pl11。
豆荚发育过程中的基因表达
豆荚开裂的减少或丧失是利马豆的关键驯化性状之一。 RNA-seq 分析了一个野生和一个驯化品种在豆荚伸长开始 (T1) 和种子灌浆前 (T2) 的表达水平。差异表达 (DE) 分析揭示了总共 4275 个基因在整个发育阶段或野生和驯化种质之间具有差异表达模式。基于这些值的分层聚类区分了遵循不同表达模式的五个和七个基因簇。
先前鉴定为与豆荚开裂相关的基因,PDH1基因显著增加了 T1 和 T2 之间的表达。
驯化种质比野生种质(特别是在 T1 时)具有更多基因的表达值增加,并且表达增加的基因数量大于数量在 T1 和 T2 之间表达降低的基因,特别是在野生种质中。
a 具有差异表达的基因内标准化表达值的热图。左树状图对应于基于标准化表达值的基因的无监督层次聚类。
b 驯化种质(蓝色)和野生种质(红色)中PlPDH1基因在两个发育时期的表达轨迹。
c 一种野生和驯化品系之间以及两个发育时期之间具有差异表达 (DEG) 的基因数量。
d 功能类别的概念图,丰富了仅在野生种质中在第二次发育时间表达更多的基因。
【豆科基因组】利马豆/洋扁豆Lima bean(Phaseolus lunatus L.)基因组2021NC的更多相关文章
- 【豆科基因组】普通豆/菜豆/四季豆Common bean (Phaseolus vulgaris L.) 基因组
目录 研究一:G19833组装,2014NG 研究二:BAT 93组装,2016 genome biology 菜豆属(Phaseolus L.)为同源二倍体作物,包含有80 多个物种,多数为野生种, ...
- 【豆科基因组】普通豆/菜豆/四季豆Common bean (Phaseolus vulgaris L.) 683个自然群体重测序2020NG
目录 一.来源 二.结果 683份材料重测序 地方种landraces和育种品系breeding lines的多样性 表型和基因-环境互作(G by E) 菜豆产量潜力相关的MTAs(显著关联位点) ...
- 【豆科基因组】豇豆Cowpea,Vigna unguiculata [L.] Walp.基因组2019PJ
目录 来源 结果 基因组大小估计 采用stitching方法组装 修改豇豆染色体编号 基因注释和重复DNA 豇豆遗传多样性 SNP和INDEL Vu03 上 4.2-Mb 染色体倒位的鉴定 与其他暖季 ...
- 【豆科基因组】绿豆Mungbean, Vigna radiata基因组2014NC
目录 来源 一.简介 二.结果 基因组组装 重复序列和转座子 基因组特征和基因注释 绿豆的驯化 豆科基因组复制历史 基于转录组分析的豇豆属形成 绿豆育种基因组资源 三.讨论 四.方法 材料 组装 SN ...
- 【豆科基因组】大豆(Soybean, Glycine max)泛基因组2020Cell
目录 一.前沿概述 二.主要结果 重测序.组装与注释 泛基因组 SV特征 PAV与古多倍化,WGD事件 基因SV与基因融合 SV与大豆驯化 SV影响基因表达及其与性状关联 一.前沿概述 Pan-Gen ...
- 【转】Spring bean处理——回调函数
Spring bean处理——回调函数 Spring中定义了三个可以用来对Spring bean或生成bean的BeanFactory进行处理的接口,InitializingBean.BeanPost ...
- 全基因组测序 从头测序(de novo sequencing) 重测序(re-sequencing)
全基因组测序 全基因组测序分为从头测序(de novo sequencing)和重测序(re-sequencing). 从头测序(de novo)不需要任何参考基因组信息即可对某个物种的基因组进行测序 ...
- RNA-Seq基因组比对工具HISAT2
原文网址: http://blog.biochen.com/archives/337 HISAT2是TopHat2/Bowti2的继任者,使用改进的BWT算法,实现了更快的速度和更少的资源占用,作者推 ...
- spring bean的作用域和自动装配
1 Bean的作用域 l singleton单列:整个容器中只有一个对象实例,每次去访问都是访问同一个对象 默认是单列 l prototype原型: 每次获取bean都产生一个新的对象,比如Ac ...
随机推荐
- Coursera Deep Learning笔记 改善深层神经网络:超参数调试 Batch归一化 Softmax
摘抄:https://xienaoban.github.io/posts/2106.html 1. 调试(Tuning) 超参数 取值 #学习速率:\(\alpha\) Momentum:\(\bet ...
- [对对子队]会议记录4.14(Scrum Meeting 5)
今天已完成的工作 刘子航 工作内容:设计第2,3关 相关issue:设计关卡2,3 吴昭邦 工作内容:制作场景,暂时解决了坐标错位问题 相关issue:实现游戏场景中的必要模型 何瑞 ...
- Spring Cloud Alibaba 的服务注册与发现
Spring Cloud Alibaba 服务发现例子 一.需求 1.提供者完成的功能 2.消费者完成的功能 3.可以附加的额外配置 二.实现步骤 1.总的依赖引入 2.服务提供者和发现者,引入服务发 ...
- spring security实现简单的url权限拦截
在一个系统中,权限的拦截是很常见的事情,通常情况下我们都是基于url进行拦截.那么在spring security中应该怎么配置呢. 大致步骤如下: 1.用户登录成功后我们需要拿到用户所拥有的权限,并 ...
- stm32f103中断学习总结
一.NVIC 介绍 NVIC 英文全称是 Nested Vectored Interrupt Controller,中文意思就是嵌套向量中断控制器,它属于 M3 内核的一个外设,控制着芯片的中断相关功 ...
- 密码学基础:AES加密算法
[原创]密码学基础:AES加密算法-密码应用-看雪论坛-安全社区|安全招聘|bbs.pediy.com 目录 基础部分概述: 第一节:AES算法简介 第二节:AES算法相关数学知识 素域简介 扩展域简 ...
- ST表 求 RMQ(区间最值)
RMQ即Range Minimum/Maximun Query,中文意思:查询一个区间的最小值/最大值 比如有这样一个数组:A{3 2 4 5 6 8 1 2 9 7},然后问你若干问题: 数组A下标 ...
- docker 简单总结
一.docker 安装 yum 方式在centos和rhce上的安装条件: 要安装Docker引擎,你需要一个维护版本的CentOS 7或8.不支持或测试存档版本.必须启用centos-extras存 ...
- ACL实验
ACL实验 基本配置:略 首先根据题目策略的需求1,从这个角度看,我们需要做一条高级ACL,因为我们不仅要看你是谁,还要看你去干什么事情,用高级ACL来做的话,对于我们华为设备,只写拒绝,因为华为默认 ...
- ucharts tooltip弹窗自定义换行
这个东西吧,也许是因为菜,看了3小时,下面给出解决方案 1. 找到源码下面的这个文件 2. 增加绿色方框中的代码 3.组件调用的时候有一个opts属性 :opts="{ extra: { t ...