来源

The genome of cowpea (Vigna unguiculata [L.] Walp.). Plant J

. 2019 Jun;98(5):767-782. doi: 10.1111/tpj.14349.

单位：University of California Riverside

豇豆（Vigna unguiculata），与绿豆（Vigna radiata）、小豆（ Vigna angularis ）同属于豇豆属 Vigna。

菜豆科家族Phaseoleae tribe (soybean, common bean, adzuki bean, mung bean, pigeon pea and cowpea)

豇豆在非洲驯化，从那里传播到各大洲，现在亚洲、欧洲、美国以及中南美洲的许多地方普遍种植。豇豆的优势之一是对恶劣条件，如炎热干燥的环境和贫瘠的土壤的高度恢复能力。

豇豆染色体数为 2 n = 22，之前估计的基因组大小为 613 Mb。其基因组与其他暖季豆科植物（菜豆科家族）具有高度共线性。之前使用二代+BAC组装了一个品系 IT97K-499-35 的碎片化草图。

结果

基因组大小估计

流式细胞仪估计大小640.6 Mb。

kmer评估大小 560.3 Mb。kmer 估计会因PCR 引入的错误导致的低拷贝 k-mer 的高估、基因家族中重复的 k-mer 和保守基序的计数不足以及 k-mer 的大量低估而带来不准确。因此本研究采用640.6 Mb。

采用stitching方法组装

PacBio测序91.7X，采用CANU、Falcon、 ABruijn等多种方法组装，再结合Bionano拼接合并。最后使用通过使用ALLMAPs将44 003 个SNP锚定到11条假染色体上。锚定大小473.4Mb(91.1%)。GC含量与其他豆科类似。

评估组装质量：

约168M 149-bp paired reads比对率98.92%；
之前二代组装的129 000 contigs (500 bp or longer)比对率99.69%；
之前组装的178 000 个BAC比对率99.95%；
约157 000 transcripts比对率99.95%；
采用BLASR 将原始的PacBio 5.29 M reads比对率88.68%

修改豇豆染色体编号

通过豇豆和菜豆（普通豆）的同线性，修改染色体编号，并将部分染色体方向翻转。

基因注释和重复DNA

豇豆EST+根茎叶花种子RNAseq，拟南芥、普通豆、大豆、紫花苜蓿、杨树、水稻和葡萄的蛋白质序列，结合从头预测，共注释了 29 773 个蛋白质编码位点，以及 12 514 个可变剪接的转录本。

BUSCO评估95.9%。

重复序列注释估计 49.5% 组成：39.2% 的转座元件 (TE)、4% 的简单序列重复 (SSR) 和 5.7%未识别的低复杂度序列。

着丝粒区域是基于 455 bp 串联重复序列定义的，该重复序列先前被 FISH 鉴定为豇豆着丝粒中含量丰富。包含该序列的区域跨越 20.18 Mb（组装基因组的 3.9%）

（a）红线代表着丝粒区域，基于 455-bp 串联重复比对；(b) 每 1 Mb 的重组率；(c) 1 Mb 窗口中的基因密度；(d) 在 1 Mb 窗口中重复覆盖；(e) 1 Mb 窗口中的SNP密度。

SNP分布和着丝粒位置推断

豇豆遗传多样性

SNP和INDEL

将前人研究的 36 个不同种质的二代测序数据比对到上一版本的基因组，共得到 957 710 个SNPs（1M），为将它们定位在豇豆新组装的参考基因组上，由 SNP 位置及其每侧 60 个碱基组成的 121 个碱基序列与参考基因组进行 BLAST比对，保留Top1，99.83%能比对上参考序列上，其中包括 Illumina iSelect Consortium Array芯片中49 697 SNPs ，约35% (336 285 SNPs)和基因相关。表明 iSelect 芯片设计对基因的预期偏见是可信的。

BreakDancer v.1.4.5 检测结构变异，共17 401 个插入和 117 403 个缺失。插入比缺失数量少得多，这可能反映了当reads比对到参考基因组时软件识别插入的能力有限。

Vu03 上 4.2-Mb 染色体倒位的鉴定

10张遗传图谱用于锚定和定向scaffold到假染色体上，其中7个表明有一些大片段区域存在倒位，而其他三个显示在同一区域无重组，表明杂交中的两个亲本具有相反的方向。为找到倒位断点，用一些之前的材料测序的contig比对，与参考基因组相同的共线性好，相反方向的则在断点之前对齐。证实了染色体倒位和参考序列中两个断点的位置：36 118 991 bp（断点 1）和 40 333 678 bp（断点 2），用于包含 242 个基因的 4.21-Mb 倒置。两个断点区域的 PCR 扩增进一步验证了这种反向。

使用 368 份不同的豇豆种质，包括 243 个地方品种和 97 个育种种质（含有 iSelect 芯片数据），用于估计种质之间的倒位频率。总共有 33 个材料 (9%) 与整个区域的参考基因组具有相同的 SNP 单倍型，即可能是相同的方向，其中 3 个是地方品种（占该组地方品种的 1.2%），而其他 30 个是包括参考基因组在内的育种材料。表明该区域的参考基因组方向在地方品种中很少见，并且其频率在育种材料中有所增加。

另外，这部分区域很少有重组，说明在栽培×野生杂交的遗传图谱中，野生与栽培种质的方向相反。因为这个培育的亲本与参考基因组具有相同的单倍型，因此大概也具有相同的方向，该区域缺乏重组表明与参考方向相反的方向是祖先（野生）类型。

豇豆和小豆的比较表明 IT97K-499-35 和小豆基因组组装在该区域具有相反的方向，这与豇豆参考基因组在该区域相对于野生豇豆种质中保留的祖先状态发生倒位的猜想一致，并且出现在同类物种中。

Comparison between the Vu03 chromosomal inversion region in cowpea (y-axis) and its syntenic region in Vigna angularis (vigan.Shumari). inverted segment (~36-41 Mbp in the V. angularis chromosome)

倒位的直接影响是抑制杂合子的重组，导致倒位区域独立进化。携带倒转的三个地方品种B-301（独脚金抗性供体）、 B-171、TVu-53。

探索倒位是否与独脚金抗性相关，将先前鉴定的该性状 QTL 的图谱位置与倒位位置进行比较。独脚金小种 1 和 3 抗性的 QTL 位于与 Vu03 倒位不同的染色体上，排除了倒位作为这些抗性的基础。然而，注意到高粱基因Sobic.005G213600通过存在/缺失变异调节独脚金抗性编码与豇豆基因Vigun03 g220400同源的磺基转移酶，其位于 Vu03 上的倒位区域内，并在根组织中高表达。因此，包含Vigun03 g220400的区域似乎可能以尚未发现的方式影响独脚金相互作用。

此外，豆荚数的 QTL位于倒位区域内。

与其他暖季豆科植物共线性分析

对豇豆及其近亲小豆( Vigna angularis )、绿豆( Vigna radiata )和普通豆( P. vulgaris )进行共线性分析。

两种豇豆的保守程度高于普通豆（菜豆）。六条豇豆染色体（Vu04、Vu06、Vu07、Vu09、Vu10 和 Vu11）在所有其他三个物种中基本上与单条染色体具有同线性。Vu02、Vu03 和 Vu08 也与其他两种豇豆属一对一关系，但与菜豆一对二关系，表明这些染色体重排是豇豆与菜豆不同的特征。剩余的豇豆染色体 Vu01 和 Vu05 具有可变的共线性关系，其他三个物种中的每一个都有两条染色体，表明这些染色体重排是豇豆属物种形成的更多特征。还应该注意的是，在这些物种之间具有一对二关系的大多数染色体与涉及着丝粒区域的易位一致。

在这些共线性关系的基础上，对小豆、绿豆和可能的其他豇豆采用修订后的豇豆染色体编号物种将是直接的，有利于促进目标性状的基因组信息从一个物种到另一个物种的相互转化。

(a) 小豆 (Va ; Vigna angularis )；(b) 绿豆（Vr；Vigna radiata）；(c)使用修改后的豇豆染色体编号系统的普通豆 (Pv; Phaseolus vulgaris )

重复元素和基因组扩张

先前的分析表明豇豆在系统发育上更接近绿豆 (Vr) 而不是红豆 (Va)，尽管 Va 和 Vr 基因组的大小相对相似，豇豆分别大 11% 和 12%。

将 Vu 与 Vr 进行比较，94% 的 56 Mbp 大小差异可以通过 TE 的差异含量来解释，57% 可以通过单独的超家族Gypsy逆转录转座子的差异含量来解释。

和普通豆进行了类似的比较，虽然组装的基因组小（ 473 Mb （9%）），但TE含量更高，45.2% versus 39%。有可能是P. vulgaris的 contig N50=0.395 Mb，而 Vu = 10.9 Mb。真正的P. vulgaris基因组比 Feulgen 密度测定法估计的要大得多，其中大部分 TE 影响了组装。

跨物种比较表明，豇豆基因组大小的差异在很大程度上可以通过 TE 含量来解释，尤其是Gypsy逆转录转座子的含量。这可能是由于最近的差异扩张或古代插入的差异保留造成的。

豇豆基因家族变化

为了鉴定豇豆中拷贝数显着增加或减少的基因，来自豆科植物信息系统的 18 543 个科 ( https://legumeinfo.org/search/phylotree和https://legumeinfo.org/data/public/Gene_families/) 进行了分析。该集合的构建是为了捕获源自豆科植物分类深度的基因，基于直系关系和豆科植物和外群物种的每个物种同义位点率。这些科包括 14 种豆科植物，其中 6 种来自菜豆族（大豆、普通豆、红豆、绿豆、木豆和豇豆）。在豇豆基因成员相对于每个豆科植物物种的平均成员处于最高百分位的 185 个基因家族中，这些家族包括以下超家族组中的几个：NBS-LRR 抗病基因、各种受体样蛋白激酶、防御素、核糖体蛋白、NADH-醌氧化还原酶成分。所有这些家族都出现在基因芯片中，它们可能通过旁系同源基因的跳跃错配而扩张或收缩。

在18 543个豆科植物基因科中，有2 520个科没有豇豆基因成员，这与菜豆科其他6个已测序基因组的平均无成员家庭数（3 057个）相当。2520 个“无豇豆”家族富含以下超家族：UDP-糖基转移酶、枯草杆菌蛋白酶样丝氨酸蛋白酶、几个激酶超家族、几个可能的逆转录转座子相关家族、FAR1 相关蛋白和 NBS-LRR 抗病家族。

SAUR 样生长素超家族在豇豆中包含 138 个注释基因，而在红豆和绿豆中分别为 90 和 52 个。NBS-LRR 超家族包含 402 个注释基因，而红豆和绿豆中分别为 272 和 86 个。

多器官增大候选基因的鉴定

作物驯化通常涉及人类收获的特定器官的大小增加。最近有研究使用源自驯化×野生杂交的重组近交系（RIL）群体在 Vu08 上鉴定了与豇豆器官大小增加相关的基因组区域。该区域包含一组关于豆荚长度、种子大小、叶长和叶宽的 QTL（CPodl8、CSw8、CLl8、CLw8）。

这里使用参考基因组序列用于进一步研究这个驯化热点，跨越 2.21 Mb 包括 313 个基因。鉴定了普通豆基因组中的共线区域，其中最大的区域位于普通豆染色体 8 (Pv08) 上。该区域总共包含 289 个常见的豆类合成基因，然后将其与 Schmutz等人提供的与驯化相关的常见豆类基因列表进行比较。这两个列表的交集仅包含一个基因Phvul.008G285800，这是一个与豇豆Vigun08 g217000相对应的用于增加种子大小的普通豆候选基因.，该基因编码组氨酸激酶 2，在多种豇豆组织中表达，包括根、种子、豆荚和叶。拟南芥直系同源AHK2 ( AT5G35750.1 ) 是一种细胞分裂素受体，已被证明可调节植物器官大小等。因此Vigun08 g217000是进一步研究的候选基因。

【豆科基因组】豇豆Cowpea，Vigna unguiculata [L.] Walp.基因组2019PJ的更多相关文章

【豆科基因组】大豆(Soybean, Glycine max)泛基因组2020Cell
目录一.前沿概述二.主要结果重测序.组装与注释泛基因组 SV特征 PAV与古多倍化,WGD事件基因SV与基因融合 SV与大豆驯化 SV影响基因表达及其与性状关联一.前沿概述 Pan-Gen ...
【豆科基因组】绿豆Mungbean, Vigna radiata苏绿基因组预印
目录一.来源二.结果测序组装组装评价编码基因预测基因功能注释非编码RNA注释假基因预测重复序列注释进化分析和分歧时间估计全基因组复制 LTR插入时间估计正选择基因一.来源 H ...
【比较基因组】McScan jcvi比较两个基因组共线性细节记录
目录软件的安装基因组的准备一些细节建议和示例软件的安装 Python版McScan(jcvi工具包):https://github.com/tanghaibao/jcvi 以前只有pytho ...
【豆科基因组】绿豆Mungbean, Vigna radiata基因组2014NC
目录来源一.简介二.结果基因组组装重复序列和转座子基因组特征和基因注释绿豆的驯化豆科基因组复制历史基于转录组分析的豇豆属形成绿豆育种基因组资源三.讨论四.方法材料组装 SN ...
【豆科基因组】大豆(Soybean, Glycine max)经典文章梳理2010-2020
目录 2010年1月:大豆基因组首次发表(Nature) 2010年12月:31个大豆基因组重测序(Nature Genetics) 2014年10月:野生大豆泛基因组(Nature Biotechn ...
全基因组测序从头测序(de novo sequencing) 重测序(re-sequencing)
全基因组测序全基因组测序分为从头测序(de novo sequencing)和重测序(re-sequencing). 从头测序(de novo)不需要任何参考基因组信息即可对某个物种的基因组进行测序 ...
【基因组组装】HiC挂载软件以及如何用Juice_box手工纠错？
目录 1.常用HiC挂载软件 2. Juice_box手工纠错 1.常用HiC挂载软件 ALLHiC 张兴坦老师专为多倍体和高杂合度物种基因组挂载开发.如果是复杂基因组,肯定是首选.对于简单基因组,我 ...
【转】NG：垂枝桦基因组图谱构建（2+3组装）及重测序分析
转自希望组公众号.学习二代+三代组装策略的流程垂枝桦(Betula pendula)是一种速生乔木,能在短短一年时间内开花,木质坚实,可做细工.家具等,经济价值极高.近日,芬兰研究人员对垂枝桦自交系 ...
基因组Denovo组装原理、软件、策略及实施
目录 1. 组装算法 1)基于OLC算法 2)基于DBG算法 3)OLC vs DBG 2. 组装软件 3. 组装策略 4. 组装项目实施 1)测序前的准备 2) 测序样品准备 3)测序策略的选择 4 ...

随机推荐

【c++ Prime 学习笔记】第8章 IO库
C++语言不直接处理输入输出,而是通过标准库中的一组类来处理IO 1.2节介绍的IO库: istream(输入流)类型,提供输入 ostream(输出流)类型,提供输出 cin,是istream对象, ...
sqlmap--tamper使用技巧
apostrophemask.py 适用数据库:ALL 作用:将引号替换为utf-8,用于过滤单引号使用脚本前: tamper("1 AND '1'='1") 使用脚本后: 1A ...
Java：并发笔记-03
Java:并发笔记-03 说明:这是看了 bilibili 上黑马程序员的课程 java并发编程后做的笔记 3. 共享模型之管程-2 本章内容-2 Monitor wait/notify 3.6 ...
seata整合多数据源
seata整合多数据源一.背景二.整合步骤 1.seata server的搭建 2.引入数据源切换组件 3.引入seata组件 4.配置多数据源 5.关闭seata自己默认的数据源代理 6.配置s ...
TVS管性能及选型总结
https://wenku.baidu.com/view/5b5bda5526fff705cc170af8.html
《基于SIR的路边违停行为传播模型研究》
My Focus: 路边违停行为的传播模型; 学习基于SIR XXX模型的可行性分析.建立和结论分析 Author: 左忠义,王英英,包蕴 Mind Map:
树莓派-openeuler安装
一.安装准备 1.硬件安装 2.下载openeuler镜像 3.sd卡格式化 sd格式化工具 4.镜像校验二.镜像烧写选择树莓派官方烧写工具,耐心等待... 三.网络配置 1.寻找树莓派的ip地址 ...
恶意代码分析实战四：IDA Pro神器的使用
目录恶意代码分析实战四:IDA Pro神器的使用实验: 题目1:利用IDA Pro分析dll的入口点并显示地址空格切换文本视图: 带地址显示图形界面题目2:IDA Pro导入表窗口题目3:交 ...
开发笔记-----Ajax 基础使用
一.GET 方式的用法: 1  2 <div class="layui-form"> 3 <div class="l ...
禁用root直接远程登录，使用普通账号登录后再切换root
1.创建一个普通用户 #useradd test 2.给test设置密码 #passwd test 3.禁用root远程登录 #vim /etc/ssh/sshd_config #PermitRoot ...

【豆科基因组】豇豆Cowpea，Vigna unguiculata [L.] Walp.基因组2019PJ

来源

结果