一、前沿概述

Pan-Genome of Wild and Cultivated Soybeans

DOI:10.1016/j.cell.2020.05.023


2020年田志喜老师和梁承志老师强强联合发表大豆泛基因组,这篇文章具有里程碑意义,预示着作物泛基因组时代到来。今年水稻泛基因组同样的策略发在cell。

大豆泛基因组的研究:

  • 大豆基因组:2010年,Schmutz等发表了栽培大豆第一个reference genome Williams 82(Wm82)。2018年,田志喜老师等对我国栽培面积最广的大豆品种“中黄13”(Zhonghuang 13,ZH13)进行从头组装测序,并于2019年对ZH13基因组再次优化。2019年,Xie等发表了野生大豆W05基因组。对这三个基因组进行比较分析发现,在不同品种的基因组间存在大量的PAVs和CNVs。
  • 2014年,邱丽娟老师等利用二代测序构建了7个野生大豆的泛基因组。
  • 2020年,26份大豆泛基因组发表(本研究)。
  • 2021年,加拿大拉瓦尔大学在Plant Biotechnology Journal上发表了题为The Pan-genome of the Cultivated Soybean (PanSoy) Reveals an Extraordinarily Conserved Gene Content 的研究成果,描述了一个栽培大豆(Glycine max)的泛基因组—PanSoy;发现了核心基因组中高度保守的基因含量,为大豆基因组学研究和育种奠定了基础。

本研究示意图:

本研究主要结果:

  • 对来自世界大豆主产国的2898个大豆种质材料进行了深度重测序和群体结构分析,精心挑选出26个最具代表性的大豆种质材料,包括3个野生大豆,9个农家种和14个现代栽培品种。
  • 采用最新组装策略,对26个大豆种质材料进行了高质量的基因组从头组装和精确注释,contig N50平均长度达22.6 Mb, scaffold N50 平均长度达 51.2 Mb。
  • 在此基础上,结合已经发表的中黄13、Williams 82 和 W05 基因组,开展了系统的基因组比较,构建了高质量的基于图形结构泛基因组,挖掘到大量利用传统基因组不能鉴定到的大片段结构变异。
  • 经深入分析发现,结构变异在重要农艺性状调控中发挥重要作用:例如,HPS基因的结构变异调控大豆种皮亮度变化;野生与栽培大豆CHS基因簇的结构变异是导致种皮颜色由黑色向黄色驯化的主要原因;SoyZH13_14G179600基因结构变异导致了其在不同种质材料中基因表达的差异,可能与调控大豆缺铁失绿症有关。
  • 此外,研究还鉴定到15个结构变异导致了不同基因间的融合,这为新基因的产生研究提供了重要线索。

此高质量图形结构泛基因组的构建不仅本身具有重要的理论意义和应用价值,同时为过去已经开展的大量重测序数据提供了一个全新的分析平台,将使得这些数据获得“第二次生命”。

黄三文老师对此研究的评述文章:

360度群体遗传变异扫描——大豆泛基因组研究

二、主要结果

重测序、组装与注释

  • 2898份大豆重测序,SNP检测,群体分析

  • 26份材料PacBio+光学图谱+HiC+Illumina从头组装。平均Contig N50: 22.6Mb,Genome: 1011.6Mb。

  • 注释重复序列占到54.4%,其中LTR比例最大。每个基因组平均鉴定到56,552个蛋白编码基因,BUSCO:95.6% 。

  • 29份和2898份材料变异图谱

  • denovo与重测序的相关性

    Correlation of SNP density, p, dN, and dS from 29 de novo assembled genomes and 2,898 resequenced accessions

泛基因组

  • 核心与非核心基因

  • 注释与多样性

SV特征



  • 具体特征统计

  • 功能

  • PAV的GWAS:种子光泽示例

PAV与古多倍化,WGD事件

WGD与非WGD区域的基因和SV特征比较。

基因SV与基因融合



SV与大豆驯化

大豆中I Locus的演化。

The classically defined I locus is an important domestication locus responsible for the changes in seed coat color from black to colorless

CHS基因:reduced chalcone synthase(CHS) gene



野生大豆和栽培大豆在7号染色体的一个倒位可能与驯化相关。

SV影响基因表达及其与性状关联

不同材料中铁效率QTL候选基因的SV

文章的信息量很大,这里只是囫囵吞枣放了几张图。开创性的研究才是佳作,我辈只能模仿。

【豆科基因组】大豆(Soybean, Glycine max)泛基因组2020Cell的更多相关文章

  1. 【豆科基因组】大豆(Soybean, Glycine max)经典文章梳理2010-2020

    目录 2010年1月:大豆基因组首次发表(Nature) 2010年12月:31个大豆基因组重测序(Nature Genetics) 2014年10月:野生大豆泛基因组(Nature Biotechn ...

  2. 【豆科基因组】绿豆Mungbean, Vigna radiata基因组2014NC

    目录 来源 一.简介 二.结果 基因组组装 重复序列和转座子 基因组特征和基因注释 绿豆的驯化 豆科基因组复制历史 基于转录组分析的豇豆属形成 绿豆育种基因组资源 三.讨论 四.方法 材料 组装 SN ...

  3. 基因家族收缩和扩张分析 & Selective loss pathway & 泛基因组

    套路 这通常就是基因组组装后的必做分析,通过比较基因组学的手段进行分析,可以知道所研究物种在进化过程中哪些核心基因家族发生了变化,从而导致了其特殊的适应性机制的形成. 参考: Extremotoler ...

  4. 植物基因组|注释版本问题|重测序vs泛基因组

    生命组学: 细菌和其他物种比,容易发生基因漂移,duplication和重排. 泛基因组学研究的一般思路是通过comparison找到特殊基因区域orspecific gene,研究其调控机制(即通过 ...

  5. 常用数据库ID格式

    转自:http://www.biotrainee.com/thread-411-1-1.html 常用数据库 ID ID 示例 ID 来源 ENSG00000116717 Ensemble ID GA ...

  6. 常用生物信息 ID 及转换方法

    众多不同的数据库所采用的对 Gene 和 Protein 编号的 ID 也是不同的, 所以在使用不同数据库数据的时候需要进行 ID 转换. 常用数据库 ID ID 示例 ID 来源 ENSG00000 ...

  7. 【豆科基因组】大豆适应性位点GWAS分析 [转载]

    目录 材料与方法 结果分析 本文利用99085个高质量SNP 通过STRUCTURE,PCA和neighbour-joining tree的群体结构分析将地方品种分为三个亚群,这些亚群表现出地理上的遗 ...

  8. 【豆科基因组】利马豆/洋扁豆Lima bean(Phaseolus lunatus L.)基因组2021NC

    目录 一.来源 二.结果 扁豆的染色体水平高质量组装 扁豆相关农艺性状的QTL定位 直系/旁系同源的演化和物种形成事件 与农艺性状相关基因的直系同源物 群体结构分析揭示扁豆遗传簇 豆荚发育过程中的基因 ...

  9. 【豆科基因组】小豆(红豆)adzuki bean, Vigna angularis基因组2015

    目录 一.来源 研究一:Draft genome sequence of adzuki bean, Vigna angularis 研究二:Genome sequencing of adzuki be ...

随机推荐

  1. [no code][scrum meeting] Beta 1

    $( "#cnblogs_post_body" ).catalog() 会议纪要 会议在微信群进行:集体反思alpha阶段博客分数尤其是scrum博客分数低的问题,讨论beta阶段 ...

  2. 并发编程从零开始(九)-ConcurrentSkipListMap&Set

    并发编程从零开始(九)-ConcurrentSkipListMap&Set CAS知识点补充: 我们都知道在使用 CAS 也就是使用 compareAndSet(current,next)方法 ...

  3. C语言教你写个‘浪漫烟花‘---特别漂亮

    效果展示 动态图 总体框架 /***************************************** * 项目名称:浪漫烟花 * 项目描述:贴图 * 项目环境:vs2019 * 生成日期: ...

  4. populating-next-right-pointers-in-each-node leetcode C++

    Given a binary tree struct TreeLinkNode { TreeLinkNode *left; TreeLinkNode *right; TreeLinkNode *nex ...

  5. SSH 提示密码过期,如何通过 ansible 批量更新线上服务器密码

    起因 线上环境是在内网,登陆线上环境需要使用 VPN + 堡垒机 登陆,但是我日常登陆线上环境都是 VPN + 堡垒机 + Socks5常驻代理,在shell端只需要保存会话,会话使用socks5代理 ...

  6. Navicat for MySQL 批量执行多个 SQL 文件

    文件合并 type *.sql >> aaa.sql 执行sql文件 右键点击数据库

  7. 动态sql & 抽取可重用sql

    抽取可重用的sql片段 抽取:<sql id="xx"></sql> 使用:<include refid="xx">< ...

  8. LeetCode-40. 组合总和 II C++(回溯法)

    回溯法本身是种暴力解法,虽然效率之类的比较低,但是写起来比较易懂和快.在提交之后的排名也挺低的,大概就超过8%左右.以后复习的时候再去看看题解,看看更高性能的算法.这里先暂时贴上回溯法的代码. 最后说 ...

  9. PTA 7-1 还原二叉树 (25分)

    PTA 7-1 还原二叉树 (25分) 给定一棵二叉树的先序遍历序列和中序遍历序列,要求计算该二叉树的高度. 输入格式: 输入首先给出正整数N(≤50),为树中结点总数.下面两行先后给出先序和中序遍历 ...

  10. EDG夺冠!用Python分析22.3万条数据:粉丝都疯了!

    一.EDG夺冠信息 11月6日,在英雄联盟总决赛中,EDG战队以3:2战胜韩国队,获得2021年英雄联盟全球总决赛冠军,这个比赛在全网各大平台也是备受瞩目: 1.微博热搜第一名,截止2021-11-1 ...