针对PacBio单分子测序——第三代测序技术的测序原理和读长
 
 

DNA基因测序技术从上世纪70年代起,历经三代技术后,目前已发展成为一项相对成熟的生物产业。测序技术的应用也扩展到了生物、医学、制药、健康、农林、园艺、花卉、环保、法医等许多领域,并成为一项与我们衣食住行密切相关的高技术产业。据最新统计,2012年全球基因测序市场的产值已超过百亿,按最近几年增长速度,预计2017年市场产值将加倍。因此可以说,基因测序在我国生物科技领域具有非常重要的战略意义。
        “第三代测序技术”的研发已有近十年时间,商业化的第三代测序仪上市也有三年,目前,国内对Pacbio单分子测序研究也有了最新进展:

一,中科院药植所采用PacBio单分子测序揭示丹参叶绿体DNA修饰之间复杂的相互作用:编码及非编码RNA的表达

2014年6月10日,中科院药用植物研究所(IMPLAD)刘昶团队在《PLOS ONE》杂志上发表了利用PacBio测序技术揭示丹参(Salvia miltiorrhiza)叶绿体DNA修饰之间复杂相互作用的相关文章,该文章报道了丹参叶绿体中编码及非编码RNA的表达情况。这也是国内PacBio第三代测序用户在国际性杂志发表的第一篇文章。
        丹参是最广泛使用的药用植物之一。作为基于叶绿体基因工程手段开发使丹参活性成分过表达方法的第一步,该研究团队从基因组,转录组,和碱基修饰三方面对丹参叶绿体进行了分析。先从新鲜叶片中提取总基因组DNA和RNA,然后进行链特异性RNA测序和PacBio公司的单分子实时(Single-Molecule Real-Time, SMRT)测序分析。
       实验先是将RNA测序得到的reads mapping到基因组,使该研究小组确定了80个蛋白质编码基因的相对表达水平。此外,还明确了19个多顺反子转录单元和136个假定反义和基因间非编码RNA(ncRNA)基因。将蛋白编码基因的转录本(cRNA)丰度与重叠反义非编码RNA(asRNA)相比较表明,asRNA的存在与cRNA的丰度增加有关(P<0.05)。使用SMRT Portal软件预测到了2687个潜在的DNA修饰位点和2个潜在的DNA修饰基序。两个基序包括TATA盒样基序(CPGDMM1, ''TATANNNATNA''),以及一个未知的基序 (CPGDMM2, ''WNYANTGAW'')。
        研究采用二代和三代DNA测序技术并用,使在基因组层面研究非编码RNA和DNA修饰成为可能。然而,原来关于反义RNA和DNA修饰研究在实验上具有相当大的困难。首先,大多数asRNA转录本表达水平显著偏低,因而难以用经典技术如Northern Blot和原位杂交进行验证。第二,正义和反义转录本之间错综复杂的关系意味着实验扰动会不可避免地干扰其他转录本的表达。因此,通过knocking-in和knocking-out技术确定转录本的生物学功能是复杂的。第三,虽然SMRT技术已被证明能够检测到潜在的DNA修饰,但验证这些修饰仍然是个挑战性的任务。第四,叶绿体asRNA和DNA修饰的存在和功能的验证是更加困难的。
       综上所述,本研究所描述的一些发现从目前的技术上来讲是有巨大进步的。然而,本研究提出的数据已经证实了由asRNA和DNA修饰引起的基因表达调控的复杂性。

二,三代基因测序组装算法和软件研发获突破

“第三代测序技术”的研发已有近十年时间,商业化的第三代测序仪上市也有三年。但目前测序市场仍为二代测序技术所垄断(我国顶级科研机构和商业公司所拥有的三代测序仪可能仅有数十台)。三代测序技术产生的读段更长,测序成本更低,其取代二代技术是测序技术发展的必然趋势。然而由于三代测序技术错误率高,现有的组装软件多是对第二代测序数据组装软件的“修补”而并没有充分考虑到三代测序技术的数据特征。事实上,基因组装算法问题被广泛认为是计算生物学和生物信息学领域最复杂的计算难题之一,也是目前阻碍基因测序产业从二代技术升级到三代技术最大的技术障碍。
  最近,美国马里兰大学 Chengxi Ye, James A. Yorke, Aleksey Zimin 等与中国科学院昆明动物研究所遗传资源与进化国家重点实验室马占山研究员在这一领域的合作研发取得新突破。该研究团队在一篇题为DBG2OLC: Efficient Assembly of Large Genomes Using the Compressed Overlap Graph 的文章中引入了一种新的针对三代测序技术的基因组装算法,并开发出一款软件(DBG2OLC)。另外作者(Ye et al. 2011, 2012)于2011年发布的SparseAssembler曾经比当时主流的基因组装软件节省90%的内存空间,而其计算时间和组装质量却毫不逊色。著名的SOAPdenovo的升级版,也是目前最广泛应用的基因组装软件SOAPdenovo2即采用了SparseAssembler算法。
  多组测序数据的测试表明:与目前用于三代测序最优秀的一些基因组装软件(例如PacBio2CA, HGAP, ECTools)相比,DBG2OLC在计算时间和内存空间的消耗通常仅为其它算法的1/10。理论上,DBG2OLC 在时间和空间的使用上相对其它同类软件可减少达1000倍。例如组装关键步骤之一的“两两比对”计算,采用一组由 PacBio提供的人类基因组数据,DBG2OLC 使用一台普通PC仅用了6小时完成。而同样计算,Pacific Biosciences所报道的时间为 405000 CPU小时,而且是在Google的计算集群上完成。因此,DBG2OLC 算法基本解决了目前三代测序技术所面临的计算技术挑战,从而为推进基因测序技术的产业升级奠定了良好的技术基础。

三,PacBio RS II 测序系统原理

PacBio RS测序仪系统能够对单个DNA(脱氧核糖核酸)分子进行测序,而目前市场上
的主流测序仪只能对分子群体进行平均测序。单分子测序能对DNA中罕见的序列变异进行分析,也不需要在测序之前对DNA样本进行放大,因为放大过程可能引发错误,导致对某个DNA序列检测失败。其工作原理是用一种聚合酶将DNA的复制限制在一个微小的间隙中,给各种碱基加上荧光示踪标记,当碱基合成DNA链时,这些荧光标记就会发出不同颜色的闪光,根据闪光颜色就可识别出不同的碱基。

PacBio RS II 测序系统特点
1、测序读长长:平均测序读长能达到3,000至5,000碱基,最长的序列能达到20,000碱基;

2、准确率高:对基因组组装和基因组变异检测,可以最多达到99.999%的准确率;选用特殊测序模式,测序准确率可以在达到单个分子99%准确率的条件下,读长超过经典的Sanger测序法;

3、极度的敏感性:可以检测频率在0.1%的 minor variants;

4、直接检测广泛的碱基修饰:除了5-methylcytosine修饰以外, 还可以检测N6-methyladenine, N4-methylcytosine, DNA氧化损伤 以及其它碱基的修饰.

5、GC偏向性(GC bias)小:在极端高GC和极端低GC区域,可以轻松测定,从而保证序列的均匀覆盖度;

6、无PCR扩增偏向性:样本不需要进行PCR扩增,避免了覆盖度不均一和PCR artifacts.

第三代PacBio测序技术的测序原理和读长的更多相关文章

  1. 基因组所三代单分子测序PacBio完成技术升级—超长读长助力基因组学研究

    基因组所三代单分子测序PacBio完成技术升级—超长读长助力基因组学研究 2015-09-23 | 作者:所级中心基因组平台 张兵 [关闭] 近日,基因组所所级中心基因组平台三代单分子实时测序PacB ...

  2. 解读生命密码的基本手段 ——DNA测序技术的前世今生

    解读生命密码的基本手段 ——DNA测序技术的前世今生 任鲁风  于军 (中国科学院基因组科学及信息重点实验室,北京基因组研究所) DNA(脱氧核糖核酸)和RNA(核糖核酸)是生命体的两种最基本组成物质 ...

  3. ChIP-seq实战 | 染色质免疫共沉淀技术 | ATAC-seq | 染色质开放性测序技术

    参考:生信技能树 ChIP-Seq综述 一些简单的copy,纯属个人笔记. ChIP-seq的原理 用于在全基因组范围中研究DNA结合蛋白(相互反应).组蛋白修饰(表观遗传标记)和核小体的技术,研究这 ...

  4. DNA methylation|Transcription factors|PTM|Chromosome conformation|表观遗传学测序技术

    生物医疗大数据-DNA element functions and identification Genetic vs epigenetic GENETICS  遗传学 DNA Code: 64 tr ...

  5. 单细胞RNA测序技术之入门指南

    单细胞RNA测序技术之入门指南 [字体: 大 中 小 ] 时间:2018年09月12日 来源:生物通   编辑推荐: 在这个飞速发展的测序时代,DNA和RNA测序已经逐渐成为“实验室中的家常菜”.若要 ...

  6. 单细胞测序技术(single cell sequencing)

    单细胞测序技术(single cell sequencing) 2018-03-02 11:02   来源: 一呼百诺  点击次数:6587关键词:   前言 单细胞生物学最近几年是非常热门的研究方向 ...

  7. 单细胞转录组测序技术(scRNA-seq)及细胞分离技术分类汇总

    单细胞测序流程(http://learn.gencore.bio.nyu.edu) 在过去的十多年里,高通量测序技术被广泛应用于生物和医学的各种领域,极大促进了相关的研究和应用.其中转录组测序(RNA ...

  8. CSS3图片倒影技术实现及原理

    CSS3图片倒影技术实现及原理 目前为止我们已经探讨了很多CSS3中的新功能和新特征.除了上面这些,实际上还有很多CSS新属性并未包含进CSS3官方标准中,像谷歌浏览器或火狐浏览器等都会利用CSS的浏 ...

  9. 表达谱(DGE)测序与转录组测序的差别

    DGE-seq和普通的transcriptomic profiling相比较有什么不同,有什么特点? DGE就是用酶将mRNA切断,只使用靠近poly A的一小段RNA去测序. #1 由于不是测定mR ...

随机推荐

  1. MediaPlayer: MediaPlayer中的prepare方法和prepareAsync方法的区别

    prepare方法是将资源同步缓存到内存中,一般加载本地较小的资源可以用这个,如果是较大的资源或者网络资源建议使用prepareAsync方法,异步加载.但如果想让资源启动,即start()起来,因为 ...

  2. Tag Tree

    Test & Measurement RF RFID DAQ Mixed Signal Instrumentation DSP C# C\C++ JAVA Work Better Git Ma ...

  3. java判断请求是否ajax异步请求

    java判断请求是否ajax异步请求   解决方法: if (request.getHeader("x-requested-with") != null && re ...

  4. toast提示信息获取和Monkey笔记

    获取toast toast提示信息出现场景:用户输入用户名和密码后,提示的'登录成功', 用之前的定位方法获取不了,需要Uiautomator2来获取 安装node.js (使用 npm 或 node ...

  5. 关于做移动端ui自动化测试使用PC代理网络会出现的问题

    无论是手动操作app还是ui脚本操作app,只要你使用了代理网络,第一次请求的时长会耗时特别长,所以在移动端测试时尽量不要使用代理网络,减少不必要的麻烦

  6. easyui datagrid设置一开始不加载数据

    解决办法就是:一开始的url属性设置为空,例如: <table id="dg" title="用户管理" class="easyui-datag ...

  7. 【计算机视觉】OPENCV对于有alpha通道的透明背景图片的读取和图片叠加

    这个是我自己做的粗略的螺旋丸的图,导出为png并带有alpha通道. 最后和一只狗合成成这个样子. 效果还是可以的. 为了实现这个效果,首先我们要明白具有透明通道的图片的OpenCV的读取方式.在Op ...

  8. 【数据库开发】MySQL命令大全

    1.连接Mysql 格式: mysql -h主机地址 -u用户名 -p用户密码1.连接到本机上的MYSQL. 首先打开DOS窗口,然后进入目录mysql\bin,再键入命令mysql -u root ...

  9. Spring 使用下列表

    模型层需要提供数据选项,设置错误信息 关键代码 @NotEmpty(message = "请选择兴趣爱好") private String[] hobbies; 控制器层需要在显示 ...

  10. 使用使用nltk 和 spacy进行命名实体提取/识别

    1. 什么是 命名实体提取? 参考:https://towardsdatascience.com/named-entity-recognition-with-nltk-and-spacy-8c4a7d ...