期刊名:Molecular & Cellular Proteomics

发表时间:(2019年12月)

IF4.828

单位:

  1. 朱拉隆功大学
  2. 费城威斯塔研究所

物种:

技术:de novo从头测序,深度学习

一、 概述:

该研究开发了一种基于深度学习的肽段从头测序框架SMSNet,在保持良好的识别覆盖率的同时,氨基酸准确度能达到95%以上。SMSNet揭示了超过10000个以前未分类的人类白细胞抗原(HLA)和磷酸肽,并结合数据库搜索方法,将肽鉴定的覆盖范围扩大了近30%。

二、 研究背景:

基于质谱的蛋白质组学数据的典型分析方法数据库搜索方法仅识别在参考数据库中存在的氨基酸序列,限制了发现新的肽的可能性,例如那些含有未经特征化突变的肽,或者那些起源于rna和蛋白质的意外加工的肽。相反,从头测序方法直接从观察到的质谱中确定氨基酸序列,但有时精度较低。尽管近年来已经证明了深度学习可以有效地应用于从头测序问题,但从头测序方法和数据库搜索方法在识别肽的准确性和数量方面仍存在巨大的性能差距。这一限制的关键部分在于质谱谱图是有噪声的,有时会缺乏关键信息。如何解决这一问题是提升从头测序方法的关键所在。

三、实验设计:

SMSNet序列掩码搜索框架

四、研究成果:

1、与目前最新的de novo测序软件DeepNoVo相比,SMSNet的性能要更好一些。由于DeepNovo没有后处理功能,为了保证比较的公平,分别展示了SMSNet在重新评分和不重新评分的情况下的性能。在下图中:

a,在由DeepNovo的作者整理的数据集上评估SMSNet和DeepNovo的氨基酸水平性能。图中标示了在5%氨基酸错误发现率下的相应召回率。

b,直方图展示了在由DeepNovo的作者整理的数据集上进行评估时,SMSNet和DeepNovo产生的置信度得分的分布。

c-d,在本文的WCU-MS-BEST数据集上进行了类似a-b的评估。

e-f,在蛋白质组学数据库获得的合成肽的高质量MS/MS谱数据集上进行了类似a-b的评估。

2、使用SMSNet发现了大量新的HLA抗原。在下图中:

a,使用堆叠条形图展示了由SMSNet识别的MS/MS光谱的数量以及SMSNet与先前使用Spectrum Mill软件进行MS/MS数据解释的研究之间的重叠。

b,使用堆叠条形图展示了由SMSNet识别的peptide-HLA对与免疫表位数据库(IEDB)之间的重叠。在10702个新鉴定的peptide-HLA对中,有7034种不同的肽。

c,新鉴定到的7034种肽的长度分布。

d,使用直方图和序列logos,比较了仅由SMSNet(左)、SMSNet+先前研究(中)和仅由先前研究(右)识别的peptide-HLA对之间预测的结合亲和力与核心序列motifs。

e,使用饼图展示了新鉴定的7034种肽的来源。

3、使用SMSNet提高了人类磷蛋白组鉴定的覆盖率。在下图中:

a,使用堆叠条形图展示了由SMSNet识别的MS/MS光谱的数量以及SMSNet与先前研究之间的重叠。

b,将SMSNet的鉴定结果加入到人类蛋白质组数据库中并用MaxQuant重新分析后,所鉴定到的MS/MS谱和磷酸肽的数量的增加和减少。

c,使用堆积条形图展示了由MaxQuant和SMSNet识别的磷酸肽数量,以及通过MaxQuant重新分析SMSNet结果从而识别到的新磷酸肽的数量。

d,饼图展示了通过将SMSNet的鉴定使用MaxQuant重新分析新鉴定到的肽的组成。这包括先前研究未鉴定的所有MS/MS光谱中的磷酸肽和非磷酸肽鉴定。

e,使用热图和线性图展示了4341个新鉴定的磷酸肽在使用MaxQuant对6个对照组和6个表皮生长因子处理的实验组进行重分析后的重现性。热图中的每一行对应一个质谱实验。

f,使用饼图展示了新鉴定的磷酸肽与PhosphoSitePlus数据库中已知的磷酸蛋白和磷酸位点之间的重叠。一个已识别的磷酸肽只有在数据库中报告了该肽上所有已识别的磷酸化位点时才被算作“Known phosphosites”。

五、文章亮点(结论讨论):本文开发的SMSNet结合了基于机器学习的现代方法和序列标记方法的优点,前者能够确定整个氨基酸序列,后者使用序列中置信度高的部分作为种子从数据库中检索完整序列,大大提升了从头测序方法的准确率。因此,SMSNet有望在新抗原发现、抗体测序和非模式生物的特征等蛋白质组学和肽组学的研究中有良好的表现。

阅读人:刘佳维

Uncovering thousands of new peptides with sequence-mask-search hybrid de novo peptide sequencing framework (使用序列掩码搜索结合肽段从头测序框架发现了数千个新肽段)-解读人:刘佳维的更多相关文章

  1. Mol Cell Proteomics. | Prediction of LC-MS/MS properties of peptides from sequence by deep learning (通过深度学习技术根据肽段序列预测其LC-MS/MS谱特征) (解读人:梅占龙)

    通过深度学习技术根据肽段序列预测其LC-MS/MS谱特征 解读人:梅占龙  质谱平台 文献名:Prediction of LC-MS/MS properties of peptides from se ...

  2. 解读人:陈秋实,SP2: Rapid and Automatable Contaminant Removal from Peptide Samples for Proteomic Analyses(标准操作流程2:如何在蛋白质组学分析中快速和自动的去除肽段样品中的污染物)

    发表时间:2019年4月 IF:3.950 单位: 威斯康星医学院生物化学系 威斯康星医学院生物医学质谱研究中心 物种:人(人体肾脏细胞和蛋白) 技术:肽段清理 一. 概述:(用精炼的语言描述文章的整 ...

  3. Analysis of endogenous peptides released from osteoarthritic cartilage unravels novel pathogenic markers (解读人:李琼)

    文献名:Analysis of endogenous peptides released from osteoarthritic cartilage unravels novel pathogenic ...

  4. Journal of Proteome Research | SAAVpedia: identification, functional annotation, and retrieval of single amino acid variants for proteogenomic interpretation | SAAV的识别、功能注释和检索 | (解读人:徐洪凯)

    文献名:SAAVpedia: identification, functional annotation, and retrieval of single amino acid variants fo ...

  5. 解读人:刘杰,Targeted Quantitative Kinome Analysis Identifies PRPS2 as a Promoter for Colorectal Cancer Metastasis(PRM-磷酸化激酶定量发现结肠癌转移促进因子-PRPS2)

    关键词:PRM,kinase,colorectal cancer, metastasis, PRPS2 来自加州大学河滨分校的Yinsheng Wang教授应用PRM技术筛选出介导结肠癌细胞转移促进因 ...

  6. Sample Preparation by Easy Extraction and Digestion (SPEED) - A Universal, Rapid, and Detergent-free Protocol for Proteomics based on Acid Extraction(一种使用强酸的蛋白质提取方法SPEED,普适,快速,无需去垢剂)-解读人:李思奇

    期刊名:Mol Cell Proteomics 发表时间:(2019年12月) IF:4.828 单位:德国Robert Koch 研究所 物种:多种 技术:新蛋白提取和酶解方法 一. 概述: 本文设 ...

  7. Journal of Proteome Research | An automated ‘cells-to-peptides’ sample preparation workflow for high-throughput, quantitative proteomic assays of microbes (解读人:陈浩)

    文献名:An automated ‘cells-to-peptides’ sample preparation workflow for high-throughput, quantitative p ...

  8. Fast and accurate bacterial species identification in urine specimens using LC-MS/MS mass spectrometry and machine learning (解读人:闫克强)

    文献名:Fast and accurate bacterial species identification in urine specimens using LC-MS/MS mass spectr ...

  9. Multi-batch TMT reveals false positives, batch effects and missing values(解读人:胡丹丹)

    文献名:Multi-batch TMT reveals false positives, batch effects and missing values (多批次TMT定量方法中对假阳性率,批次效应 ...

随机推荐

  1. 将js进行到底:node学习5

    HTTP开发之Connect工具集--中间件 继学习node.js的TCP API和HTTP API之后,node.js web开发进入了正轨,但这就好像Java的servlet一样,我们不可能使用最 ...

  2. Python时间操作所相关

    相关模块:time,datetime,calendar(日历模块) 获取当前时间: # 获取当前10位时间戳,默认返回为float类型 print int(time.time()) # output: ...

  3. SpringMVC之reset风格和form表单格式的curd

    CRUD c:create创建 r:retieve:查询 u:update:修改 d:delete:删除 rest /emp/1 get 代表查询id为1的员工 /emp/1 put 代表修改id为1 ...

  4. 从TP-Link到雷蛇,纷纷入局智能手机业到底想干什么?

    ​   "眼看他起朱楼,眼看他宴宾客,眼看他楼塌了",这句形容世态炎凉的话其实与智能手机市场更为相像.诺基亚的辉煌与没落.黑莓的强势与消声无迹.摩托罗拉的数次易手.小米的横空出世与 ...

  5. 悖论当道,模式成空:汽车O2O真是死得其所?

    O2O热潮的兴起似乎来得颇为蹊跷--或许是线上连接线下的模式太过空泛,具有极大的包容性,让各个行业都忍不住在其中横插一脚.在经历过最初的崛起和后来的火爆之后,最终形成目前的寒冬.究其原因,O2O并不是 ...

  6. Ubuntu 14.10 进入单用户模式

    1. 开机,进入grub界面 2. 此时会有一个选项:Advanced Options for Ubuntu(ubuntu高级), 选中直接回车 3. 看到里面有很多选项,选中后面带recovery ...

  7. 参考C# 使用 System.Web.Script.Serialization 解析 JSON

    参考C# 使用 System.Web.Script.Serialization 解析 JSON 使用json需要引用到System.Web.Script.Serialization.习惯在解决方案右键 ...

  8. python爬虫-scrapy日志

    1.scrapy日志介绍 Scrapy的日志系统是实现了对python内置的日志的封装 scrapy也使用python日志级别分类 logging.CRITICAL logging.ERROE log ...

  9. 痞子衡嵌入式:恩智浦i.MX RT1xxx系列MCU启动那些事(11.3)- FlexSPI NOR连接方式大全(RT1010)

    大家好,我是痞子衡,是正经搞技术的痞子.今天痞子衡给大家介绍的是恩智浦i.MX RT1010的FlexSPI NOR启动的连接方式. 在写完 <FlexSPI NOR启动连接方式(RT1015/ ...

  10. Linux——如何将Red Hat Enterprise Linux 6的语言改为中文?

    第一步,打开终端,输入su -,获取超级用户权限,输入密码. 第二步,输入cd /etc/sysconfig,进入设置目录. 第三步,输入vi i18n,进入到配置文件. 第四步,按 ‘i’键,进入编 ...