文献名:iHPDM: In Silico Human Proteome Digestion Map with Proteolytic Peptide Analysis and Graphical Visualizations

期刊名:Journal of Proteome Research

发表时间:(2019年12月)

IF3.86

单位:

  1. 资讯科学研究院,中央研究院,台湾

物种:

技术:蛋白质组生物信息学

 

一、 概述:(用精炼的语言描述文章的整体思路及结果)

在有关丢失蛋白(MP,missing protein)和蛋白质亚型检测的蛋白质组学研究中,蛋白水解酶的选择是实验设计时需要考虑的一个因素。为了便于蛋白水解酶的选择,本研究开发了iHPDM的网页工具,用于计算机模拟蛋白质消化过程和结果展示。在进行鸟枪法蛋白质组学实验时,iHPDM能够指导蛋白水解酶的选取,以便鉴定MPs、蛋白质亚型和单氨基酸突变肽段。

二、 研究背景:

现阶段,寻找丢失蛋白、注释蛋白质及其亚型是人类染色体蛋白质组计划(C-HPP)的两大主要目标。据统计,neXtProt数据库(2019年1月版本)收纳了20339个具有代表性的人类蛋白质,其中MPs仍有2129个。一直以来,以肽段分析为核心的鸟枪法(shotgun)蛋白质组学是鉴定MPs和蛋白质亚型的常用策略。该策略下蛋白质先经蛋白酶水解为肽段,水解后的肽段经由液相色谱分离并进行质谱检测,其中,蛋白水解酶的选择将会影响可检测肽段的种类和数目,进而限制蛋白质鉴定和蛋白质序列覆盖度。如何合理地选择蛋白水解酶是该研究关心的核心问题。

胰蛋白酶是一种最常见的蛋白水解酶,水解后肽段的质量区间近似在0.5~3 kDa,适用于鸟枪法蛋白质组学的实验流程,使用率高达96.3%。然而,胰蛋白酶对蛋白质切割活动具有一定的阻碍效应(hinder effects),这会导致蛋白质消化不完全以及漏切位点的存在,不利于MPs的鉴定。为了减少此类限制,在蛋白质组学实验中使用其他类型蛋白酶或者联合使用多种蛋白酶将是蛋白质消化的替代解决方案。这些方案有望产生更多unique肽段和更高的序列覆盖度,不仅利于MPs和蛋白质亚型的鉴定,还能够为单氨基酸变体(SAV)肽段的鉴定提供更多可检测的肽段。

为了选择合适的蛋白酶,研究人员需要借助计算机模拟蛋白质消化过程,并通过对模拟消化肽段的结果分析,设计最佳的蛋白质组学实验。目前,已经存在一些Web服务器和独立工具可用于这方面的分析,如PeptideCutter,IPEP,PeptideMass,Proteogest,PepServe和PeptideManager。但是,这些工具尚存在一些不足,主要表现在4个方面:1)展示的结果信息不够全面。如PeptideCutter和IPEP缺乏关于肽段序列唯一性和长度的信息;2)缺乏蛋白质亚型检测的功能。针对目标蛋白质亚型的检测,缺少关于蛋白酶组合适配性方面的检测分析;3)不支持对查询蛋白的消化肽段进行灵活的动态过滤;4)缺乏蛋白质消化结果的可视化审阅功能。

鉴于现有软件的不足之处,该研究构建了一个新型网络服务器工具以满足需要,并命名为iHPDM(in silico Human Proteome Digestion Map),使用地址为http://ms.iis.sinica.edu.tw/iHPDM/index.php。 iHPDM功能全面,其专业化的蛋白酶推荐功能将能够更好地指导蛋白质组学实验,推进丢失蛋白、蛋白质亚型和变异肽段鉴定的研究。

三、 iHPDM数据库资源的构建与功能

为了开发人类蛋白质组的蛋白质酶解消化图谱,iHPDM使用了neXtProt数据库中所有人类蛋白质(2019-01版,包括蛋白质亚型在内的42419个蛋白质序列)作为数据源;提取了每个蛋白的身份和属性等信息(包括neXtProt索引号、蛋白质名称、蛋白质长度、染色体位置等);支持一种或两种蛋白酶的15个组合对42419个人类蛋白质进行计算机消化(酶组合:trypsin,chymotrypsin,LysargiNase,ArgC,GluC,LysC,LysN,AspN,OmpT,KEX2,SAP9,LysC + AspN,trypsin + GluC,trypsin + LysN和trypsin + AspN)。

图1 iHPDM的主界面

从图1 iHPDM的主界面来看,它提供了3大功能模块:

(1)Protein Query模块:针对单一蛋白序列,支持15种组合酶的平行比较分析。 示例结果如图2所示。

(2)Multi-protease Comparison模块:适用于高达1000条蛋白序列的批量处理,支持至多5种组合酶的水解效率的比较评估。

(3)Isoform Digestion模块:在给定蛋白质名称和蛋白酶的情况下,提供了不同蛋白质亚型经蛋白酶消化后地图形可视化结果展示,以便选择最适蛋白酶。示例结果如图3所示。

2 关于NX_Q14390蛋白的Protein Query模块操作结果演示。

在蛋白质序列视图中,所有消化所得肽段按分子量大小归类为BUP(bottom-up proteomics,0.6-3 kDa),eBUP(extended bottom-up proteomics,3-7 kDa)或MDP(middle-down proteomics,7 -15 kDa)三类。

3 胰蛋白酶作用下三种NX_Q8N0V5蛋白质亚型的消化结果展示

五、文章亮点(结论讨论):

本文提供了一个功能全面的、可对蛋白质进行理论酶解的iHPDM网页版工具。该工具的亮点是1)支持蛋白酶的种类丰富;2)提供了交互式图形操作和可视化界面,便于分析和检查消化结果;3)不仅可以鉴定MPs和蛋白质亚型,还可以选择蛋白酶以便检测具有单氨基酸变异肽的蛋白质。

阅读人:邓亚美

原文链接:https://pubs.acs.org/doi/abs/10.1021/acs.jproteome.9b00350

DOI:10.1021/acs.jproteome.9b00350

Journal of Proteome Research | iHPDM: In Silico Human Proteome Digestion Map with Proteolytic Peptide Analysis and Graphical Visualizations(iHPDM: 人类蛋白质组理论酶解图谱的水解肽段分析和可视化展示)| (解读人:邓亚美)的更多相关文章

  1. Journal of Proteome Research | Current understanding of human metaproteome association and modulation(人类宏蛋白质组研究近期综述)(解读人:李巧珍)

    文献名:Current understanding of human metaproteome association and modulation(人类宏蛋白质组研究近期综述) 期刊名:J Prot ...

  2. Journal of Proteome Research | Single-Shot Capillary Zone Electrophoresis−Tandem Mass Spectrometry Produces over 4400 Phosphopeptide Identifications from a 220 ng Sample (分享人:赵伟宁)

    Title: Single-Shot Capillary Zone Electrophoresis−Tandem Mass Spectrometry Produces over 4400 Phosph ...

  3. Multi-batch TMT reveals false positives, batch effects and missing values(解读人:胡丹丹)

    文献名:Multi-batch TMT reveals false positives, batch effects and missing values (多批次TMT定量方法中对假阳性率,批次效应 ...

  4. Mol Cell Proteomics. | Integration and analysis of CPTAC proteomics data in the context of cancer genomics in the cBioPortal (解读人:徐洪凯)

    文献名:Integration and analysis of CPTAC proteomics data in the context of cancer genomics in the cBioP ...

  5. Journal of Proteome Research | Utilization of the Proteome Data Deposited in SRMAtlas for Validating the Existence of the Human Missing Proteins in GPM (解读人:梁嘉琪)

    文献名:Utilization of the Proteome Data Deposited in SRMAtlas for Validating the Existence of the Human ...

  6. Journal of Proteome Research | 人类牙槽骨蛋白的蛋白质组学和n端分析:改进的蛋白质提取方法和LysargiNase消化策略增加了蛋白质组的覆盖率和缺失蛋白的识别 | (解读人:卜繁宇)

    文献名:Proteomic and N-Terminomic TAILS Analyses of Human Alveolar Bone Proteins: Improved Protein Extr ...

  7. Journal of Proteome Research | SAAVpedia: identification, functional annotation, and retrieval of single amino acid variants for proteogenomic interpretation | SAAV的识别、功能注释和检索 | (解读人:徐洪凯)

    文献名:SAAVpedia: identification, functional annotation, and retrieval of single amino acid variants fo ...

  8. Journal of Proteome Research | Down-Regulation of a Male-Specific H3K4 Demethylase, KDM5D, Impairs Cardiomyocyte Differentiation (男性特有的H3K4脱甲基酶基因(KDM5D)下调会损伤心肌细胞分化) | (解读人:徐宁)

    文献名:Down-Regulation of a Male-Specific H3K4 Demethylase, KDM5D, Impairs Cardiomyocyte Differentiatio ...

  9. Journal of Proteome Research | Quantitative Subcellular Proteomics of the Orbitofrontal Cortex of Schizophrenia Patients (精神分裂症病人眶额叶皮层亚细胞结构的定量蛋白质组学研究)(解读人:王聚)

    期刊名:Journal of Proteome Research 发表时间:(2019年10月) IF:3.78 单位: 里约热内卢联邦大学 坎皮纳斯州立大学 坎皮纳斯州立大学神经生物学中心 卡拉博大 ...

随机推荐

  1. GOM通区插件-支持GOM绝对路径-读取配置项-分割字符等功能。不定期更新

    A-A+ 2019年07月19日 Gom引擎 阅读 45 views 次   [@Main] #IF #SAY [<读配置项/@读配置项>] [<写配置项/@写配置项>] [& ...

  2. toString()和强制类型转换(String)的用法

    原来是String类型的才可以强转到String,不然会报 ClassCastException异常: 所有的引用类型都从Object类继承了toString方法.

  3. linux查看端口号占用命令-top

    题记 对于top命令来说,基本是都是linux命令入门中,第一个使用的命令,在windows中电脑如果卡顿,回去任务栏中查看cpu和内存的使用情况.top命令实现的就是这个重要的功能. 在系统维护的过 ...

  4. [PyTorch入门之60分钟入门闪击战]之自动推倒

    AUTOGRAD: AUTOMATIC DIFFERENTIATION(自动分化) 来源于这里. autograd包是PyTorch中所有神经网络的核心.首先我们先简单地了解下它,然后我们将训练我们的 ...

  5. 微软发布MS MARCO数据集,提高计算机阅读理解能力

    ​ MARCO数据集,提高计算机阅读理解能力" title="微软发布MS MARCO数据集,提高计算机阅读理解能力"> ​ 本文译自:Microsoft data ...

  6. 1——PHP常见的系统常量

    */ * Copyright (c) 2016,烟台大学计算机与控制工程学院 * All rights reserved. * 文件名:text.cpp * 作者:常轩 * 微信公众号:Worldhe ...

  7. 虚拟机+server03系统+sql的安装

    教程: 首先安装虚拟机 然后安装server系统 最后完成sql的安装 https://download.pchome.net/system/sysenhance/detail-4673.html 虚 ...

  8. java反序列化-ysoserial-调试分析总结篇(4)

    1.前言 这篇文章继续分析commoncollections4利用链,这篇文章是对cc2的改造,和cc3一样,cc3是对cc1的改造,cc4则是对cc2的改造,里面chained的invoke变成了i ...

  9. 压力测试(三)-自定义变量和CSV可变参数实操

    1.Jmeter用户自定义变量实战 简介:什么是用户自定义变量,怎样使用 为什么使用:很多变量在全局中都有使用,或者测试数据更改,可以在一处定义,四处使用 比如服务器地址 1.线程组->add ...

  10. Linux永久开放端口

    /sbin/iptables -I INPUT -p tcp --dport 80 -j ACCEPT /sbin/iptables -I INPUT -p tcp --dport 3306 -j A ...