文献名:SAAVpedia: identification, functional annotation, and retrieval of single amino acid variants for proteogenomic interpretation(SAAVpedia:蛋白质基因组解释的单氨基酸突变的识别、功能注释和检索)

期刊名:Journal of Proteome Research

发表时间:2019年10月

IF3.78

单位:

  1. 韩国基础科学研究所,生物融合分析研究中心
  2. 韩国化学技术研究所,药物信息平台中心
  3. 韩国大田忠南国立大学,分析科学与技术研究所

物种:

技术:蛋白基因组学,SAAVpedia

 

一、 概述:

新一代的基因组测序技术使得许多疾病或药物反应相关的非同义单核苷酸变异(Nonsynonymous Single Nucleotide Variants, nsSNVs)的发现成为可能,这些变异改变了蛋白质的氨基酸序列。目前已有研究试图描述致病的nsSNVs,但很少有研究在蛋白质水平上被确认为单氨基酸变异(Single Amino Acid Variants, SAAVs)。本研究开发了由四个模块(SAAVidentifier、SAAVannotator、SNV/SAAVretriever和SAAVvisualizer)组成的SAAVpedia平台,从蛋白质组和基因组数据中识别、注释和检索致病的SAAV候选。SAAVpedia在乳腺癌和恶性胶质瘤数据分析中的应用说明其在确认基因组变体是否存在于氨基酸序列中是一个比较合适的工具。

二、 研究背景:

得益于二代测序技术,大量的可能会引起蛋白功能变化的nsSNVs被鉴定到,目前已经有了许多对其致病机理和分子机制进行预测、解释的研究,但这些方法在不同数据集之间无法充分的复现。在一些研究中,结合蛋白质组数据在蛋白质水平上鉴定到的来自nsSNVs的变异,可能在实际的疾病发生过程中扮演重要的角色。但是由于没有开发出有关鉴定SAAV的综合蛋白基因组学分析平台,目前只有很少一部分SAAV能够与疾病相关的基因组数据和功能联系起来,大多数SAAV的生物、临床和药理功能仍然是未知的,进一步确认致病的SAAV是极其困难的。

三、 实验设计:

四、研究成果:

SAAVpedia是一个从蛋白质组和基因组数据中识别、注释和检索致病SAAV候选体的平台。该平台由四个模块组成:SAAVidentifier、SAAVannotator、SNV/SAAVretriever和SAAVvisualizer。SAAVidentifier提供了包含549,033个SAAVs的42,134个蛋白质亚型的参考数据库。SAAVannotator提供了24种信息,属于4个类别:i)基因组变异,ii)基因/转录本/蛋白,iii)生物学和iv)临床信息。它为解释特定条件下的SAAV提供了功能注释。SNV/SAAVretriever模块支持在相关条件特异性SAAVs和nsSNVs之间双向导航,具有多种基因组和蛋白组数据。最后,SAAVvisualizer根据检测到的SAAVs的功能信息提供了各种统计图。

SAAVpedia中包括三个数据库:SAAV序列数据库(SAAV Sequence Database)、SAAV参考数据库(SAAV Reference Database)以及功能信息数据库(Functional Information Database)。其中,序列数据库中包括来自neXtProt和GENCODE中所有含有变异肽段的蛋白质序列;参考数据库中包括neXtProt中全部SAAV的基因组和蛋白质组变异信息,基因组变异信息包括基因位置和来自dbSNP或COSMIC的基因组参考序列和改变的核苷酸序列,蛋白质组变异信息包括变异发生的位置,蛋白质参考序列和改变的氨基酸序列以及来自neXtProt的胰蛋白酶酶解肽段序列;功能信息数据库包括生物、临床、药理等信息。

图1. SAAVpedia平台的原理图模块。

该平台支持从蛋白质组和基因组数据中识别、注释和检索致病SAAVs。SAAVidentifier对SAAVs进行识别和质量评估。SAAVannotator通过对生物学、临床和药理信息进行注释,以解释SAAVidentifier已识别的SAAVs的功能。SNV/SAAVretriever模块自动构建具有基因组和蛋白质组变体列表的查询。它还可以双向导航相关条件特异性SAAVs和nsSNVs,具有多种表型的基因组和蛋白质组数据。SAAVvisualizer提供五类分析结果的图形可视化。除SAAVvisualizer模块外,所有模块都实现为Web应用程序、Python包和REST API。

利用CPTAC(Clinical Proteomic Tumor Analysis Consortium)乳腺癌研究中的925个LC-MS/MS数据以及Synapse中恶性胶质瘤样本的40个LC-MS/MS数据进行测试:

表1. CPTAC和NextPP搜索结果中乳腺癌和胶质母细胞瘤样本中鉴定到的SAAVs。

图2. 互作网络图。通过SAAVpedia结合临床信息和PPI网络的发现乳腺癌相关的新基因和致病的SAAV候选。PPI网络由乳腺癌相关基因和SAAVs基因组成。

在8,377个基因中对82,611个乳腺癌SAAVs进行鉴定、注释以及蛋白互作分析(PPI),最终构建的PPI网络由1326个基因节点(红色节点黄色文本)和1087个一级edge构成(A)。其中共有298个基因与BRCA1、TP53、BRCA2、ERBB2、ESR1、ESR2等乳腺癌相关基因有基本联系(B, C)。

图3. 互作网络图。通过SAAVpedia结合临床信息和PPI网络的发现胶质母细胞瘤相关的新基因和致病的SAAV候选。PPI网络由胶质母细胞瘤相关基因和SAAVs基因组成。共有12个基因与胶质母细胞瘤驱动基因(红)相关。节点测试颜色为紫色,表示SAAV数量为1。

 

五、文章亮点(结论讨论):

SAAVpedia可以从大规模和高通量的基因组和蛋白质组数据中鉴定、注释和检索致病性SAAVs。SAAVpedia中灵活的蛋白质基因组解释流程可以帮助描述和定位实际条件特异性的致病SAAVs,而这些是不能通过比较和分析基因组和蛋白质组数据来预测的。SAAVpedia基于功能多样的生物医学知识数据库提供了足够的信息,但是由于所访问的知识库本身信息不足,一些查询并没有返回结果。通过使用知识数据库对功能信息数据库进行一致的扩展,可以解决这一问题。通过把SAAV数据库从各种蛋白质组数据扩展到进一步的生物医学研究,SAAVpedia能够在基于大量蛋白质基因组数据的致病生物标志物发现中发挥重要的作用。

阅读人:徐洪凯

原文链接:https://pubs.acs.org/doi/10.1021/acs.jproteome.9b00366

DOI10.1021/acs.jproteome.9b00366

Journal of Proteome Research | SAAVpedia: identification, functional annotation, and retrieval of single amino acid variants for proteogenomic interpretation | SAAV的识别、功能注释和检索 | (解读人:徐洪凯)的更多相关文章

  1. Journal of Proteome Research | Improving Silkworm Genome Annotation Using a Proteogenomics Approach (分享人:张霞)

    题目:Improving Silkworm Genome Annotation Using a Proteogenomics Approach 期刊:Journal of Proteome Resea ...

  2. Journal of Proteome Research | Proteomic analysis of Rhizobium favelukesii LPU83 in response to acid stress.(酸胁迫下根瘤菌LPU83(Rhizobium favelukesii)的蛋白质组学分析)(解读人:丑天胜)

    文献名:Proteomic analysis of Rhizobium favelukesii LPU83 in response to acid stress.(酸胁迫下根瘤菌LPU83(Rhizo ...

  3. Journal of Proteome Research | Proteomic Profiling of Rhabdomyosarcoma-Derived Exosomes Yield Insights into Their Functional Role in Paracrine Signaling (解读人:孙国莹)

    文献名:Proteomic Profiling of Rhabdomyosarcoma-Derived Exosomes Yield Insights into Their Functional Ro ...

  4. Journal of Proteome Research | 人类牙槽骨蛋白的蛋白质组学和n端分析:改进的蛋白质提取方法和LysargiNase消化策略增加了蛋白质组的覆盖率和缺失蛋白的识别 | (解读人:卜繁宇)

    文献名:Proteomic and N-Terminomic TAILS Analyses of Human Alveolar Bone Proteins: Improved Protein Extr ...

  5. Journal of Proteome Research | iHPDM: In Silico Human Proteome Digestion Map with Proteolytic Peptide Analysis and Graphical Visualizations(iHPDM: 人类蛋白质组理论酶解图谱的水解肽段分析和可视化展示)| (解读人:邓亚美)

    文献名:iHPDM: In Silico Human Proteome Digestion Map with Proteolytic Peptide Analysis and Graphical Vi ...

  6. Journal of Proteome Research | Down-Regulation of a Male-Specific H3K4 Demethylase, KDM5D, Impairs Cardiomyocyte Differentiation (男性特有的H3K4脱甲基酶基因(KDM5D)下调会损伤心肌细胞分化) | (解读人:徐宁)

    文献名:Down-Regulation of a Male-Specific H3K4 Demethylase, KDM5D, Impairs Cardiomyocyte Differentiatio ...

  7. Journal of Proteome Research | Quantitative Subcellular Proteomics of the Orbitofrontal Cortex of Schizophrenia Patients (精神分裂症病人眶额叶皮层亚细胞结构的定量蛋白质组学研究)(解读人:王聚)

    期刊名:Journal of Proteome Research 发表时间:(2019年10月) IF:3.78 单位: 里约热内卢联邦大学 坎皮纳斯州立大学 坎皮纳斯州立大学神经生物学中心 卡拉博大 ...

  8. Journal of Proteome Research | Global Proteomic Analysis of Lysine Succinylation in Zebrafish (Danio rerio) (解读人:关姣)

    文献名:Global Proteomic Analysis of Lysine Succinylation in Zebrafish (Danio rerio)(斑马鱼赖氨酸琥珀酰化的全球蛋白质组学分 ...

  9. Journal of Proteome Research | An automated ‘cells-to-peptides’ sample preparation workflow for high-throughput, quantitative proteomic assays of microbes (解读人:陈浩)

    文献名:An automated ‘cells-to-peptides’ sample preparation workflow for high-throughput, quantitative p ...

随机推荐

  1. 吴裕雄--天生自然 R语言开发学习:使用ggplot2进行高级绘图(续二)

    #----------------------------------------------------------# # R in Action (2nd ed): Chapter 19 # # ...

  2. Twitter类社交平台 用比例建立新的“好坏”与社会焦点

    用比例建立新的"好坏"与社会焦点" title="Twitter类社交平台 用比例建立新的"好坏"与社会焦点"> 互联网全面 ...

  3. hexo NexT主题首页title链接的优化

    在默认设置下,文章链接都会改变,不利于搜索引擎收录,也不利于分享 更改index.swig文件 文件路径是your-hexo-sitethemesnextlayout,将下面代码 1 {% block ...

  4. Swift 浅谈Struct与Class

    讨论Struct与Class之前,我们先来看一个概念:Value Type(值类型),Reference Type(引用类型): 1. 值类型的变量直接包含他们的数据,对于值类型都有他们自己的数据副本 ...

  5. 如何正确的hook方法objc_msgSend · jmpews

    如何正确的hook方法objc_msgSend 前言 如果希望对 Objective-C 的方法调用进行 log, 一个很好的解决方法就是 hook 方法 objc_msgSend, 当然想到的就是利 ...

  6. 开始使用Github

     Gather ye rosebuds while ye may 我自己也是刚开始使用github没几天,写得不好我就写自己常用的吧 2015年9月20日下午3:19更新知乎上这个答案写得好多了

  7. linux下查找文件及查找包含指定内容的文件常用命令

    whereis <程序名称> 查找软件的安装路径-b 只查找二进制文件-m 只查找帮助文件-s 只查找源代码-u 排除指定类型文件-f 只显示文件名-B <目录> 在指定目录下 ...

  8. YOLO 论文阅读

    YOLO(You Only Look Once)是一个流行的目标检测方法,和Faster RCNN等state of the art方法比起来,主打检测速度快.截止到目前为止(2017年2月初),YO ...

  9. 代工黑马,纬创如何强吞iPhone?

    ​ 现在,智能手机市场非常得意兴阑珊,以苹果为首的最强大脑似乎再也想不出什么好的创意,iPhone7也只不过是旧机种的翻新款式,看上去跟一块板砖.一块镜子差不多:软体方面则出现了大批的"过度 ...

  10. 【C#】WechatPay-API-v3 使用平台证书加密内容与应答|通知验签(SHA256 with RSA)

    官方暂时没有维护应答与通知签名的验证C#示例,找了些资料被困扰了一天终于调试通了,贴出来下 . 此类提供两个方法: 1.敏感信息加密,如身份证.银行卡号.(特约商户进件接口需要): 2.应答与通知签验 ...