Journal of Proteome Research | SAAVpedia: identification, functional annotation, and retrieval of single amino acid variants for proteogenomic interpretation | SAAV的识别、功能注释和检索 | (解读人:徐洪凯)
文献名:SAAVpedia: identification, functional annotation, and retrieval of single amino acid variants for proteogenomic interpretation(SAAVpedia:蛋白质基因组解释的单氨基酸突变的识别、功能注释和检索)
期刊名:Journal of Proteome Research
发表时间:2019年10月
IF:3.78
单位:
- 韩国基础科学研究所,生物融合分析研究中心
- 韩国化学技术研究所,药物信息平台中心
- 韩国大田忠南国立大学,分析科学与技术研究所
物种:人
技术:蛋白基因组学,SAAVpedia
一、 概述:
新一代的基因组测序技术使得许多疾病或药物反应相关的非同义单核苷酸变异(Nonsynonymous Single Nucleotide Variants, nsSNVs)的发现成为可能,这些变异改变了蛋白质的氨基酸序列。目前已有研究试图描述致病的nsSNVs,但很少有研究在蛋白质水平上被确认为单氨基酸变异(Single Amino Acid Variants, SAAVs)。本研究开发了由四个模块(SAAVidentifier、SAAVannotator、SNV/SAAVretriever和SAAVvisualizer)组成的SAAVpedia平台,从蛋白质组和基因组数据中识别、注释和检索致病的SAAV候选。SAAVpedia在乳腺癌和恶性胶质瘤数据分析中的应用说明其在确认基因组变体是否存在于氨基酸序列中是一个比较合适的工具。
二、 研究背景:
得益于二代测序技术,大量的可能会引起蛋白功能变化的nsSNVs被鉴定到,目前已经有了许多对其致病机理和分子机制进行预测、解释的研究,但这些方法在不同数据集之间无法充分的复现。在一些研究中,结合蛋白质组数据在蛋白质水平上鉴定到的来自nsSNVs的变异,可能在实际的疾病发生过程中扮演重要的角色。但是由于没有开发出有关鉴定SAAV的综合蛋白基因组学分析平台,目前只有很少一部分SAAV能够与疾病相关的基因组数据和功能联系起来,大多数SAAV的生物、临床和药理功能仍然是未知的,进一步确认致病的SAAV是极其困难的。
三、 实验设计:

四、研究成果:
SAAVpedia是一个从蛋白质组和基因组数据中识别、注释和检索致病SAAV候选体的平台。该平台由四个模块组成:SAAVidentifier、SAAVannotator、SNV/SAAVretriever和SAAVvisualizer。SAAVidentifier提供了包含549,033个SAAVs的42,134个蛋白质亚型的参考数据库。SAAVannotator提供了24种信息,属于4个类别:i)基因组变异,ii)基因/转录本/蛋白,iii)生物学和iv)临床信息。它为解释特定条件下的SAAV提供了功能注释。SNV/SAAVretriever模块支持在相关条件特异性SAAVs和nsSNVs之间双向导航,具有多种基因组和蛋白组数据。最后,SAAVvisualizer根据检测到的SAAVs的功能信息提供了各种统计图。
SAAVpedia中包括三个数据库:SAAV序列数据库(SAAV Sequence Database)、SAAV参考数据库(SAAV Reference Database)以及功能信息数据库(Functional Information Database)。其中,序列数据库中包括来自neXtProt和GENCODE中所有含有变异肽段的蛋白质序列;参考数据库中包括neXtProt中全部SAAV的基因组和蛋白质组变异信息,基因组变异信息包括基因位置和来自dbSNP或COSMIC的基因组参考序列和改变的核苷酸序列,蛋白质组变异信息包括变异发生的位置,蛋白质参考序列和改变的氨基酸序列以及来自neXtProt的胰蛋白酶酶解肽段序列;功能信息数据库包括生物、临床、药理等信息。

图1. SAAVpedia平台的原理图模块。
该平台支持从蛋白质组和基因组数据中识别、注释和检索致病SAAVs。SAAVidentifier对SAAVs进行识别和质量评估。SAAVannotator通过对生物学、临床和药理信息进行注释,以解释SAAVidentifier已识别的SAAVs的功能。SNV/SAAVretriever模块自动构建具有基因组和蛋白质组变体列表的查询。它还可以双向导航相关条件特异性SAAVs和nsSNVs,具有多种表型的基因组和蛋白质组数据。SAAVvisualizer提供五类分析结果的图形可视化。除SAAVvisualizer模块外,所有模块都实现为Web应用程序、Python包和REST API。
利用CPTAC(Clinical Proteomic Tumor Analysis Consortium)乳腺癌研究中的925个LC-MS/MS数据以及Synapse中恶性胶质瘤样本的40个LC-MS/MS数据进行测试:
表1. CPTAC和NextPP搜索结果中乳腺癌和胶质母细胞瘤样本中鉴定到的SAAVs。


图2. 互作网络图。通过SAAVpedia结合临床信息和PPI网络的发现乳腺癌相关的新基因和致病的SAAV候选。PPI网络由乳腺癌相关基因和SAAVs基因组成。
在8,377个基因中对82,611个乳腺癌SAAVs进行鉴定、注释以及蛋白互作分析(PPI),最终构建的PPI网络由1326个基因节点(红色节点黄色文本)和1087个一级edge构成(A)。其中共有298个基因与BRCA1、TP53、BRCA2、ERBB2、ESR1、ESR2等乳腺癌相关基因有基本联系(B, C)。

图3. 互作网络图。通过SAAVpedia结合临床信息和PPI网络的发现胶质母细胞瘤相关的新基因和致病的SAAV候选。PPI网络由胶质母细胞瘤相关基因和SAAVs基因组成。共有12个基因与胶质母细胞瘤驱动基因(红)相关。节点测试颜色为紫色,表示SAAV数量为1。
五、文章亮点(结论讨论):
SAAVpedia可以从大规模和高通量的基因组和蛋白质组数据中鉴定、注释和检索致病性SAAVs。SAAVpedia中灵活的蛋白质基因组解释流程可以帮助描述和定位实际条件特异性的致病SAAVs,而这些是不能通过比较和分析基因组和蛋白质组数据来预测的。SAAVpedia基于功能多样的生物医学知识数据库提供了足够的信息,但是由于所访问的知识库本身信息不足,一些查询并没有返回结果。通过使用知识数据库对功能信息数据库进行一致的扩展,可以解决这一问题。通过把SAAV数据库从各种蛋白质组数据扩展到进一步的生物医学研究,SAAVpedia能够在基于大量蛋白质基因组数据的致病生物标志物发现中发挥重要的作用。
阅读人:徐洪凯
原文链接:https://pubs.acs.org/doi/10.1021/acs.jproteome.9b00366
DOI:10.1021/acs.jproteome.9b00366
Journal of Proteome Research | SAAVpedia: identification, functional annotation, and retrieval of single amino acid variants for proteogenomic interpretation | SAAV的识别、功能注释和检索 | (解读人:徐洪凯)的更多相关文章
- Journal of Proteome Research | Improving Silkworm Genome Annotation Using a Proteogenomics Approach (分享人:张霞)
题目:Improving Silkworm Genome Annotation Using a Proteogenomics Approach 期刊:Journal of Proteome Resea ...
- Journal of Proteome Research | Proteomic analysis of Rhizobium favelukesii LPU83 in response to acid stress.(酸胁迫下根瘤菌LPU83(Rhizobium favelukesii)的蛋白质组学分析)(解读人:丑天胜)
文献名:Proteomic analysis of Rhizobium favelukesii LPU83 in response to acid stress.(酸胁迫下根瘤菌LPU83(Rhizo ...
- Journal of Proteome Research | Proteomic Profiling of Rhabdomyosarcoma-Derived Exosomes Yield Insights into Their Functional Role in Paracrine Signaling (解读人:孙国莹)
文献名:Proteomic Profiling of Rhabdomyosarcoma-Derived Exosomes Yield Insights into Their Functional Ro ...
- Journal of Proteome Research | 人类牙槽骨蛋白的蛋白质组学和n端分析:改进的蛋白质提取方法和LysargiNase消化策略增加了蛋白质组的覆盖率和缺失蛋白的识别 | (解读人:卜繁宇)
文献名:Proteomic and N-Terminomic TAILS Analyses of Human Alveolar Bone Proteins: Improved Protein Extr ...
- Journal of Proteome Research | iHPDM: In Silico Human Proteome Digestion Map with Proteolytic Peptide Analysis and Graphical Visualizations(iHPDM: 人类蛋白质组理论酶解图谱的水解肽段分析和可视化展示)| (解读人:邓亚美)
文献名:iHPDM: In Silico Human Proteome Digestion Map with Proteolytic Peptide Analysis and Graphical Vi ...
- Journal of Proteome Research | Down-Regulation of a Male-Specific H3K4 Demethylase, KDM5D, Impairs Cardiomyocyte Differentiation (男性特有的H3K4脱甲基酶基因(KDM5D)下调会损伤心肌细胞分化) | (解读人:徐宁)
文献名:Down-Regulation of a Male-Specific H3K4 Demethylase, KDM5D, Impairs Cardiomyocyte Differentiatio ...
- Journal of Proteome Research | Quantitative Subcellular Proteomics of the Orbitofrontal Cortex of Schizophrenia Patients (精神分裂症病人眶额叶皮层亚细胞结构的定量蛋白质组学研究)(解读人:王聚)
期刊名:Journal of Proteome Research 发表时间:(2019年10月) IF:3.78 单位: 里约热内卢联邦大学 坎皮纳斯州立大学 坎皮纳斯州立大学神经生物学中心 卡拉博大 ...
- Journal of Proteome Research | Global Proteomic Analysis of Lysine Succinylation in Zebrafish (Danio rerio) (解读人:关姣)
文献名:Global Proteomic Analysis of Lysine Succinylation in Zebrafish (Danio rerio)(斑马鱼赖氨酸琥珀酰化的全球蛋白质组学分 ...
- Journal of Proteome Research | An automated ‘cells-to-peptides’ sample preparation workflow for high-throughput, quantitative proteomic assays of microbes (解读人:陈浩)
文献名:An automated ‘cells-to-peptides’ sample preparation workflow for high-throughput, quantitative p ...
随机推荐
- java 项目乱码解决(web.xml全局配置编码格式)
<!-- 乱码解决 --> <filter> <filter-name>encodingFilter</filter-name> //过滤器名称 < ...
- Java正则表达式java.util.regex类的简单使用
1.什么是正则表达式? 正则表达式(regular expression)是根据字符串集合内每个字符串共享的共同特性来描述字符串集合的一种途径.正则表达式可以用于搜索.编辑或者处理文本和数据. Jav ...
- 吴裕雄--天生自然 R语言开发学习:分类(续二)
#-----------------------------------------------------------------------------# # R in Action (2nd e ...
- echarts饼图字体大小修改
const option = { tooltip: { trigger: 'item', formatter: "{a} {b}: {c} ({d}%)" }, series: [ ...
- Proto3:Arena分配指南
Arena分配是仅C++有的功能,在使用Protocol Buffer时,它可以帮助你优化你的内存使用,提高性能.在.proto文件中启用Arena分配会在生成的C++代码中添加处理Arena分配的额 ...
- Ubuntu18.04安装OpenStack
Ubuntu18.04 安装Queens版本OpenStack 安装环境 系统 系统使用的是Ubuntu18,最少4核8G内存,20G硬盘空间. 工具 devstack DevStack是一系列可扩展 ...
- Jackie's blog
介绍使用winmm.h进行音频流的获取 首先需要包含以下引用对象 #include <Windows.h>#include "mmsystem.h"#pragma ...
- 每日一译系列-模块化css怎么玩(译文)
原文链接:How Css Modules Work 原文作者是Preact的作者 这是一篇关于如何使用Css Modules的快速介绍,使用到的工具是Webpack吊炸的css-loader 首先,我 ...
- hihoCoder 1128 二分查找
Description Input and Output Codes 描述#1128 : 二分·二分查找 Description Nettle最近在玩<艦これ>,因此Nettle收集了很多 ...
- ResultMap和ResultType到底有什么区别?
转载请标明出处:https://www.cnblogs.com/Dreamice/ 首先,SQL语句执行后返回的结果可以使用 Map 存储,也可以使用 POJO 存储. 一.使用Map存储结果集 下面 ...