文献名:ComplexBrowser: a tool for identification and quantification of protein complexes in large-scale proteomics datasets(大规模蛋白组学数据集中鉴定和定量蛋白复合物)

期刊名:Mol Cell Proteomics

发表时间:(2019年11月)

IF4.828

单位:南丹麦大学生物化学与分子生物学系和VILLUM生物分析科学中心

物种:人和小鼠

技术:ComplexBrowser

 

一、 概述:(用精炼的语言描述文章的整体思路及结果)

ComplexBrowser软件在CORUM和EBI两个测试数据集中识别了在人癌症和小鼠T细胞活化过程中已知的受调控的关键蛋白质复合物。找到了给定蛋白质列表中存在的已知蛋白质复合物,并利用定量蛋白质组数据(无标签或等分质量标签)和因子分析来总结整体研究生物条件中每个复合物的表达趋势。通过蛋白质复合物的鉴定而实现的生物学解释与基于原始研究中的GO注释得出的结论一致。该工具还对以前未在分析中考虑的带注释的蛋白质复合物进行研究,增加了新的见解。对这两个先前公布的大规模蛋白质组数据集的重新分析表明,该方法在不同生物环境中深入了解蛋白质复合物的调控具有巨大潜力。

二、 研究背景:(简要介绍研究进展动态、研究目的和意义)

蛋白质复合物是分子机器,可以执行许多重要的细胞生化关键活动,例如:复制,转录,翻译,细胞信号转导,细胞周期调控和氧化磷酸化。它们在维持细胞稳态和参与疾病发展中的作用证明了蛋白复合物表达的详细表征将有助于理解细胞中通常高度交织的过程。许多已知的蛋白质复合物是翻译和翻译后调节的,因此在细胞类型和组织之间比较时表现出共表达。然而,到目前为止,还没有开发用于分析新数据集中复杂行为的自动化和用户友好型方法。

ComplexBrowser软件可以提供蛋白质复合物表达和组成成分的交互可视化信息,以进行探索性分析,并结合了质量控制步骤,其中包括基于limma软件包的标准化和统计分析。是第一个用于自动化定量蛋白质复合物分析以进行高通量研究的工具,具有集成到科学界常用的数据分析工作流中的巨大潜力。

三、实验设计:

四、研究成果:

1、腺癌数据集使用基于LFQ强度的无标记定量方法研究了结肠癌患者健康结肠黏膜和淋巴结转移性肿瘤的福尔马林固定的石蜡包埋组织样品的蛋白表达差异。该程序的一般分析流程如图1所示。在定义分析参数(例如条件数量和重复项)后,将对数据质量进行分析并可视化。在接下来的窗口中,进行蛋白质复合物的存在和丰度变化的分析。交互式表格和图形使用户可以方便地评估分析结果。鉴定出的蛋白质列表以及定量信息将上传至软件,并设置分析参数(左图)。接下来是对所提供定量数据质量的评估(中间图)。最后,鉴定并可视化蛋白质复合物的存在和丰度变化(右图)。

2、将含有3种生物学条件,7个重复的定量蛋白质组学值的腺癌数据集数据按顺序上传到ComplexBrowser:C1 –对照,C2 –转移,C3 –癌症。对数转换强度的箱线图分析(图2A)表明,归一化对于减小强度分布之间的差异并确保样品之间的可比性是必要的;因此,进行了分位数归一化。图2B表明尽管进行了标准化,但对照,转移和癌症样品的平均CV值分别为65%,78%和77%,测量范围内的变化较大,很可能是由于样品的临床特征导致。图2C表明在腺癌数据集中,每个样品的缺失值数量从113到510不等,共占所有有效测量值的3.5%,没有显示出持久的数据偏差。PCA分析(图2D)显示对照样品良好分离,但癌与转移组织之间存在重叠。

3、T细胞数据集由四组(0、2、8和16 h)组成,具有两个重复,基于TMT的定量方法生成。ComplexBrowser生成的T细胞数据集质量控制分析可视化图3A显示出了所选样品之间蛋白质与TMT强度的相关性。越来越多的差异表达蛋白质(39、1,869和5,600)在2、4和16小时后检测到。图3B展示了由ComplexBrowser软件生成的火山图,C1,C2,C3和C4分别表示未受刺激的T细胞(0小时)和分别受刺激2小时,8小时和16小时的T细胞。

4、用CORUM和Complex Portal分析腺癌数据集的蛋白质复合物,分别鉴定了1,519和366个蛋白质复合物。图4给出了由ComplexBrowser生成的蛋白质复合物及其成分的典型可视化图。A-代表复合物组成成分在转移和对照样品之间变化的星形图,B图表示NADH泛醌氧化还原酶链6(P03923)的表达在癌症和转移组织中的表达降低,C图为呼吸链复合体I中所鉴定及定量的蛋白亚基的表达谱,D图表示三种分析条件下呼吸链复合体I中已识别和量化的蛋白亚基的对数转换后的平均归一化强度的相关热图,E图表示A组中呈现的呼吸链复合体I中已识别和量化的蛋白亚基的对数转换后的平均归一化强度热图; C1 –正常,C2 –癌症,C3 –转移组织。

5、图5显示了ComplexBrowser对T细胞数据集中的选定蛋白质复合物进行鉴定后的结果。发现p19-Cdk4-cyclinD2(16小时后为3.96 CFC)和与Cyclin D1相关的蛋白复合物(16小时后为2.47 CFC)是激活后8和16小时内上调程度最高的蛋白。这两个复合物参与细胞周期的调节和通过G1期的转变,它们的协同上调反映了T细胞向增殖状态的转变。这些变化伴随着各种DNA聚合酶复合物,例如DNA聚合酶表达的增加。此外,在Cd3d-Cd3g-Cd3e-Cd247复合物(1.07,-1.2,-1.36 CFC)的表达中发现了下调趋势,该复合物是T细胞共受体的一部分,其在T细胞激活期间被关闭。

五、文章亮点(结论讨论):

ComplexBrowser是第一个能够对蛋白质组学实验中的蛋白质复合物进行定量分析的自动化工具。它可以通过网络浏览器获得,不需要任何安装或编程经验。

该软件的独特功能是能够量化蛋白质复合物的丰度变化以及不同实验条件下的组成成分共表达。ComplexBrowser可以处理包含8,000多种定量蛋白质的大型蛋白质组学研究,并能够在输入数据后一分钟内显示汇总结果。交互式可视化为探索性分析和数据解释提供了直观的工具,使用户能够研究整个复合物以及单个亚基的行为。CFC(Complex fold change复合物的倍数变化)有效地帮助找到以同步方式变化表达的复合物,并且是复杂行为的一种度量。使用软件中实现的大量可视化工具,还可以轻松识别与复杂表达趋势不一致的亚基。

ComplexBrowser中呈现的方法的新颖之处在于,与GO注释和GO富集分析相比,ComplexBrowser可从手动管理的数据库(例如,数据库)中识别蛋白质复合物的成分,在其他任何软件中均不提供,它有助于蛋白质组学数据的定量分析,这是快速应用程序-FARMS算法,用于以CFC因子的形式定量测量复杂组件的变化,并以噪声的形式评估复杂亚基的协调表达。因此,ComplexBrowser为例如STRING或GO术语富集工具提供了一种补充方法。目前,ComplexBrowser最适合分析人类蛋白质。此外,数据库包含未完全注释的条目。数据库的进一步开发将改善软件提供的结果。

阅读人:张霞

ComplexBrowser: a tool for identification and quantification of protein complexes in large-scale proteomics datasets(大规模蛋白组学数据集中鉴定和定量蛋白复合物)的更多相关文章

  1. MCP|WJ|Identification of candidate plasma protein biomarkers for cervical cancer using the multiplex proximity extension assay(利用多重邻位延伸分析技术进行宫颈癌血浆蛋白候选生物标记物的鉴定研究)

    文献名:Identification of candidate plasma protein biomarkers for cervical cancer using the multiplex pr ...

  2. Metabolic Signatures of Cystic Fibrosis Identified in Dried Blood Spots For Newborn Screening Without Carrier Identification (文献分享一组-孔楠楠)

    题目:Metabolic Signatures of Cystic Fibrosis Identified in Dried Blood Spots For Newborn Screening Wit ...

  3. 微生物组学数据分析工具综述 | 16S+宏基因组+宏病毒组+宏转录组--转载

    转载:https://mp.weixin.qq.com/s/xsL9GuLs7b3nRF8VeRtinQ 建立在高通量测序基础上的微生物群落研究,当前主要有三大类:基于16S/18S/ITS等扩增子做 ...

  4. Significance A and B for protein ratios

    实验设计中,一般会做三个生物学重复来确保结果的准确性,尤其在下游分析中.但有时会遇到没有生物学重复,而又需要进行差异分析的情况,这时一般建议考虑foldchange即可,因为根本无法进行T-test等 ...

  5. JIPB | 两篇连发:华中农大黄俊斌团队报道二羟基异丁酰化调控稻曲病菌致病新机制

    水稻是我国重要的粮食作物,稻曲病是水稻三大病害之一,不仅造成稻米产量损失,更重要的是稻曲球中的稻曲菌素的毒性和致畸作用,给人畜健康带来严重威胁.病原菌对植物的侵袭是由病原菌的毒力和植物免疫系统相互作用 ...

  6. 【6】蛋白质组学鉴定定量软件之MaxQuant

    目录 1.简介 2.下载安装 3.配置与运行 4.结果 5.Perseus后处理 6.小结 1.简介 2016年,德国马普所的Cox和蛋白质组学领域巨擘Matthias Mann合作开发了MaxQua ...

  7. Journal of Proteome Research | SAAVpedia: identification, functional annotation, and retrieval of single amino acid variants for proteogenomic interpretation | SAAV的识别、功能注释和检索 | (解读人:徐洪凯)

    文献名:SAAVpedia: identification, functional annotation, and retrieval of single amino acid variants fo ...

  8. Fast and accurate bacterial species identification in urine specimens using LC-MS/MS mass spectrometry and machine learning (解读人:闫克强)

    文献名:Fast and accurate bacterial species identification in urine specimens using LC-MS/MS mass spectr ...

  9. Mol Cell Proteomics. | Identification of salivary biomarkers for oral cancer detection with untargeted and targeted quantitative proteomics approaches (解读人:卜繁宇)

    文献名:Identification of salivary biomarkers for oral cancer detection with untargeted and targeted qua ...

随机推荐

  1. Elegy written in a country church-yard

    分享一首好诗:托马斯·格雷的<墓地哀歌>. "ELEGY WRITTEN IN A COUNTRY CHURCH-YARD" The curfew tolls the ...

  2. django Highcharts制作图表--显示CPU使用率

    Highcharts 是一个用纯JavaScript编写的一个图表库. Highcharts 能够很简单便捷的在web网站或是web应用程序添加有交互性的图表 Highcharts 免费提供给个人学习 ...

  3. Vacant Seat(Atcoder-C-交互式题目)

    C - Vacant Seat Time limit : 2sec / Memory limit : 256MB Score : 500 points Problem Statement This i ...

  4. Acwing 843. n-皇后问题

    n-皇后问题是指将 n 个皇后放在 n∗n 的国际象棋棋盘上,使得皇后不能相互攻击到,即任意两个皇后都不能处于同一行.同一列或同一斜线上. 现在给定整数n,请你输出所有的满足条件的棋子摆法. 输入格式 ...

  5. Flutter混合开发:Android接入Flutter

    Flutter Google推出已经已经一年多了,单个 Flutter 项目的开发流程已经很成熟了.对与个人开发者来说使用 Flutter 开发一个跨平台的App挺有意思.但是对于现有的项目改造来说还 ...

  6. Git学习笔记(二) · 非典型性程序猿

    远程库的使用 前面说到的都是git在本地的操作,那么实际协作开发过程中我们肯定是要有一个远程版本库作为项目的核心版本库,也就是投入生产使用的版本.这里我们以 Github为例.Github是一个开放的 ...

  7. Laravel Study(使用 Laravel )

    開始 伺服器及相關工具安裝自行建立,在伺服器跟目錄下 有兩種方式建立 Laravel 專案,這裡使用 composer 建立專案 使用 composer 要在 PHP 5.3.2 以上才能使用 com ...

  8. NEWMING

    这里只是列举一些常用的文件操作命令. cd 跳转切换目录 # 格式:cd dirname 比如在打开用户主目录盘下的 myidoc 文件夹 cd ~/myidoc 跳转到当前目录的上一级 cd ../ ...

  9. Jprofile解析dump文件使用详解

    1 Jprofile简介 官网 下载对应的系统版本即可 性能查看工具JProfiler,可用于查看java执行效率,查看线程状态,查看内存占用与内存对象,还可以分析dump日志. 2 功能简介 选择a ...

  10. 探究Java中的引用

    探究Java中的四种引用 从JDK1.2版本开始,Java把对象的引用分为四种级别,从而使程序能更加灵活的控制对象的生命周期.这四种级别由高到低依次为:强引用.软引用.弱引用和虚引用.本篇就来详细探究 ...