ComplexBrowser: a tool for identification and quantification of protein complexes in large-scale proteomics datasets(大规模蛋白组学数据集中鉴定和定量蛋白复合物)
文献名:ComplexBrowser: a tool for identification and quantification of protein complexes in large-scale proteomics datasets(大规模蛋白组学数据集中鉴定和定量蛋白复合物)
期刊名:Mol Cell Proteomics
发表时间:(2019年11月)
IF:4.828
单位:南丹麦大学生物化学与分子生物学系和VILLUM生物分析科学中心
物种:人和小鼠
技术:ComplexBrowser
一、 概述:(用精炼的语言描述文章的整体思路及结果)
ComplexBrowser软件在CORUM和EBI两个测试数据集中识别了在人癌症和小鼠T细胞活化过程中已知的受调控的关键蛋白质复合物。找到了给定蛋白质列表中存在的已知蛋白质复合物,并利用定量蛋白质组数据(无标签或等分质量标签)和因子分析来总结整体研究生物条件中每个复合物的表达趋势。通过蛋白质复合物的鉴定而实现的生物学解释与基于原始研究中的GO注释得出的结论一致。该工具还对以前未在分析中考虑的带注释的蛋白质复合物进行研究,增加了新的见解。对这两个先前公布的大规模蛋白质组数据集的重新分析表明,该方法在不同生物环境中深入了解蛋白质复合物的调控具有巨大潜力。
二、 研究背景:(简要介绍研究进展动态、研究目的和意义)
蛋白质复合物是分子机器,可以执行许多重要的细胞生化关键活动,例如:复制,转录,翻译,细胞信号转导,细胞周期调控和氧化磷酸化。它们在维持细胞稳态和参与疾病发展中的作用证明了蛋白复合物表达的详细表征将有助于理解细胞中通常高度交织的过程。许多已知的蛋白质复合物是翻译和翻译后调节的,因此在细胞类型和组织之间比较时表现出共表达。然而,到目前为止,还没有开发用于分析新数据集中复杂行为的自动化和用户友好型方法。
ComplexBrowser软件可以提供蛋白质复合物表达和组成成分的交互可视化信息,以进行探索性分析,并结合了质量控制步骤,其中包括基于limma软件包的标准化和统计分析。是第一个用于自动化定量蛋白质复合物分析以进行高通量研究的工具,具有集成到科学界常用的数据分析工作流中的巨大潜力。
三、实验设计:
四、研究成果:
1、腺癌数据集使用基于LFQ强度的无标记定量方法研究了结肠癌患者健康结肠黏膜和淋巴结转移性肿瘤的福尔马林固定的石蜡包埋组织样品的蛋白表达差异。该程序的一般分析流程如图1所示。在定义分析参数(例如条件数量和重复项)后,将对数据质量进行分析并可视化。在接下来的窗口中,进行蛋白质复合物的存在和丰度变化的分析。交互式表格和图形使用户可以方便地评估分析结果。鉴定出的蛋白质列表以及定量信息将上传至软件,并设置分析参数(左图)。接下来是对所提供定量数据质量的评估(中间图)。最后,鉴定并可视化蛋白质复合物的存在和丰度变化(右图)。
2、将含有3种生物学条件,7个重复的定量蛋白质组学值的腺癌数据集数据按顺序上传到ComplexBrowser:C1 –对照,C2 –转移,C3 –癌症。对数转换强度的箱线图分析(图2A)表明,归一化对于减小强度分布之间的差异并确保样品之间的可比性是必要的;因此,进行了分位数归一化。图2B表明尽管进行了标准化,但对照,转移和癌症样品的平均CV值分别为65%,78%和77%,测量范围内的变化较大,很可能是由于样品的临床特征导致。图2C表明在腺癌数据集中,每个样品的缺失值数量从113到510不等,共占所有有效测量值的3.5%,没有显示出持久的数据偏差。PCA分析(图2D)显示对照样品良好分离,但癌与转移组织之间存在重叠。
3、T细胞数据集由四组(0、2、8和16 h)组成,具有两个重复,基于TMT的定量方法生成。ComplexBrowser生成的T细胞数据集质量控制分析可视化图3A显示出了所选样品之间蛋白质与TMT强度的相关性。越来越多的差异表达蛋白质(39、1,869和5,600)在2、4和16小时后检测到。图3B展示了由ComplexBrowser软件生成的火山图,C1,C2,C3和C4分别表示未受刺激的T细胞(0小时)和分别受刺激2小时,8小时和16小时的T细胞。
4、用CORUM和Complex Portal分析腺癌数据集的蛋白质复合物,分别鉴定了1,519和366个蛋白质复合物。图4给出了由ComplexBrowser生成的蛋白质复合物及其成分的典型可视化图。A-代表复合物组成成分在转移和对照样品之间变化的星形图,B图表示NADH泛醌氧化还原酶链6(P03923)的表达在癌症和转移组织中的表达降低,C图为呼吸链复合体I中所鉴定及定量的蛋白亚基的表达谱,D图表示三种分析条件下呼吸链复合体I中已识别和量化的蛋白亚基的对数转换后的平均归一化强度的相关热图,E图表示A组中呈现的呼吸链复合体I中已识别和量化的蛋白亚基的对数转换后的平均归一化强度热图; C1 –正常,C2 –癌症,C3 –转移组织。
5、图5显示了ComplexBrowser对T细胞数据集中的选定蛋白质复合物进行鉴定后的结果。发现p19-Cdk4-cyclinD2(16小时后为3.96 CFC)和与Cyclin D1相关的蛋白复合物(16小时后为2.47 CFC)是激活后8和16小时内上调程度最高的蛋白。这两个复合物参与细胞周期的调节和通过G1期的转变,它们的协同上调反映了T细胞向增殖状态的转变。这些变化伴随着各种DNA聚合酶复合物,例如DNA聚合酶表达的增加。此外,在Cd3d-Cd3g-Cd3e-Cd247复合物(1.07,-1.2,-1.36 CFC)的表达中发现了下调趋势,该复合物是T细胞共受体的一部分,其在T细胞激活期间被关闭。
五、文章亮点(结论讨论):
ComplexBrowser是第一个能够对蛋白质组学实验中的蛋白质复合物进行定量分析的自动化工具。它可以通过网络浏览器获得,不需要任何安装或编程经验。
该软件的独特功能是能够量化蛋白质复合物的丰度变化以及不同实验条件下的组成成分共表达。ComplexBrowser可以处理包含8,000多种定量蛋白质的大型蛋白质组学研究,并能够在输入数据后一分钟内显示汇总结果。交互式可视化为探索性分析和数据解释提供了直观的工具,使用户能够研究整个复合物以及单个亚基的行为。CFC(Complex fold change复合物的倍数变化)有效地帮助找到以同步方式变化表达的复合物,并且是复杂行为的一种度量。使用软件中实现的大量可视化工具,还可以轻松识别与复杂表达趋势不一致的亚基。
ComplexBrowser中呈现的方法的新颖之处在于,与GO注释和GO富集分析相比,ComplexBrowser可从手动管理的数据库(例如,数据库)中识别蛋白质复合物的成分,在其他任何软件中均不提供,它有助于蛋白质组学数据的定量分析,这是快速应用程序-FARMS算法,用于以CFC因子的形式定量测量复杂组件的变化,并以噪声的形式评估复杂亚基的协调表达。因此,ComplexBrowser为例如STRING或GO术语富集工具提供了一种补充方法。目前,ComplexBrowser最适合分析人类蛋白质。此外,数据库包含未完全注释的条目。数据库的进一步开发将改善软件提供的结果。
阅读人:张霞
ComplexBrowser: a tool for identification and quantification of protein complexes in large-scale proteomics datasets(大规模蛋白组学数据集中鉴定和定量蛋白复合物)的更多相关文章
- MCP|WJ|Identification of candidate plasma protein biomarkers for cervical cancer using the multiplex proximity extension assay(利用多重邻位延伸分析技术进行宫颈癌血浆蛋白候选生物标记物的鉴定研究)
文献名:Identification of candidate plasma protein biomarkers for cervical cancer using the multiplex pr ...
- Metabolic Signatures of Cystic Fibrosis Identified in Dried Blood Spots For Newborn Screening Without Carrier Identification (文献分享一组-孔楠楠)
题目:Metabolic Signatures of Cystic Fibrosis Identified in Dried Blood Spots For Newborn Screening Wit ...
- 微生物组学数据分析工具综述 | 16S+宏基因组+宏病毒组+宏转录组--转载
转载:https://mp.weixin.qq.com/s/xsL9GuLs7b3nRF8VeRtinQ 建立在高通量测序基础上的微生物群落研究,当前主要有三大类:基于16S/18S/ITS等扩增子做 ...
- Significance A and B for protein ratios
实验设计中,一般会做三个生物学重复来确保结果的准确性,尤其在下游分析中.但有时会遇到没有生物学重复,而又需要进行差异分析的情况,这时一般建议考虑foldchange即可,因为根本无法进行T-test等 ...
- JIPB | 两篇连发:华中农大黄俊斌团队报道二羟基异丁酰化调控稻曲病菌致病新机制
水稻是我国重要的粮食作物,稻曲病是水稻三大病害之一,不仅造成稻米产量损失,更重要的是稻曲球中的稻曲菌素的毒性和致畸作用,给人畜健康带来严重威胁.病原菌对植物的侵袭是由病原菌的毒力和植物免疫系统相互作用 ...
- 【6】蛋白质组学鉴定定量软件之MaxQuant
目录 1.简介 2.下载安装 3.配置与运行 4.结果 5.Perseus后处理 6.小结 1.简介 2016年,德国马普所的Cox和蛋白质组学领域巨擘Matthias Mann合作开发了MaxQua ...
- Journal of Proteome Research | SAAVpedia: identification, functional annotation, and retrieval of single amino acid variants for proteogenomic interpretation | SAAV的识别、功能注释和检索 | (解读人:徐洪凯)
文献名:SAAVpedia: identification, functional annotation, and retrieval of single amino acid variants fo ...
- Fast and accurate bacterial species identification in urine specimens using LC-MS/MS mass spectrometry and machine learning (解读人:闫克强)
文献名:Fast and accurate bacterial species identification in urine specimens using LC-MS/MS mass spectr ...
- Mol Cell Proteomics. | Identification of salivary biomarkers for oral cancer detection with untargeted and targeted quantitative proteomics approaches (解读人:卜繁宇)
文献名:Identification of salivary biomarkers for oral cancer detection with untargeted and targeted qua ...
随机推荐
- 吴裕雄--天生自然python学习笔记:beautifulsoup库的使用
Beautiful Soup 库简介 Beautiful Soup提供一些简单的.python式的函数用来处理导航.搜索.修改分析树等功能.它是一个工具箱,通过解析文档为用户提供需要抓取的数据,因为简 ...
- 点击一个ul的五个li元素,分别弹出他们的序号,怎么做?
方法1 : for(var i=0; i<oLis.length; i++){ oLis[i].onclick = (function(j){ return function(){ alert( ...
- 在linux中自动向设备中安装apk包
环境:华为手机 linux centos64 为了锻炼自己,我把脚本文件和APK文件放到了不同的路径下. 需求:将虚拟机中的100个apk包安装到手机中. import os,time os.chdi ...
- python编程基础——集合
集合是是基本数据类型的一种集合类型. 作用:去重 属性:intersection.union.difference.issubset 实例: list_1=[1,2,3,4,3,5,2,6,1]lis ...
- 码海拾遗:简单Socket(TCP)类实现
最近刚开始啃Unix网络编程(卷1:套接字联网API),为加深TCP连接的建立和终止的理解与记忆,记下本文,方便以后翻看. 同时留下的还有简单的Socket(TCP)类: mySocket.h #pr ...
- Hexo next主题安装algolia
一直在使用hexo写自己的博客,最近博客刚刚搬家重新搞了下博客: 1.为hexo添加站内搜索 我用的是algolia,在next主题5.x以上的版本集成了algolia站内搜索功能,我们只需要简单的配 ...
- 安卓注解处理器-processor
最近在学习安卓开源框架发现,很多的开源框架都使用到了注解处理器,例如EventBus3.0.本文通过一个简单的Demo来介绍如何使用注解处理器.Demo链接为https://github.com/cu ...
- 【Android TimeCat】 解决cannot resolve symbol R
莫名其妙出现了,鬼知道怎么来的. 解决方法总结 1. 推荐 解决90%的情况: Build->Clean ProjectBuild->Rebuild Project 2. 不常见 Andr ...
- MyBatis 判断条件为等于的时候,常量需要加 .toString()
当MyBatis 判断条件为等于的时候,常量需要加 .toString() 来转换,这种方法是稳定的,推荐使用,比如: <!-- 正确的,稳定,推荐使用 --> <if test=& ...
- 如何在NLP领域第一次做成一件事
作者简介 周明,微软亚洲研究院首席研究员.ACL候任主席(president).中国计算机学会中文信息技术专委会主任.中国中文信息学会常务理事.哈工大.天津大学.南开大学.山东大学等多所学校博士导师. ...