文献名:Identification of candidate plasma protein biomarkers for cervical cancer using the multiplex proximity extension assay(利用多重邻位延伸分析技术进行宫颈癌血浆蛋白候选生物标记物的鉴定研究)

期刊名:Molecular & Cellular Proteomics

发表时间:2019.04.01

IF5.232

单位:

1.      乌普萨拉大学

2.      乌普萨拉科学园

3.      于默奥大学

物种:人类血浆

技术:靶向蛋白质组学

 

一、概述:

该研究利用多重邻位延伸分析技术(PEA)进行宫颈癌患者的的血浆蛋白质进行鉴定。在宫颈癌患者和对照组中共靶向测定并准确定量了100个蛋白,其中80个蛋白在癌症患者组中含量增加,11种蛋白(PTX3, ITGB1BP2, AXIN1, STAMPB, SRC, SIRT2, 4E-BP1, PAPPA, HB-EGF, NEMO, IL27)在区分患者组和对照组中具有0.96的灵敏度(真阳性率)和1.0的特异度(真阴性率)。在前瞻性复制队列研究中,该模型在区分诊断为宫颈癌时收集的样本和诊断为宫颈癌前收集样本中,具有0.78的灵敏度和0.56的特异度。若将诊断前样本或治疗后样本与对照组进行比较,则蛋白组上并无显著差异。

二、研究背景:

在女性癌症中,宫颈癌是第三大常见癌症。宫颈癌是由于致癌型人乳头瘤病毒(HPV)的持续感染所致。在有宫颈癌监测的国家中,宫颈细胞学检测手段(Pap smear)是最为普遍的。但由于细胞学检测灵敏度较低,故美国也将HPV检测作为联合检测手段。虽然与细胞学检测相比HPV检测具有更高的灵敏度,但由于HPV暂时性感染的高患病率,单独的HPV检测对于宫颈癌诊断呈现出较低的特异度。目前,虽然有许多代谢物研究力图在HPV阳性的女性中进行宫颈癌的早期检查,但目前尚无任何一个可应用到临床。该研究通过PEA的方法,力图在可能发展为宫颈癌的女性中鉴定到合适的血浆蛋白生物标记物。

三、实验设计:

四、研究成果:

1.经过质控过滤和数据前处理后,在发现队列和重复队列中鉴定并定量到100个蛋白;在发现队列中,48个蛋白存在显著性差异;28个蛋白在病人组显著上调。在重复队列中,诊断当日收集的血浆组(Case)和至少诊断前3年收集的血浆组(Ctrl)之间,13个蛋百存在显著差异;其中p-value最小(5.97 x 10-17)的蛋白为PTX3,其归一化后箱线图见图1。

图1.重复队列中PTX3归一化后在Case组和Ctrl组中含量箱线图

2.发现队列中,共有80个蛋白在病人组中高于对照组,通过朴素贝叶斯的机器学习方法建立模型,在训练集中灵敏度0.98(95% CI 0.93-1.0),特异度1.0(95% CI 1.0-1.0),见图2-1;验证集中灵敏度0.96(95% CI 0.89-1.0)特异度1.0(95% CI 1.0-1.0),见图2-2。

图2-1,80个蛋白模型中,训练集ROC曲线    图2-2,80个蛋白模型中验证集ROC曲线

将该模型应用到重复队列的数据中,其各组在朴素贝叶斯模型下输出值,各组与对照组进行分类的ROC曲线下AUC值以及ROC曲线分别展示于图2-3,2-4,2-5中,其中[-6166,-1328]代表该组数据的采集时间为诊断前6166天到1328天之间;[-1323,-1] 代表该组数据的采集时间为诊断前1323天到1天之间;[0,0]代表该组数据的采集时间为诊断当天;[28,1605]代表该组数据的采集时间为诊断后28天到1605天之间;[1629,7022]代表该组数据的采集时间为诊断前1629天到7022天之间。

图2-3,80个蛋白模型中重复队列下各组输出值        图2-4,80个蛋白模型中,重复队列中各组与[-6166,-1328]组在ROC曲线下的AUC值

图2-5个蛋白模型中的ROC曲线

发现队里中,80个蛋白中利用caret包中的rfe函数选择变量后,运用朴素贝叶斯方法重新构建了一个有11个蛋白(PTX3, ITGB1BP2, AXIN1, STAMPB, SRC, SIRT2, 4E-BP1, PAPP-A, HB-EGF, NEMO , IL-27)组成的新模型,其在训练集中灵敏度0.96(95% CI 0.89-1.0),特异度1.0(95% CI 1.0-1.0);验证集中灵敏度0.96(95% CI 0.89-1.0)特异度1.0(95% CI 1.0-1.0)。将该模型应用到重复队列的数据中,其各组在朴素贝叶斯模型下输出值,各组与对照组进行分类的ROC曲线下AUC值以及ROC曲线分别展示于图2-6,2-7,2-8中。

图2-6,11个蛋白模型中重复队列下各组输出值    图2-7,11个蛋白模型中,重复队列中各组与[-6166,-1328]组在ROC曲线下的AUC值

图2-8个蛋白模型中的ROC曲线

       在重复队列中,不利用发现队列中的模型,而是利用该11个蛋白重新进行数据前处理以及建模,在新得到的模型(II)中,[-6166,-1328](对照组)与[0,0]两组的AUC为0.91,但其他组的AUC并无显著变化。该模型各组输出值,各组与对照组进行分类的ROC曲线下AUC值以及ROC曲线分别展示于图2-9,2-10,2-11中。

图2-9,11个蛋白模型II中重复队列下各组输出值   图2-10,11个蛋白模型II中,重复队列中各组与[-6166,-1328]组在ROC曲线下的AUC值

图2-11个蛋白模型(II)中的ROC曲线

3、上述80个蛋白的基因中有916个SNP,11个蛋白的基因中有24个SNP在疾病组和对照组中存在显著差异(P<0.05)。进行多重假设检验矫正后916个SNP中的137个基因依然差异显著,24个SNP中的11个基因依然差异显著。编码11个蛋白的24个显著差异的SNP中,p-value最小的基因为rs1405(p=0.003),位于编码PAPP-A的第一个内含子中。总而言之,疾病和对照组蛋白质丰度上的差异似乎并不受到编码这些蛋白的宫颈癌相关基因变异的显著影响。

4、通过进行蛋白与距确诊时间的线性模型的建立,来评估各个蛋白作为宫颈癌早期生物标记物的功效。多重假设检验下,80个蛋白中只有两个蛋白即CCL和FR-alpha在对照和疾病组中差异显著;11个蛋白中并无蛋白在对照和疾病组中差异显著。

5、发现队列中在疾病组中显著上调的28个蛋白中,在[-6166,-1328]组和[28,1605]组中并无差异显著的蛋白;[-6166,-1328]组和[0,0]组相比,有13个蛋白在[-6166,-1328]组显著上调;[-6166,-1328]组和[1,1323]组相比,只有FR-alpha存在显著差异,但在多重假设检验的校正下则不再显著。

 

文章亮点:

1、采用了基因组和蛋白质组的联合分析方法

2、根据不同条件选取蛋白质并作为机器学习的特征量构建多个模型

3、样本量较大,既存在生物标记物的发现队列,又对所建立的模型在重复队列中进行了验证,且结果较好

4、在重复队列中,根据距确诊时间的差异,将样本进行了多组分类,增加了文章的分析维度。

阅读人:王聚

MCP|WJ|Identification of candidate plasma protein biomarkers for cervical cancer using the multiplex proximity extension assay(利用多重邻位延伸分析技术进行宫颈癌血浆蛋白候选生物标记物的鉴定研究)的更多相关文章

  1. ComplexBrowser: a tool for identification and quantification of protein complexes in large-scale proteomics datasets(大规模蛋白组学数据集中鉴定和定量蛋白复合物)

    文献名:ComplexBrowser: a tool for identification and quantification of protein complexes in large-scale ...

  2. Mol Cell Proteomics. | Identification of salivary biomarkers for oral cancer detection with untargeted and targeted quantitative proteomics approaches (解读人:卜繁宇)

    文献名:Identification of salivary biomarkers for oral cancer detection with untargeted and targeted qua ...

  3. manifold 微分流形上可以定义可微函数、切向量、切向量场、各种张量场等对象并建立其上的分析学,并可以赋予更复杂的几何结构以研究它们的性质。

    小结: 1.流形(英语:Manifolds)一般可以通过把许多平直的片折弯并粘连而成,是局部具有欧几里得空间性质的空间,是欧几里得空间中的曲线.曲面等概念的推广 2.描述一个流形往往需要不止一个“地图 ...

  4. lncRNA研究

    ------------------------------- Long noncoding RNAs are rarely translated in two human cell lines. ( ...

  5. study design of ADNI

    AD(Alzheimer’s disease):不可逆的神经退化,患病人员会由于脑部问题的恶化而导致心智功能不健全. ADNI:阿尔茨海默氏症神经成像项目 ADNI的总体目标是验证用于阿尔茨海默病临床 ...

  6. Journal of Proteome Research | Proteomic Profiling of Rhabdomyosarcoma-Derived Exosomes Yield Insights into Their Functional Role in Paracrine Signaling (解读人:孙国莹)

    文献名:Proteomic Profiling of Rhabdomyosarcoma-Derived Exosomes Yield Insights into Their Functional Ro ...

  7. Journal of Proteome Research | Quantifying Protein-Specific N-Glycome Profiles by Focused Protein and Immunoprecipitation Glycomics (分享人:潘火珍)

    文献名:Quantifying Protein-Specific N-Glycome Profiles by Focused Protein and Immunoprecipitation Glyco ...

  8. 寄生线虫免疫学研究新路径!华中农业大学胡敏团队报道寄生线虫N-糖基化修饰图谱

    N-糖基化修饰是真核生物中一种重要的蛋白质翻译后修饰,在许多生物学过程中起着关键作用,包括蛋白质折叠.受体-配体相互作用.免疫应答和疾病发病机制等.近年来,高精度质谱技术的出现促进了糖组和糖蛋白质组的 ...

  9. Gartner2017年BI研究计划曝光,来看看他研究的都是啥?

    文 | 水手哥 本文出自:知乎专栏<帆软数据应用研究院>——数据干货&资讯集中地   近日,Gartner发布了<Analytics and Business Intelli ...

随机推荐

  1. PHP 常量、PHP 变量全解析(超全局变量、变量的8种数据类型等)

    常量特点 常量一旦被定义就无法更改或撤销定义. 常量名不需要开头的$ 与变量不同,常量贯穿整个脚本是自动全局的. 作用域不影响对常量的访问 常量值只能是字符串或数字 设置 PHP 常量 如需设置常量, ...

  2. javaScript-进阶篇(二)

    JavaScript的内置对象 JavaScript 中的所有事物都是对象,如:字符串.数值.数组.函数等,每个对象带有属性和方法 对象的属性:反映该对象某些特定的性质的,如:字符串的长度.图像的长宽 ...

  3. QWidget上下文菜单处理函数

    QWidget类是Qt中所有可视化部件的基类,其很多函数都是虚函数,能被子类重写以表现不同形式和功能,今天来学习一下QWdiget的事件处理函数. 事件是鼠标.键盘或系统因其自身某些状态发生改变而引起 ...

  4. codeforces 652B B. z-sort(水题)

    题目链接: B. z-sort time limit per test 1 second memory limit per test 256 megabytes input standard inpu ...

  5. 【C/C++】assert

    摘自http://www.cplusplus.com assert : macro #include <assert.h> void assert (int expression); 如果 ...

  6. 删除文件时提示 你需要来自system的权限才能对此文件夹进行更改

    问题描述: 我的计算机是Win7 x64操作系统,在我的计算机的F盘中,不知道什么时候多了个“12e4k69m762nzcgt8zx”这样一个文件夹,应该是某个软件自己创建并留下的文件夹,想删除掉则提 ...

  7. github 在线 创建文件夹

    参考: http://webapps.stackexchange.com/questions/36411/create-a-folder-in-github-via-the-web-interface

  8. BZOJ2120:数颜色

    浅谈树状数组与线段树:https://www.cnblogs.com/AKMer/p/9946944.html 题目传送门:https://www.lydsy.com/JudgeOnline/prob ...

  9. Django-进阶 分页,中间件

    知识预览 分页 中间件 回到顶部 分页 Django的分页器(paginator) view from django.shortcuts import render,HttpResponse # Cr ...

  10. Android HttpGet和HttpPost设置超时

    HttpPost: private Runnable runnable = new Runnable() { @Override public void run() { String url = Ba ...