Fast and accurate bacterial species identification in urine specimens using LC-MS/MS mass spectrometry and machine learning (解读人:闫克强)
文献名:Fast and accurate bacterial species identification in urine specimens using LC-MS/MS mass spectrometry and machine learning(利用质谱技术和机器学习模型在尿液样本中快速准确地进行菌种鉴定)
doi: 10.1074/mcp.TIR119.001559
期刊名:Mol Cell Proteomics
作者:Florence Roux-Dalvai
通讯作者:Arnaud Droit
单位:
- 拉瓦尔大学
- 赛默飞世尔科技有限公司
一、 概述:
本研究主要目的是利用现有的技术对临床尿液样本中的特定细菌进行快速准确的鉴定。研究采用了新的策略来找到每个细菌对应的LC-MC/MC肽段标签。首先是通过DIA的方法得到每种细菌的特征肽段,利用机器学习分类预测,挑选出每个物种特有的肽段标签。然后,采用靶向蛋白质组的方法,利用这些标签肽段对未知样本进行菌种的鉴定。利用这种方法,可以在4小时内对尿路感染的15种致病菌进行快速准确的鉴定。
二、 研究背景:
在临床上,准确地鉴定致病菌对患者的治疗和用药具有非常重要的指导意义,针对致病菌采取合适的治疗方案可以防止抗生素的滥用。因此,如何快速地鉴定致病菌至关重要。基因型的方法,例如16S和宏基因组测序,可以用于对复杂样本的致病菌鉴定。16S测序一般可以在24小时内完成快速鉴定。但由于16S基因序列在物种间的保守性高,导致该方法的鉴别分辨率较低,只能局限在属的水平。宏基因组测序虽然可以做到菌株水平的区分,但它需要较高的预算和时间成本,不适合于临床的快速鉴定。质谱技术可以在较短的时间内对单菌进行鉴定,目前也已经应用到临床研究中。但是细菌的质谱鉴定存在以下几个问题:1)需要对细菌进行分离纯化培养;2)由于样本量少,低丰度的细菌可能难以鉴定到;3)目前的鉴定方法无法给出致病菌的定量信息。针对这些问题,临床质谱细菌鉴定技术做了一些改进。本研究采用Nano LC-MS/MS方法,结合DIA采集模式以及机器学习模型,对尿液样本中的致病菌进行鉴定,确定每种菌特异的标志肽段。然后利用这些标志肽段在组成未知的尿液样本中进行靶向蛋白质组学鉴定致病菌。通过这种方法,共建立了15种尿道感染致病菌的肽段标志物。这15种致病菌覆盖了84%以上的尿道感染病例,是最常见的几种致病菌。利用这些标志物,可以在4小时之内实现对尿液样本的快速鉴定,根据肽段标志物的种类和丰度判断其致病菌的类型。
三、 实验设计:
本研究主要分两个阶段,训练阶段和鉴定阶段。在训练阶段,首先是对15种菌进行DDA鉴定,得到每种菌的谱图库,然后对包含该菌的尿液进行DIA分析,利用构建好的谱图库来匹配DIA结果。DIA样本中包括15种菌的尿液样本,每种菌存在两种浓度差异,9个高浓度重复和3个低浓度重复,共180个样本。此外还存在10个空白对照。通过肽段强度信息以及二级谱图信息等对肽段进行进一步过滤,最终得到4319条候选肽段。然后将这些肽段合并,采用机器学习分类模型,利用这些肽段作为feature来区分不同致病菌数据集,最终筛选出82条具有区分度的肽段。第二部分是致病菌的鉴定。将82条肽段的母离子与子离子信息收集构建离子对,用于对未知样本的靶向蛋白质组学分析。通过对目标肽段的鉴定和定量结果模式来判断未知样本中存在哪种致病菌。

四、研究成果:
热图展示了82个肽段标志物在15种细菌中的分布情况。每种菌均有6个生物重复。可以看出,不同菌株存在不同的肽段标志物强度信息。因此,通过这些肽段以及其强度信息,可以在复杂样本中准确的鉴定出某个致病菌株的存在与否。


图a展示了对于4种常见的致病菌,结合肽段标志物的PRM预测结果。结果表明,在不同的浓度下,利用已有的肽段标志物都能很好地鉴定出4种目标菌株。可以看出,即使致病菌浓度在临床的检测线以下,每个菌株仍能被鉴定出来。图b表明,每个菌株的肽段标志物的丰度是与该菌丰度呈显著正相关的,可以结合肽段标志物的定量信息来判断致病菌浓度。图c说明4个生物样本之间致病菌丰度是显著相关的,生物重复性高。
五、文章亮点:
本文结合了DIA与机器学习的方法来寻找致病菌的标志肽段,实现了对复杂样本中特定物种的快速鉴定。其方法的巧妙结合为今后的研究提供了更加丰富的科研思路。而且具有很好的应用前景,推进了临床质谱的应用价值。
阅读人:闫克强
Fast and accurate bacterial species identification in urine specimens using LC-MS/MS mass spectrometry and machine learning (解读人:闫克强)的更多相关文章
- DART: a fast and accurate RNA-seq mapper with a partitioning strategy DART:使用分区策略的快速准确的RNA-seq映射器
DART: a fast and accurate RNA-seq mapper with a partitioning strategyDART:使用分区策略的快速准确的RNA-seq映射器 Abs ...
- Fauce:Fast and Accurate Deep Ensembles with Uncertainty for Cardinality Estimation 论文解读(VLDB 2021)
Fauce:Fast and Accurate Deep Ensembles with Uncertainty for Cardinality Estimation 论文解读(VLDB 2021) 本 ...
- Fast and Accurate Traffic Matrix Measurement Using Adaptive Cardinality Counting
paper-CaiPan.pdf http://conferences.sigcomm.org/sigcomm/2005/paper-CaiPan.pdf
- Journal of Proteome Research | SAAVpedia: identification, functional annotation, and retrieval of single amino acid variants for proteogenomic interpretation | SAAV的识别、功能注释和检索 | (解读人:徐洪凯)
文献名:SAAVpedia: identification, functional annotation, and retrieval of single amino acid variants fo ...
- Mol Cell Proteomics. | Identification of salivary biomarkers for oral cancer detection with untargeted and targeted quantitative proteomics approaches (解读人:卜繁宇)
文献名:Identification of salivary biomarkers for oral cancer detection with untargeted and targeted qua ...
- 解读人:董鑫,Disease Development Is Accompanied by Changes in Bacterial Protein Abundance and Functions in a Refined Model of Dextran Sulfate Sodium (DSS)-Induced Colitis
文章中文名:在葡聚糖硫酸钠(DSS)诱导下的结肠炎模型伴随着细菌蛋白质丰度和功能的改变 单位: 1 Helmholtz-Centre for Environmental Research - UFZ, ...
- 解读人:林山云,Proteomic Identification of Protein Glutathionylation in Cardiomyocytes(心肌细胞蛋白质谷胱甘肽修饰的蛋白质组鉴定)
发表时间:(2019年4月) IF:3.950 单位:韦恩州立大学化学系 物种:小鼠心肌细胞 技术:谷胱甘肽修饰蛋白组学 一. 概述: 本研究采用化学选择性蛋白组学方法,鉴定出过氧化物诱导HL-1小鼠 ...
- FAST特征点检测&&KeyPoint类
FAST特征点检测算法由E.Rosten和T.Drummond在2006年在其论文"Machine Learning for High-speed Corner Detection" ...
- 5 Ways AI is Transforming the Finance Industry
https://marutitech.com/ways-ai-transforming-finance/ As global technology has evolved over the years ...
随机推荐
- JavaScript提供了哪几种“异步模式”?
1.回调函数(callbacks) 2.事件监听 3.Promise对象
- ES6学习笔记之变量的解构赋值
变量的解构赋值 ES6允许按照一定模式,从数组和对象中提取值,对变量进行赋值,这被称为解构. 数组的解构赋值 以前,为变量赋值,只能直接指定值: 1 2 3 var a = 1; var b = 2; ...
- linux lsof常用方法
lsof简介 lsof(list open files)是一个列出当前系统打开文件的工具,在linux环境下,任何事物都是以文件形式存在,通过文件不仅仅可以访问常规数据,还可以访问网络连接和硬件.系统 ...
- DroidVim:在安卓手机上使用vim
背景 有时候在邮件,钉钉,微信上收到一份文件,急需打开看一下,但有些文件用普通编辑器打开体验实在不佳,例如 patch,log 甚至 bin 文件.由于日常在电脑上使用的是 vim ,一个朴素的想法就 ...
- 6487. 【GDOI2020模拟02.29】列强争霸war
题目描述 区间绝对众数 即出现次数>len/2下取整的数 对于区间[L,R]扫一遍,维护一个数x和出现次数s 当前数=x则s+1,否则s-1,若s已为0则把x设为当前数 若区间内存在绝对众数,那 ...
- AI入门之KNN算法学习
一.什么是KNN算法 kNN(k-NearestNeighbor),也就是k最近邻算法.顾名思义,所谓K最近邻,就是k个最近的邻居的意思.也就是在数据集中,认为每个样本可以用离他最距离近的k个邻居来代 ...
- Python 十大语法
前言 Python 是一种代表简单思想的语言,其语法相对简单,很容易上手.不过,如果就此小视 Python 语法的精妙和深邃,那就大错特错了.本文精心筛选了最能展现 Python 语法之精妙的十个知识 ...
- 【视频+图文】带你快速掌握Java中含break语句的双重for循环
双重for循环掌握后,我们就一起来看看双重for循环的进阶内容一之带break语句的双重for循环. 双重for循环[视频+图文]讲解传输门:点击这里可去小乔的哔哩哔哩观看~ 带continue语句的 ...
- java基础进阶篇(四)_HashMap------【java源码栈】
目录 一.前言 二.特点和常见问题 二.接口定义 三.初始化构造函数 四.HashMap内部结构 五.HashMap的存储分析 六.HashMap的读取分析 七.常用方法 八.HashMap 的jav ...
- go语言指南之斐波纳契闭包
练习:斐波纳契闭包 让我们用函数做些好玩的事情. 实现一个 fibonacci 函数,它返回一个函数(闭包),该闭包返回一个斐波纳契数列 `(0, 1, 1, 2, 3, 5, ...)`. 这是一个 ...