【MetDNA】基于代谢反应网络的大规模代谢物结构鉴定新算法
代谢是生命体内化学反应的总称,其所包含的代谢物变化规律可直接反映生命体的健康状态。非靶向代谢组学(untargeted metabolomics)可以在系统水平测量生命体内生理或病理状态下所有代谢物的含量变化,为研究其生物学机理提供依据。液相色谱-质谱联用(LC-MS)技术是代谢组学研究的主要工具之一。为了能够将采集的质谱数据信息转变为有效的生物学信息,首先就必须对代谢峰进行代谢物的结构鉴定。然而,到目前为止,在基于 LC-MS 的非靶向代谢组学中,大规模的代谢物结构鉴定仍然是一项非常具有挑战性的任务,也是代谢组学发展和应用的最大瓶颈之一。
目前最为广泛采用的代谢物结构鉴定策略是将二级质谱图(MS2谱图)与代谢物标准谱图库进行匹配进行代谢物鉴定。然而,此法严重受限于标准二级谱图的数目和覆盖度。目前标准二级质谱图库的扩充十分困难,因为小分子代谢物的标准MS2谱图必须通过采集代谢物标准品获取,但是目前大量代谢物没有标准品。此外,到目前为止还没有一个谱图库建立的标准流程,导致不同实验室和不同仪器采集的谱图互有差异。最近,也有研究者进行理论MS2谱图的预测,然而其精确度仍需提高。同时也有研究者开始利用代谢通路来进行代谢物的鉴定,如Mummichog和PIUMet。然而这些算法都基于差异代谢物富集在特定代谢通路或者代谢网络上的假设,只能鉴定差异表达的代谢特征峰,且准确度有待提高。
2019年4月3日,国际知名学术期刊《Nature Communications》杂志发表了由中国科学院上海有机化学研究所生物与化学交叉研究中心朱正江研究员课题组的最新研究成果Metabolic Reaction Network-based Recursive Metabolite Annotation for Untargeted Metabolomics(https://www.nature.com/articles/s41467-019-09550-x)。在该论文中,研究人员开发了一种基于代谢反应网络的全新代谢物结构鉴定算法MetDNA(Metabolite identification and Dysregulated Network Analysis)。
在细胞代谢中,一个代谢物可以通过酶催化反应转变为另外一种代谢物。处在同一个代谢反应中且结构类似的两个代谢物可定义为一个反应对(reaction pair,RP)和反应对邻近代谢物(reaction-paired neighbor metabolite)。代谢物的二级质谱图依赖于其化学结构。因此,处于同一反应对的两个代谢物由于其类似的结构,其二级谱图也会有一定的相似性。基于该原理,MetDNA算法利用样本中已经鉴定出的代谢物作为种子,进一步鉴定其在代谢网络中邻近的代谢物。此原理可以迭代应用在新的鉴定出来的代谢物上,从而使MetDNA可以沿着代谢反应网络进行代谢物的循环鉴定和递归运算,直到不再能够鉴定出新的邻近代谢物,大大扩展了鉴定到的代谢物的数目。该算法的最大特点是可以通过代谢反应网络去鉴定没有标准MS/MS谱图的代谢物,使得代谢物的结构鉴定并不依赖很大规模的标准MS/MS数据库。例如,MetDNA方法可以利用20个种子代谢物即可完成>1000个邻近代谢物的注释,创新性地克服了代谢物标准MS/MS谱图库数目的限制。
研究人员使用MetDNA处理了多个数据集(涵盖5种物种、7种样品类型以及多种仪器平台),所有的数据集都能鉴定出来约2,000个代谢物的结构,证明了MetDNA是一个不依赖于平台且较为通用的代谢物结构鉴定算法和工具。为了方便研究人员使用MetDNA,朱正江研究员课题组开发了基于阿里巴巴云服务器的MetDNA网络软件平台(http://metdna.zhulab.cn/)。MetDNA是一个基于网页版的软件,主页如图所示。用户需要注册登录才能使用。学术用途可以免费使用,商业用途需要联系朱正江研究员(jiangzhu@sioc.ac.cn)进行商业化授权。详细的使用方法可以查看MetDNA帮助文档(http://metdna.zhulab.cn/metdna/help),另外,作者也提供了demo数据(http://metdna.zhulab.cn/metdna/DemoDataset),供用户下载和测试。
MetDNA相关链接
- 在线网站:http://metdna.zhulab.cn/
- 原文:https://www.nature.com/articles/s41467-019-09550-x
- GitHub:https://github.com/ZhuMSLab/MetDNA
【MetDNA】基于代谢反应网络的大规模代谢物结构鉴定新算法的更多相关文章
- 基于LeNet网络的中文验证码识别
基于LeNet网络的中文验证码识别 由于公司需要进行了中文验证码的图片识别开发,最近一段时间刚忙完上线,好不容易闲下来就继上篇<基于Windows10 x64+visual Studio2013 ...
- 基于opencv网络摄像头在ubuntu下的视频获取
基于opencv网络摄像头在ubuntu下的视频获取 1 工具 原料 平台 :UBUNTU12.04 安装库 Opencv-2.3 2 安装编译运行步骤 安装编译opencv-2.3 参 ...
- 基于ffmpeg网络播放器的教程与总结
基于ffmpeg网络播放器的教程与总结 一. 概述 为了解决在线无广告播放youku网上的视频.(youku把每个视频切换成若干个小视频). 视频资源解析可以从www.flvcd. ...
- 基于UML网络教学管理平台模型的搭建
一.基本信息 标题:基于UML网络教学管理平台模型的搭建 时间:2013 出版源:网络安全技术与应用 领域分类:UML:网络教学管理平台:模型 二.研究背景 问题定义:网络教学管理平台模型的搭建 难点 ...
- 基于Socket网络编程
版权声明:本文为博主原创文章,未经博主允许不得转载. https://blog.csdn.net/a2011480169/article/details/73602708 博客核心内容: 1.Sock ...
- 基于CNN网络的汉字图像字体识别及其原理
现代办公要将纸质文档转换为电子文档的需求越来越多,目前针对这种应用场景的系统为OCR系统,也就是光学字符识别系统,例如对于古老出版物的数字化.但是目前OCR系统主要针对文字的识别上,对于出版物的版面以 ...
- Raknet是一个基于UDP网络传输协议的C++网络库(还有一些其它库,比如nanomsg,fastsocket等等)
Raknet是一个基于UDP网络传输协议的C++网络库,允许程序员在他们自己的程序中实现高效的网络传输服务.通常情况下用于游戏,但也可以用于其它项目. Raknet有以下好处: 高性能 在同一台计算机 ...
- 基于SDN网络的负载均衡研究与实现
为什么需要软件定义网络 1.网络缺乏可扩展性,创新正在停滞不前. 我们最新的研究发现,几乎每两个组织中就有一个认为需要将网络功能扩展为采用SDN的主要业务触发因素,而不是其他催化剂.这一统计数据一 ...
- NASH:基于丰富网络态射和爬山算法的神经网络架构搜索 | ICLR 2018
论文提出NASH方法来进行神经网络结构搜索,核心思想与之前的EAS方法类似,使用网络态射来生成一系列效果一致且继承权重的复杂子网,本文的网络态射更丰富,而且仅需要简单的爬山算法辅助就可以完成搜索,耗时 ...
随机推荐
- 移动端 h5 uniapp 读,写,删本地文件或sd文件
移动端 h5 uniapp 读,写,删本地文件或sd文件 应用场景: 当我们需要做离线应用或者是加载本地文件时使用到此方法.(本篇文章给大家分享访问app私有文件目录,系统公共目录,sd外置存储的文件 ...
- USART 硬件流控
流控的概念源于 RS232 这个标准,在 RS232 标准里面包含了串口.流控的定义.大家一定了解,RS232 中的"RS"是Recommend Standard 的缩写,即&qu ...
- Machine learning(3-Linear Algebra Review )
1.Matrices and vectors Matrix :Rectangular array of numbers a notation R3×3 Vector : An n×1 matrix t ...
- (一)lamp 环境搭建之编译安装apache
apache的编译安装: 安装步骤大概参考:http://www.cnblogs.com/iyoule/archive/2013/10/24/3385540.html 简单的将分为三步: (1)安装a ...
- VMware vSphere中三种磁盘:精简置备/厚置备置零/厚置备延迟置零
VMware磁盘格式分类. 厚置备延迟置零.厚置备置零和精简置备1.厚置备延迟置零(zeroed thick) 以默认的厚格式创建虚拟磁盘.创建过程中为虚拟磁盘分配所需空间.创建时不会擦除物理设备上保 ...
- MYSQL5.7下载安装图文教程
MYSQL5.7下载安装图文教程 一. MYSQL两种安装包格式 MySQL安装文件分为两种,一种是msi格式的,一种是zip格式的.zip格式相当于绿色版,不需要安装,只需解压缩之后就可以使用了,但 ...
- 【Java】IO流
File类 介绍 File类的一个对象,代表一个文件或一个文件目录 File类声明在java.io包下 File类中涉及关于文件或文件目录的创建.删除.重命名.修改时间.文件大小等方法,并未涉及到写入 ...
- EDG夺冠!用Python分析22.3万条数据:粉丝都疯了!
一.EDG夺冠信息 11月6日,在英雄联盟总决赛中,EDG战队以3:2战胜韩国队,获得2021年英雄联盟全球总决赛冠军,这个比赛在全网各大平台也是备受瞩目: 1.微博热搜第一名,截止2021-11-1 ...
- Markdown For EditPlus插件使用说明(基于EditPlus快速编辑Markdonw文件,写作爱好者的福音来啦)
Markdown For EditPlus插件使用说明 开发缘由 特点好处: 中文版使用说明 相关命令(输入字符敲空格自动输出): EditPlus常用快捷键: 相关教程: English descr ...
- [luogu4484]最长上升子序列
标算是状压dp+打表,前者时间复杂度为$o(n^{2}2^{n})$,并通过打表做到$o(1)$ 参考loj2265中关于杨表的相关知识,不难发现答案即$\frac{\sum_{a\vdash n}a ...