官方文档: https://biognosys.com/media.ashx/spectronautmanual.pdf

0. 准备

Spectronaut软件是蛋白组DIA分析最常用的谱图解析软件之一,优点是定量准确,缺点是高额收费,window版本,速度慢。一起来简单了解下用法。



这是它的界面。只要理解了DIA流程,用法其实很简单,首先构建谱图库,或者导入已建好的DDA谱图库,再导入DIA原始文件,配置好参数,最后run即可。

一开始需要准备的是各种数据,包括:DIA的rawdata,DDA的rawdata,DDA的database(若有,需加入iRT序列进行校正),DDA的搜库鉴定结果。如果样本数多的话,这些原始文件会非常大,刚也提到该软件只支持windows系统,转移数据很麻烦,随便一个项目就能达到500G,所以必须要用很大的内存和硬盘。转移数据往往要花费很长时间。

1. 谱图库构建

首先进入Library,导入谱图库。Generate Library from Pulsar...是说用Spectronaut构建谱图库;Generate Spectral Library from...是说从别的搜库软件构建好的谱图库导入,支持常见的搜库软件结果文件:



Import/Exprot Spectral Library是导入导出谱图库,这里的谱图库是说已经在Spectronaut中完成了的库。

我们通常是自己导入搜库软件的结果文件来构建谱图库。

若导入MaxQuant构建的谱图库:

导入MaxQuant结果,只需指定combined文件夹导入,软件会自动关联相对应的原始数据(DDA的rawdata,关联也需要一段时间),若原始数据与搜库结果不在同一个文件夹内,可能会导致关联失败,可以通过“Assign Shotgun Files”的方式来指定相应的原始数据(见下图);关联后,在FASTA Files一栏选择相应的数据库文件(数据库要右击上传,然后点击左边倒三角);点击”Load”后加载Ion library,导入谱图库需要一段时间。





导入成功后,左边Spectral Libraries会显示出来。点击左侧spectral libraries的名字,更改为相应的项目编号;右侧显示的为spectral library的详细信息。

若导入Mascot结果作为谱图库:

Mascot的结果通常是dat文件,每一个rawdata对应一个dat。但是Spectronaut要求dat文件名与对应的raw文件同名,即使Assign shotgun files指定rawdata路径,也会关联不到,而且要将所有的dat构建一个谱图库(这是我们想要的)需要将不同的dat文件整合到同一目录下,实际上,一个样本往往多个fraction,同个样本的多个dat文件一般放在一个目录中,所以我们要拷贝出来,重命名。如果样本数多,也是件麻烦的事情。

比如原来每个样本的6个fraction是这样的结构:



最后需要在同级目录下同时存在:



然后导入全部dat文件,会自动关联对应的rawdata,上传数据库,设置参数即可构建谱图库了。

常见参数如下,一般默认就好。



另外还有一点,根据上传的数据库类型进行解析。主要是要注意fasta序列的ID及其后面的描述信息等,因为不同来源的数据库,规则会不同。



导入的数据库格式需要是fasta后缀,fa后缀会识别不了。对于蛋白组来说,大部分数据库类型都是uniprot(软件已经给你制定好了,无需定制),若是其他的类型,导入后,根据数据库制定规则,不会的可以点击后面的小问号,最后add rule。



import数据库后,记得打勾选中。



最后点击右下角的load,即导入谱图库,导库的过程可能需要话一段时间。构建谱图库的过程可以在日志文件中查看:



以下是完成后谱图库的信息:

2. DIA解析

旧版本可能是切换到“Review”界面,点击“Load Raw from File”后导入DIA数据。新的版本是Analysis界面,然后点击set up a DIA analysis from file,将DIA原始数据导入:

然后选择谱图库:

后面的参数默认就好,一步一步点击next。直到要设置condition实验设计这一步。需要注意的是圈出来的这几部分,对照组及重复设置。当然也可以设置好后导入。

设置condition和replicate的参数来判断是成对还是非成对,原则是:相同的实验对象Replicate编号一致,不同的实验对象Replicate编号务必不同。如下:

一直点到最后finish,然后一个数据一个数据的开始提峰。



数据量大的话,提峰很慢,因为要解卷积混合谱图。可能要默默等上个几天。

3. 结果导出

提峰完成后,首先是保存工程文件,以sne为后缀。注意是右击下面这个地方,然后save as:

Spectronaut一旦关闭,完成的结果便会丢失,通过保存工程文件,后续如有重新查看的需求,只需导入工程文件即可,无需重新运行spectronaut。

然后是结果的保存。切换到Report标签界面。

你的软件可能没有配置好的如下导出结果格式,这个主要是为后续定量分析的软件使用准备,如R包MSstat。

一般只有BGS factory report,这时需要自己设置格式。可以对columns进行选择,也可以filters过滤一些蛋白。当然你也可以全部选中,导出后再处理。

可以对新建立的格式做保存,下次就可以直接用啦。比如下面我对所有列都做了选中(打勾),再save as,命名,点ok:

最后,export report导出:

对于MSstats R包,需要导出2种格式文件,一是如下:

二是蛋白定量文件,导出并命名为PG_Report.xls:

当然也可以导入或导出制定好的格式,比如我导入:



不过有个小问题,貌似自己制定的和外部导入是由不同的,也就是说这个蓝色阴影和打勾效果不一样,导入的格式和BGS factory report似乎是同一级别的,而上面新建格式只是在BGS factory report的子文件而已。





根据导出的结果看,自己新建的好像不行(这里没有探究清楚)。


不论如何,我们导出结果。

最后的导出的文件包含如下,包含了工程文件、结果文件、参数及日志等:

重新导出结果

如果需要重新加载提峰的结果,可以在“Analysis”界面(旧版Review界面)选择“Load a spectronaut Experiment”,选择相应的sne文件进行加载。

蛋白组DIA分析:Spectronaut软件使用指南的更多相关文章

  1. 解读人:谭亦凡,Macrophage phosphoproteome analysis reveals MINCLE-dependent and -independent mycobacterial cord factor signaling(巨噬细胞磷酸化蛋白组学分析揭示MINCLE依赖和非依赖的分支杆菌索状因子信号通路)(MCP换)

    发表时间:2019年4月 IF:5.232 一. 概述: 分支杆菌索状因子TDM(trehalose-6,6’-dimycolate)能够与巨噬细胞C-型凝集素受体(CLR)MINCLE结合引起下游通 ...

  2. 【宏蛋白组】iMetaLab平台分析肠道宏蛋白质组数据

    目录 一.iMetaLab简介 二.内置工具与模块 1. Data Processing module 2. Functional Analysis 3. R Developing environme ...

  3. MCP|MZL|Accurate Estimation of Context- Dependent False Discovery Rates in Top- Down Proteomics 在自顶向下蛋白组学中精确设定评估条件估计假阳性

    一. 概述: 自顶向下的蛋白质组学技术近年来也发展成为高通量蛋白定性定量手段.该技术可以在一次的实验中定性上千种蛋白,然而缺乏一个可靠的假阳性控制方法阻碍了该技术的发展.在大规模流程化的假阳性控制手段 ...

  4. ComplexBrowser: a tool for identification and quantification of protein complexes in large-scale proteomics datasets(大规模蛋白组学数据集中鉴定和定量蛋白复合物)

    文献名:ComplexBrowser: a tool for identification and quantification of protein complexes in large-scale ...

  5. 《移山之道:VSTS软件开发指南》读书笔记

    这两天看了<移山之道:VSTS软件开发指南>,对团队软件开发又有了新的认识.也许对于我们这些软件开发的新手来说,最重要的是具体技术与应用框架,但读了这本书后我感觉到,实际团队项目中工具的使 ...

  6. MCP|ZWT|Precision de novo peptide sequencing using mirror proteases of Ac-LysargiNase and trypsin for large-scale proteomics(基于Ac-LysargiNase和胰蛋白酶的蛋白组镜像de novo测序)

    一.概述 由于难以获得100%的蛋白氨基酸序列覆盖率,蛋白组de novo测序成为了蛋白测序的难点,由Ac-LysargiNase(N端蛋白酶)和胰蛋白酶构成的镜像酶组合可以解决这个问题并具有稳定性, ...

  7. MetaboAnalyst的多组学分析

    MetaboAnalyst是做代谢的R包,功能十分强大.也开发了web版本,代谢组学的分析这里不介绍,主要讲讲它开发的多组学分析的相关内容. 既然是做代谢的工具,即使是增加了多组学内容,肯定也是以代谢 ...

  8. 多组学分析及可视化R包

    最近打算开始写一个多组学(包括宏基因组/16S/转录组/蛋白组/代谢组)关联分析的R包,避免重复造轮子,在开始之前随便在网上调研了下目前已有的R包工具,部分罗列如下: 1. mixOmics 应该是在 ...

  9. Windows 2003】利用域&&组策略自动部署软件

    Windows 2003]利用域&&组策略自动部署软件 转自 http://hi.baidu.com/qu6zhi/item/4c0fa100dc768613cc34ead0 ==== ...

随机推荐

  1. Java:泛型小记

    Java:泛型小记 对 Java 中的 泛型类,做一个微不足道的小小小小记 泛型实现 概述 开篇: List<String> l1 = new ArrayList<String> ...

  2. BUAA-软件工程第一次作业

    软件工程第一次作业 项目 内容 这个作业属于哪个课程 2020春季计算机学院软件工程(罗杰 任健) 这个作业的要求在哪里 第1次个人作业 我在这个课程的目标 团队完成好的软件,并对自己作出规划 这个作 ...

  3. 基于自定义Validator来验证枚举类型

    基于自定义Validator来验证枚举类型 一.背景 二.技术要点 三.实现一个自定义枚举校验. 1.需求. 2.实现步骤 1.自定义一个 Sex 枚举. 2.自定义一个 Enum 注解 3.编写具体 ...

  4. Pandas核心用法

    目录 Numpy和Pandas Numpy科学计算 Pandas数据分析 安装jupyter notebook Numpy语法 创建和基本使用 切片索引 布尔索引 对位运算 矩阵的乘除 其他方法 Pa ...

  5. PCB板HDI板几阶是什么意思

    http://blog.sina.com.cn/s/blog_55ff6d5d0102xxvx.html

  6. 零基础入门非常好的C语言基础资料

    C语言程序的结构认识 用一个简单的c程序例子,介绍c语言的基本构成.格式.以及良好的书写风格,使小伙伴对c语言有个初步认识. 例1:计算两个整数之和的c程序: #include main() { in ...

  7. js实现日期格式化封装-八种格式

    封装一个momentTime.js文件,包含8种格式. 需要传两个参数: 时间戳:stamp 格式化的类型:type, 日期补零的方法用到es6语法中的padStart(length,'字符'): 第 ...

  8. 如何选择普通索引和唯一索引《死磕MySQL系列 五》

    系列文章 一.原来一条select语句在MySQL是这样执行的<死磕MySQL系列 一> 二.一生挚友redo log.binlog<死磕MySQL系列 二> 三.MySQL强 ...

  9. Downward API —— 在容器内部获取 Pod 信息

    我们知道,每个 Pod 在被超过创建出来之后,都会被系统分配唯一的名字.IP地址,并且处于某个 Namespace 中,那么我们如何在 Pod 的容器内获取 Pod 的这些重要信息呢? 答案就是使用 ...

  10. SpringCloud 2020.0.4 系列之 Gateway入门

    1. 概述 老话说的好:做人要有幽默感,懂得幽默的人才会活的更开心. 言归正传,今天我们来聊聊 SpringCloud 的网关组件 Gateway,之前我们去访问 SpringCloud 不同服务的接 ...