蛋白组DIA分析：Spectronaut软件使用指南

官方文档： https://biognosys.com/media.ashx/spectronautmanual.pdf

0. 准备

Spectronaut软件是蛋白组DIA分析最常用的谱图解析软件之一，优点是定量准确，缺点是高额收费，window版本，速度慢。一起来简单了解下用法。

这是它的界面。只要理解了DIA流程，用法其实很简单，首先构建谱图库，或者导入已建好的DDA谱图库，再导入DIA原始文件，配置好参数，最后run即可。

一开始需要准备的是各种数据，包括：DIA的rawdata，DDA的rawdata，DDA的database（若有，需加入iRT序列进行校正），DDA的搜库鉴定结果。如果样本数多的话，这些原始文件会非常大，刚也提到该软件只支持windows系统，转移数据很麻烦，随便一个项目就能达到500G，所以必须要用很大的内存和硬盘。转移数据往往要花费很长时间。

1. 谱图库构建

首先进入Library，导入谱图库。Generate Library from Pulsar...是说用Spectronaut构建谱图库；Generate Spectral Library from...是说从别的搜库软件构建好的谱图库导入，支持常见的搜库软件结果文件：

Import/Exprot Spectral Library是导入导出谱图库，这里的谱图库是说已经在Spectronaut中完成了的库。

我们通常是自己导入搜库软件的结果文件来构建谱图库。

若导入MaxQuant构建的谱图库：

导入MaxQuant结果，只需指定combined文件夹导入，软件会自动关联相对应的原始数据（DDA的rawdata，关联也需要一段时间），若原始数据与搜库结果不在同一个文件夹内，可能会导致关联失败，可以通过“Assign Shotgun Files”的方式来指定相应的原始数据(见下图)；关联后，在FASTA Files一栏选择相应的数据库文件（数据库要右击上传，然后点击左边倒三角）；点击”Load”后加载Ion library，导入谱图库需要一段时间。

导入成功后，左边Spectral Libraries会显示出来。点击左侧spectral libraries的名字，更改为相应的项目编号；右侧显示的为spectral library的详细信息。

若导入Mascot结果作为谱图库：

Mascot的结果通常是dat文件，每一个rawdata对应一个dat。但是Spectronaut要求dat文件名与对应的raw文件同名，即使Assign shotgun files指定rawdata路径，也会关联不到，而且要将所有的dat构建一个谱图库（这是我们想要的）需要将不同的dat文件整合到同一目录下，实际上，一个样本往往多个fraction，同个样本的多个dat文件一般放在一个目录中，所以我们要拷贝出来，重命名。如果样本数多，也是件麻烦的事情。

比如原来每个样本的6个fraction是这样的结构：

最后需要在同级目录下同时存在：

然后导入全部dat文件，会自动关联对应的rawdata，上传数据库，设置参数即可构建谱图库了。

常见参数如下，一般默认就好。

另外还有一点，根据上传的数据库类型进行解析。主要是要注意fasta序列的ID及其后面的描述信息等，因为不同来源的数据库，规则会不同。

导入的数据库格式需要是fasta后缀，fa后缀会识别不了。对于蛋白组来说，大部分数据库类型都是uniprot（软件已经给你制定好了，无需定制），若是其他的类型，导入后，根据数据库制定规则，不会的可以点击后面的小问号，最后add rule。

import数据库后，记得打勾选中。

最后点击右下角的load，即导入谱图库，导库的过程可能需要话一段时间。构建谱图库的过程可以在日志文件中查看：

以下是完成后谱图库的信息：

2. DIA解析

旧版本可能是切换到“Review”界面，点击“Load Raw from File”后导入DIA数据。新的版本是Analysis界面，然后点击set up a DIA analysis from file，将DIA原始数据导入：

然后选择谱图库：

后面的参数默认就好，一步一步点击next。直到要设置condition实验设计这一步。需要注意的是圈出来的这几部分，对照组及重复设置。当然也可以设置好后导入。

设置condition和replicate的参数来判断是成对还是非成对，原则是：相同的实验对象Replicate编号一致，不同的实验对象Replicate编号务必不同。如下：

一直点到最后finish，然后一个数据一个数据的开始提峰。

数据量大的话，提峰很慢，因为要解卷积混合谱图。可能要默默等上个几天。

3. 结果导出

提峰完成后，首先是保存工程文件，以sne为后缀。注意是右击下面这个地方，然后save as：

Spectronaut一旦关闭，完成的结果便会丢失，通过保存工程文件，后续如有重新查看的需求，只需导入工程文件即可，无需重新运行spectronaut。

然后是结果的保存。切换到Report标签界面。

你的软件可能没有配置好的如下导出结果格式，这个主要是为后续定量分析的软件使用准备，如R包MSstat。

一般只有BGS factory report，这时需要自己设置格式。可以对columns进行选择，也可以filters过滤一些蛋白。当然你也可以全部选中，导出后再处理。

可以对新建立的格式做保存，下次就可以直接用啦。比如下面我对所有列都做了选中（打勾），再save as，命名，点ok：

最后，export report导出：

对于MSstats R包，需要导出2种格式文件，一是如下：

二是蛋白定量文件，导出并命名为PG_Report.xls：

当然也可以导入或导出制定好的格式，比如我导入：

不过有个小问题，貌似自己制定的和外部导入是由不同的，也就是说这个蓝色阴影和打勾效果不一样，导入的格式和BGS factory report似乎是同一级别的，而上面新建格式只是在BGS factory report的子文件而已。

根据导出的结果看，自己新建的好像不行（这里没有探究清楚）。

不论如何，我们导出结果。

最后的导出的文件包含如下，包含了工程文件、结果文件、参数及日志等：

重新导出结果

如果需要重新加载提峰的结果，可以在“Analysis”界面（旧版Review界面）选择“Load a spectronaut Experiment”，选择相应的sne文件进行加载。