质谱仪:

质谱分析法是先将大分子电离为带电粒子,按质核比分离,由质谱仪识别电信号得到质谱图。

Top-down直接得到结果是蛋白。

Bottom down使用shutgun方法得到结果是肽段。

由蛋白质混合物打断为肽段混合物,按特定时间分离为LC,

初次得到的谱图为一级谱,一级谱是串联质谱,其中一个峰一个肽段。选出一个峰作为二级谱的原料,选出母离子(母离子就是整个肽段 PEPMASS)并打断送入质谱仪,二级谱是一张图中的一个肽段。除此之外还可以做更多等级的图谱,tandem mass spectrometry),二级谱图用于核心定性。利用蛋白酶的对在不同理化条件下产生不同切点的性质进行酶切,一般用一种酶切,有时候为了比对用两种。其中,子离子与肽段的关系:子离子构成肽段,即子离子的构造是“羧基----离子---氨基”式组合。当AA一个个掉掉下来之后,测量得到b+y成对数据,即peptide fragment。

质谱分析方法有从头分析法和数据库搜索匹配法,常用数据库法,即实验谱图在已知肽段理论图谱数据库中找匹配。

数据处理流程:

因为不同质谱仪产出不同格式,所以要对数据进行格式转换。Msconvert用于质谱转换用于预处理,可以降噪音,母离子矫正和输出规范化数据。

可以选择以下搜索引擎,Mascot的鉴定效果好;SEQUEST是传统的工具,不易学习和升级但是免费开源;X!Tandem可随需改动;pFind由小团队制作,但是灵敏度好;MaxQuant可同时产出定性和定量数据,使用方便,但覆盖率低。不同软件结果有不同,最好比对后选择一种。

可以选择数据库,Uniprot中的UniprotKB&Swiss-prot高质量,低冗余而且是人工的专家确认;neXtprot存储有关人类蛋白质数据,并有与实验证据相联系;IPI的稳定性比较差;NCBI中的RefSeq&nr是常见数据库直接加和,所以该数据库冗余量大,噪音非常大。

搜索引擎参数设定

蛋白质的鉴定和质检:

基于数据库法:

基于图谱数据库法的质检主要关注假阳性FDR false discover rate,因为从谱图到肽段到蛋白误差逐渐放大。如图,在某一图谱总错误导致一个蛋白错误。所以在谱图阶段就应该质检。原始数据中连续y连续b是好的。

先将蛋白质序列切成肽段序列,之后按照肽段分子排序,确定一个长度标准作为可鉴定出来的肽段,然后保留可鉴定长度的肽段。根据这些肽段找在数据库中候选图谱,组成理论图谱基于打分函数(Xcorr & △cn第一差距与第二差距)的得分判断图谱的可信度。

可基于正伪序列库方法使用Percolator做质量控制,因为理论图谱是正确序列和错误序列的集合,而伪库就是错误序列的集合,其补集是正取序列。如此做减法,得到图谱的线性模型或曲线模型,变成分类问题,以此找到正取的那部分。

此时存在共享肽段存在蛋白推导的困难,可以使用简约组装蛋白法。简约组装蛋白是选择最多信息承载的最少蛋白组合而成的蛋白组。常用MAYU法。

基于从头预测法:

从头测序预测方法是每个AA都算一遍,此方法可产生新蛋白,有PEAKS,NovoHMM,常用Nover方法,因其速度快,DeepNovo是深度学习方法。

PEAKS|NovoHMM|Nover|DeepNovo|MAYUPercolator|UniprotKB|Swiss-prot|Mascot|SEQUEST|X!Tandem|pFind|MaxQuant|Msconvert|PEPMASS|LC|的更多相关文章

  1. maker 2008年发表在genome Res

    http://gmod.org/wiki/MAKER_Tutorial 简单好用 identify repeats, to align ESTs and proteins to the genome, ...

  2. Proteomes of paired human cerebrospinal fluid and plasma: Relation to blood-brain barrier permeability in older adults (文献分享一组-潘火珍)

    题目:Proteomes of paired human cerebrospinal fluid and plasma: Relation to blood-brain barrier permeab ...

  3. The Swiss Army Knife of Data Structures … in C#

    "I worked up a full implementation as well but I decided that it was too complicated to post in ...

  4. 【BZOJ-3545&3551】Peaks&加强版 Kruskal重构树 + 主席树 + DFS序 + 倍增

    3545: [ONTAK2010]Peaks Time Limit: 10 Sec  Memory Limit: 128 MBSubmit: 1202  Solved: 321[Submit][Sta ...

  5. 运行java -version报cannot restore segment prot after reloc: Permission denied

    linux 安装jdk1.6后,运行java -version,没有出现相关的版本信息,而是出现了以下错误: dl failure on line 685Error: failed /usr/loca ...

  6. 动态库加载出错,cannot restore segment prot after reloc: Permission denied

    转自:taolinke的博客 项目中碰到的问题,编译好的so文件,放到其他机器上去加载,报了错误,cannot restore segment prot after reloc: Permission ...

  7. cannot restore segment prot after reloc: Permission denied

    编辑/etc/selinux/config,找到这段:# This file controls the state of SELinux on the system. # SELINUX= can t ...

  8. *[codility]Peaks

    https://codility.com/demo/take-sample-test/peaks http://blog.csdn.net/caopengcs/article/details/1749 ...

  9. Clustering by density peaks and distance

    这次介绍的是Alex和Alessandro于2014年发表在的Science上的一篇关于聚类的文章[13],该文章的基本思想很简单,但是其聚类效果却兼具了谱聚类(Spectral Clustering ...

随机推荐

  1. 2. laravel 5.5 学习 过程中 遇到问题 的 链接

    关于 laravel 5.5 的文档 网络上已经太多 就不些太多重复的话了 在以后的 工作 中遇到问题的 查询到的解决方案 或者 相关文档将会具体写在这里 laravel 5.5 中文文档 https ...

  2. share团队冲刺1

    团队冲刺第一天 今天:网上学习Android软件开发的知识,完成简单的操作,实现简单功能. 问题:无

  3. 寒假day07

    今天没写毕设,看了一些公司招聘的信息,刷了一点相关面试题 1.在一个二维数组中(每个一维数组的长度相同),每一行都按照从左到右递增的顺序排序,每一列都按照从上到下递增的顺序排序.请完成一个函数,输入这 ...

  4. Spring注解配置和xml配置优缺点比较

    Spring注解配置和xml配置优缺点比较 编辑 ​ 在昨天发布的文章<spring boot基于注解方式配置datasource>一文中凯哥简单的对xml配置和注解配置进行了比较.然后朋 ...

  5. 题解 P6004 【[USACO20JAN]Wormhole Sort S】

    这题真的是非常标准的模板题啊 看到连最少的边,第一时间会想到 \(kruskal\) .这道题的难点其实就一个:你要注意到连边权最大的边使整个图联通 为什么:题意是第i个点想走到 \(pos[i]\) ...

  6. 连词词组|relax|brings about a rise in|Chance are (high)that|Have no clue|Be passionate about|Tedious|overwhelmed by piles of

    efficient有效率的 effective有效果的 Make sb. Do Stuff没有复数 首先的三种表述:First off=To begin with=For starters 其次:Ad ...

  7. teminal / console / shell

    console从应用程序角度看的(控制台是管理员用的,唯一的) teminal从用户角度看的(终端是用户用的) 应用程序与console交互 用户与teminal交互 teminal可以不存在 tem ...

  8. ZJNU 1069 - 表达式的转换——中级

    栈运用的模板题,对于符号进行出入栈操作,每次与栈顶的符号进行优先级判断,得出第一行后缀表达式. 在其后的化简计算中,每次用一个特殊符号(代码中使用了'?')代替原来的计算结果引用,并开一个数组表示每次 ...

  9. VMware Horizon view 7安装视频教程

    1.教程介绍1.1::通过本教程起到抛砖引玉效果,希望各位喜爱VMware产品的朋友受益良多. 1.2::以下提供的任何软件仅供学习交流使用. 2.视频教程2.1::ESXI安装视频 链接:https ...

  10. leetcode 746. 使用最小花费爬楼梯

    题目: 数组的每个索引做为一个阶梯,第 i个阶梯对应着一个非负数的体力花费值 cost[i](索引从0开始). 每当你爬上一个阶梯你都要花费对应的体力花费值,然后你可以选择继续爬一个阶梯或者爬两个阶梯 ...