PEAKS|NovoHMM|Nover|DeepNovo|MAYUPercolator|UniprotKB|Swiss-prot|Mascot|SEQUEST|X!Tandem|pFind|MaxQuant|Msconvert|PEPMASS|LC|
质谱仪:
质谱分析法是先将大分子电离为带电粒子,按质核比分离,由质谱仪识别电信号得到质谱图。
Top-down直接得到结果是蛋白。
Bottom down使用shutgun方法得到结果是肽段。
由蛋白质混合物打断为肽段混合物,按特定时间分离为LC,
初次得到的谱图为一级谱,一级谱是串联质谱,其中一个峰一个肽段。选出一个峰作为二级谱的原料,选出母离子(母离子就是整个肽段 PEPMASS)并打断送入质谱仪,二级谱是一张图中的一个肽段。除此之外还可以做更多等级的图谱,tandem mass spectrometry),二级谱图用于核心定性。利用蛋白酶的对在不同理化条件下产生不同切点的性质进行酶切,一般用一种酶切,有时候为了比对用两种。其中,子离子与肽段的关系:子离子构成肽段,即子离子的构造是“羧基----离子---氨基”式组合。当AA一个个掉掉下来之后,测量得到b+y成对数据,即peptide fragment。
质谱分析方法有从头分析法和数据库搜索匹配法,常用数据库法,即实验谱图在已知肽段理论图谱数据库中找匹配。
数据处理流程:
因为不同质谱仪产出不同格式,所以要对数据进行格式转换。Msconvert用于质谱转换用于预处理,可以降噪音,母离子矫正和输出规范化数据。
可以选择以下搜索引擎,Mascot的鉴定效果好;SEQUEST是传统的工具,不易学习和升级但是免费开源;X!Tandem可随需改动;pFind由小团队制作,但是灵敏度好;MaxQuant可同时产出定性和定量数据,使用方便,但覆盖率低。不同软件结果有不同,最好比对后选择一种。
可以选择数据库,Uniprot中的UniprotKB&Swiss-prot高质量,低冗余而且是人工的专家确认;neXtprot存储有关人类蛋白质数据,并有与实验证据相联系;IPI的稳定性比较差;NCBI中的RefSeq&nr是常见数据库直接加和,所以该数据库冗余量大,噪音非常大。
搜索引擎参数设定
蛋白质的鉴定和质检:
基于数据库法:
基于图谱数据库法的质检主要关注假阳性FDR false discover rate,因为从谱图到肽段到蛋白误差逐渐放大。如图,在某一图谱总错误导致一个蛋白错误。所以在谱图阶段就应该质检。原始数据中连续y连续b是好的。
先将蛋白质序列切成肽段序列,之后按照肽段分子排序,确定一个长度标准作为可鉴定出来的肽段,然后保留可鉴定长度的肽段。根据这些肽段找在数据库中候选图谱,组成理论图谱基于打分函数(Xcorr & △cn第一差距与第二差距)的得分判断图谱的可信度。
可基于正伪序列库方法使用Percolator做质量控制,因为理论图谱是正确序列和错误序列的集合,而伪库就是错误序列的集合,其补集是正取序列。如此做减法,得到图谱的线性模型或曲线模型,变成分类问题,以此找到正取的那部分。
此时存在共享肽段存在蛋白推导的困难,可以使用简约组装蛋白法。简约组装蛋白是选择最多信息承载的最少蛋白组合而成的蛋白组。常用MAYU法。
基于从头预测法:
从头测序预测方法是每个AA都算一遍,此方法可产生新蛋白,有PEAKS,NovoHMM,常用Nover方法,因其速度快,DeepNovo是深度学习方法。
PEAKS|NovoHMM|Nover|DeepNovo|MAYUPercolator|UniprotKB|Swiss-prot|Mascot|SEQUEST|X!Tandem|pFind|MaxQuant|Msconvert|PEPMASS|LC|的更多相关文章
- maker 2008年发表在genome Res
http://gmod.org/wiki/MAKER_Tutorial 简单好用 identify repeats, to align ESTs and proteins to the genome, ...
- Proteomes of paired human cerebrospinal fluid and plasma: Relation to blood-brain barrier permeability in older adults (文献分享一组-潘火珍)
题目:Proteomes of paired human cerebrospinal fluid and plasma: Relation to blood-brain barrier permeab ...
- The Swiss Army Knife of Data Structures … in C#
"I worked up a full implementation as well but I decided that it was too complicated to post in ...
- 【BZOJ-3545&3551】Peaks&加强版 Kruskal重构树 + 主席树 + DFS序 + 倍增
3545: [ONTAK2010]Peaks Time Limit: 10 Sec Memory Limit: 128 MBSubmit: 1202 Solved: 321[Submit][Sta ...
- 运行java -version报cannot restore segment prot after reloc: Permission denied
linux 安装jdk1.6后,运行java -version,没有出现相关的版本信息,而是出现了以下错误: dl failure on line 685Error: failed /usr/loca ...
- 动态库加载出错,cannot restore segment prot after reloc: Permission denied
转自:taolinke的博客 项目中碰到的问题,编译好的so文件,放到其他机器上去加载,报了错误,cannot restore segment prot after reloc: Permission ...
- cannot restore segment prot after reloc: Permission denied
编辑/etc/selinux/config,找到这段:# This file controls the state of SELinux on the system. # SELINUX= can t ...
- *[codility]Peaks
https://codility.com/demo/take-sample-test/peaks http://blog.csdn.net/caopengcs/article/details/1749 ...
- Clustering by density peaks and distance
这次介绍的是Alex和Alessandro于2014年发表在的Science上的一篇关于聚类的文章[13],该文章的基本思想很简单,但是其聚类效果却兼具了谱聚类(Spectral Clustering ...
随机推荐
- JavaScript—飞机大战
今天来写个游戏,飞机大战 1,布局 2,思路 1,动态创建自己的飞机 让它在规定的区域,跟着鼠标运动. 2,在自己飞机的上方,间隔1s生成子弹.子弹往上移动 当top:0 子弹消失 3,每隔1s 产生 ...
- ICRA 2019最佳论文公布 李飞飞组的研究《Making Sense of Vision and Touch: Self-Supervised Learning of Multimodal Representations for Contact-Rich Tasks》获得了最佳论文
机器人领域顶级会议 ICRA 2019 正在加拿大蒙特利尔举行(当地时间 5 月 20 日-24 日),刚刚大会公布了最佳论文奖项,来自斯坦福大学李飞飞组的研究<Making Sense of ...
- JavaScript sort()方法总结
sort() 方法用于对数组的元素进行排序. 语法:arrayObject.sort(sortby):参数sortby可选.规定排序顺序.必须是函数. 注:如果调用该方法时没有使用参数,将按字母顺序对 ...
- 寒假day04
今天编写了毕设系统中的专家画像模块,实现了人员标签的建立与划分,同时刷了牛客网的面试相关题目. 1.如果系统的umask设置为244,创建一个新文件后,它的权限:(C) --w-r--r-- -r-x ...
- Linux--Centos 下搭建 gitolite
参考:http://blog.csdn.net/zhangjs0322/article/details/32711211 http://gitolite.com/gitolite/fool_p ...
- Linux应用编程之lseek详解
Linux应用编程之lseek详解 1.lseek函数介绍 (1).文件指针:当我们要对一个文件进行读写时,一定要先打开这个文件,所以我们读写的所有文件都是动态文件.动态文件在内存中的形态就是文件流的 ...
- github新手使用教程
1.首先打开https://github.com/官网 注册一个github账号 2.注册成功之后,登录账号,创建一个属于自己的库 3.创建完成之后,为了方便电脑上的代码上传到github 仓库上,要 ...
- 在后端C#中 call web api
我们要想使用web api, 需要首先在azure 中创建application. (如何创建application可以参考我的另一篇blog 从O365中获取users到D365中 ) Get 我们 ...
- tensorflow用法记录
使用 embedding 变量 import tensorflow as tf import numpy as np sess = tf.InteractiveSession() M = list(' ...
- 53)vptr指针的分布初始化
1)一个父类: 2)一个子类: 3)我的main函数内容 4)通过结果证明 那么产生了问题,这个print是一个虚函数,不应该 在 我的main函数中 通过调用pp->print,在pr ...