Ribosome profiling|N-terminomics|蛋白质基因组学
生物医学大数据-蛋白质基因组学:质谱注释
蛋白质组与其他组学的关系便是互为印证:蛋白质基因组学原本用于基因组注释,后面扩展到蛋白质与转录组或可变剪接之间关系,同时,蛋白质组依赖于基因组注释作为验证。许多研究未标明蛋白质基因组学,而是归属于对应的组学。
蛋白质基因组学现存问题:
基因组注释方法:1.Denovo。2.与转录组相应证。3.与基因组数据库同源比对。
基因组注释问题:
对于特定结构:
- 起始位点定位信号难以确定
- 确定promoter调控结合位点,错误率高
- 终止位点不被注释
- 可变剪接预测和确认上需要更多基因组的训练数据,使用denovo可以全部预测出来,但是用内含子和外显子仅能预测60%。
对于基因组的常规部分:
- 因为二代reads短所以难拼接
- 以前是鉴定已经存在的基因组,现在是未知物种的genome
- 同类数据不同处理有不同结果
- 人员水平不齐
对于蛋白质组大量质谱数据没被充分解析,可能的原因是
- 蛋白质多种修饰
- 搜索引擎差异
- 其它电荷没鉴定
- 数据库数据不足
没有充分解析造成许多没鉴定出来的数据,这些数据有可能是
- 噪音
- 实验污染,通过加入污染蛋白证实这部分是实验污染,当然鉴定出来之后也会舍弃这部分,对于该部分问题需要改进质控方法。
- 产生混合图谱(即多肽段在同一个图谱)或者融合肽段
- 在已知信息库中未收录的蛋白,即新蛋白
蛋白质基因组学的作用:
1.修正基因模型,即增加新注释,增加新肽段2.反过来由新肽段增加新基因
蛋白质基因组学需要提高的方法
蛋白质实验方面:
- 提高分离技术使蛋白质分的开
- 提高富集技术使得蛋白质量变大
- 高精度仪器
- 提高样本多样性,收集来源于不同时间空间的样本
数据库及数据处理方面:
常规部分存在的问题是大数据库存有大量噪音和相似,数据六位翻译结果搜索空间和denovo差不多。可以通过限制外显子大小,保留高分和正负库方法改进。质量评估时采用多段鉴定。假阳性高,动态范围宽,难鉴定可变剪接(可变剪接来源于denovo大数据库),重拼接假阳性高。
搜索速度方面:
质量过滤低质量、图谱聚类、去重或计算机并行的方法改良检索速度。
新方法:
加入RNAseq比对多重验证。
分成亚细胞组分多种方法鉴定。
体外转录翻译来验证
n-末端组学:使用对角线色谱查肽段末端
DNA和RNA数据辅助蛋白质鉴定
核糖体谱
Ribosome profiling|N-terminomics|蛋白质基因组学的更多相关文章
- 【蛋白质基因组】Proteogenomics方法介绍及分析思路
概念 利用蛋白质组学数据,结合基因组数据(DNA).转录组数据(RNA)来研究基因组注释问题,被称为蛋白质基因组学."蛋白质基因组学"一词由Jaffe 等于2004 年首次提出,作 ...
- lncRNA研究
------------------------------- Long noncoding RNAs are rarely translated in two human cell lines. ( ...
- dbSNP|n SwissVar|n CanProVar|CHPP|mutation assessor|
癌症蛋白质基因组学主要研究driver性质的突变,该突变有可能是转化为癌基因的突变.抑癌基因突变.药物位点突变和蛋白突变,可以使用mutation assessor 预测突变 突变导致疾病,修饰仅影响 ...
- ESTScan|EORF|Augustus|nr|PSM|
生物信息学方法的目的有二:1.常规找鉴定已知蛋白2.鉴定新蛋白 控制数据库大小可以通过增多酶切使得大数据库灵敏性增高数据量变小: 分步搜索是对于经典方法使用后找不到的新蛋白进行补充挖掘,预测蛋白与高可 ...
- Mol Cell Proteomics. | Integration and analysis of CPTAC proteomics data in the context of cancer genomics in the cBioPortal (解读人:徐洪凯)
文献名:Integration and analysis of CPTAC proteomics data in the context of cancer genomics in the cBioP ...
- 【Proteogenomis】工具评述
2015年的综述文章,marker一下,供以后比较试用.蛋白质基因组学研究中的质谱仪与生物信息学方法. 针对蛋白质基因组学的分析研究,总结了质谱仪和蛋白质基因组学流程分析软件的选择,重点评述了常用的生 ...
- DIP|PCN|CoevDB|PID|Y2H|RosettaDock Serve|元基因组学|微生物多样性
生命组学: 比较真核生物有关呼吸链的gene是比较核外编码基因,因为与呼吸有关的功能在线粒体上,线粒体位于核外.想要查看两种基因是否具有相互作用,可以对不同物种的编码ATP6 和ATP8的直系同源基因 ...
- Alterations of brain quantitative proteomics profiling revealed the molecular mechanisms of diosgenin against cerebral ischemia reperfusion effects(大脑的定量蛋白质组学揭示了薯蓣皂苷元对脑缺血再灌注效应的分子机制)
文献名:Alterations of brain quantitative proteomics profiling revealed the molecular mechanisms of dios ...
- Deep Protein Methylation Profiling by Combined Chemical and Immunoaffinity Approaches Reveals Novel PRMT1 Targets (结合层析法和免疫沉淀法的蛋白甲基化的深度检测技术发现了PRMT1新的靶标蛋白)
题目:Deep Protein Methylation Profiling by Combined Chemical and Immunoaffinity Approaches Reveals Nov ...
随机推荐
- 干货 | 京东云原生容器—SpringCloud实践(一)
"云原生"成为近年热词并不是一种偶然,它不是一个软件,也不是一种框架,而是一堆理念集合,以及围绕这些理念所产生的一些最佳实践的工具.云原生天然就是作用于服务架构的,可以视作一个服务 ...
- python刷LeetCode:2.两数相加
难度等级:中等 题目描述: 给出两个 非空 的链表用来表示两个非负的整数.其中,它们各自的位数是按照 逆序 的方式存储的,并且它们的每个节点只能存储 一位 数字. 如果,我们将这两个数相加起来,则会返 ...
- atan2&sin
//弧度转化角度:弧度*180/PI //角度转化弧度:角度*PI/180 #include <math.h> #include <stdio.h> const double ...
- 在项目中ES6语法转ES5语法 babel转码器
es6 babel 安装以及使用 1,安装好node(需要使用npm包管理工具) 2,在本地项目路径下npm init,格式化成功后会在项目下生成一个配置文件package.json 3,本地安装 ...
- go语言学习资料
Go语言圣经(中文版): https://docs.hacknode.org/gopl-zh/index.html Go语言高级编程(Advanced Go Programming) https:// ...
- linux系统终端介绍
https://zhidao.baidu.com/question/174261014.html
- 吴裕雄--天生自然 JAVA开发学习:正则表达式
import java.util.regex.*; class RegexExample1{ public static void main(String args[]){ String conten ...
- 自由职业平台Upwork申请上市,能给国内猪八戒网带来什么启示?
当下,在互联网的全面渗入下已经对整个社会的运行机制.大众的生活产生了前所未有的影响.尤其是在工作方面,更是衍生出诸多新兴职业.如,主播.水军.新媒体运营.自媒体人等.值得注意的是,这些职业绝大部分都有 ...
- 如何判断Office是32位还是64位?
对于持续学习VBA的老铁们,有必要了解Office的位数. 如果系统是32位的,则不需要判断Office位数了,因为只能安装32位Office. 下面只讨论64位系统中,Office的位数判断问题. ...
- 初次运行Git前的配置
初次运行Git前的配置 一.初次运行 Git 前的配置 一般在新的系统上,我们都需要先配置下自己的 Git 工作环境.配置工作只需一次,以后升级时还会沿用现在的配置.当然,如果需要,你随时可以用相同的 ...