概念

利用蛋白质组学数据,结合基因组数据(DNA)、转录组数据(RNA)来研究基因组注释问题,被称为蛋白质基因组学。“蛋白质基因组学”一词由Jaffe 等于2004 年首次提出,作者采用串联质谱数据匹配DNA翻译得到氨基酸序列的方法,在仅有810 kb 大小的细菌基因组上直接鉴定开放阅读框(open reading frame,ORF),验证并补充、修订了约10%的ORF。后来这种质谱数据结合DNA 和RNA 数据的分析方法被应用到注释病毒基因组、原核生物基因组以及真核生物基因组。

本来只是利用蛋白质组的质谱数据完善基因组注释的方法,近年来却因为“精准医疗”带火了。各种癌症利用这一方法砸钱发了一篇又一篇的CNS文章。

想更多了解,看综述文章:

Proteogenomics: concepts, applications, and computational strategies

Clinical Potential of Mass Spectrometry-Based Proteogenomics

Proteogenomics: From Next-Generation Sequencing (NGS) and Mass Spectrometry-Based Proteomics to Precision Medicine

Methods, Tools and Current Perspectives in Proteogenomics



技术背景

不讨论精准医疗方面的利用(聚焦于突变位点的研究),重点谈论蛋白质基因组中对基因组重注释的信息分析方法。

目前,基于质谱技术的蛋白组学对于研究生物体所有蛋白质在时间、空间的表达作出了重要的贡献。与核酸测序技术不同的是,蛋白组技术并不能一个一个氨基酸检测出来,而是通过质谱图与理论的蛋白序列来进行匹配。然而,这个技术必须建立这样的假设上:

  • 1)该物种基因组被完全测序且的绝大多数基因注释都比较完善。
  • 2)公共数据库含有较为完整的蛋白序列。

    然而,目前并不是所有基因的注释都十分清楚,如氨基酸突变、新的蛋白编码位点和可变剪切。

蛋白质基因组学技术(Proteogenomics)旨在基于蛋白质谱数据,结合基因组和转录组的注释信息,在蛋白层次上挖掘、验证:

    1. 新的蛋白编码区域;
    1. 新的转录本;
    1. 氨基酸突变事件。

      这些信息在物种基因组注释信息、提供基因模型表达证据、完善物种蛋白组序列数据库上有重要意义。

分析方法和思路

利用蛋白基因组技术对物种基因组进行重注释,其中最重要的一环为氨基酸特征序列数据库的构建。“ 好”的构库方法能够保证后续能够验证到尽可能多的有效序列,同时不因数据库尺寸“过度膨胀”导致太多假阳性验证结果。

  1. 首先,需要对相应物种(某些组织)进行一定深度的转录组测序,然后基于基因组参考序列,比对原始数据并组装获取编码转录本、LncRNA、可变剪切位点、SNV等信息。利用上述一种或多种信息根据一定规则构建自定义的特征列数据库。通常情况下,推荐使用与蛋白质组实验相同样品进行转录组数据的采集。某些情况下,也可从已发表文献或公共数据库收集同一物种转录组数据辅助构库。

  2. 接着,针对该物种,获取蛋白表达数据,一方面可以利用质谱进行蛋白组学分析,另外一方面,可以从已发表数据获取,例如PRIDE,PeptideAtlas等。而谱图鉴定引擎将采集到的质谱数据与之前构建的数据库中的肽段进行肽谱匹配打分。

  3. 不同于常规蛋白鉴定质控过程,新特征序列数据库存在大量的冗余和随机序列。 因此需要更为严格的质控标准和验证方法才能保证鉴定到的新序列足够可信。

  4. 对鉴定好的新肽段进行筛选分类,统计不同事件的数目。进行人工检视辅助验证各事件的可靠性。最后完成事件的基因组定位及数据可视化展示。

输入

基因组信息:

  1. 物种的基因组全序列:genome.fasta

  2. 基因注释文件:gene.gff

转录组数据:

  1. 测序平台:Highseq2000, 4000, X Ten

  2. 下机原始数据:.fastq文件

  3. 测序量:>2.5G/样品 (二倍体)

蛋白组数据:

  1. 样品组织类型:与转录组配对

  2. 数据量:>200,000张图谱

  3. 质谱数据类型:iTRAQ/TMT,Label-free

  4. 质谱仪器:高分辨率质谱仪(qTOF, Orbitraq)

输出

1)经典蛋白鉴定

2)新基因鉴定

3) 新转录本鉴定

4)SAV鉴定

Ref:https://www.genebang.com/pl/details/vy1E9y

http://www.doc88.com/p-3167460031564.html

【蛋白质基因组】Proteogenomics方法介绍及分析思路的更多相关文章

  1. android设置中的Preferencescreen使用方法介绍与分析

    今天主要研究了一下设置中的Preferencescreen应用,它不仅可以作为设置界面显示,并且还可以启动activity,以下主要是对启动activity的介绍 1. Preferencescree ...

  2. 基于TP框架的ThinkCMF,控制器display方法源码分析

    昨天在写代码的时候,看见写了无数次的模版渲染方法:$this->display(),突然很想弄清楚它是如何实现的. 今天不忙,就分析了一下. class TestController exten ...

  3. CPU利用率异常的分析思路和方法交流探讨

    CPU利用率异常的分析思路和方法交流探讨在生产运行当中,经常会遇到CPU利用率异常或者不符合预期的情况,此时,往往暗示着系统性能问题.那么究竟是核心应用的问题?是监控工具的问题?还是系统.硬件.网络层 ...

  4. DNA甲基化测序方法介绍

    DNA甲基化测序方法介绍 甲基化 表观遗传学 DNA 甲基化是表观遗传学(Epigenetics)的重要组成部分,在维持正常细胞功能.遗传印记.胚胎发育以及人类肿瘤发生中起着重要作用,是目前新的研究热 ...

  5. 多线程_java多线程环境下栈信息分析思路

    导读:Java多线程开发给程序带来好处的同时,由于多线程程序导致的问题也越来越多,而且对问题的查找和分析解决对于菜鸟程序原来是是件头疼的事.下面我就项目中使用多线程开发程序过程中遇到的问题做详细的分析 ...

  6. Lua游戏逆向及破解方法介绍

    Lua游戏逆向及破解方法介绍   背景介绍 随着手游的发展,越来越多的Cocos-lua端游开发者转移到手游平台.Lua脚本编写逻辑的手游也是越来越多,如梦幻西游.刀塔传奇.开心消消乐.游龙英雄.奇迹 ...

  7. WOE:信用评分卡模型中的变量离散化方法(生存分析)

    WOE:信用评分卡模型中的变量离散化方法 2016-03-21 生存分析 在做回归模型时,因临床需要常常需要对连续性的变量离散化,诸如年龄,分为老.中.青三组,一般的做法是ROC或者X-tile等等. ...

  8. 【性能测试】常见的性能问题分析思路(二)案例&技巧

    上一篇介绍了性能问题分析的诊断的基本过程,还没看过的可以先看下[性能测试]常见的性能问题分析思路-道与术,精炼总结下来就是,当遇到性能问题的时候,首先分析现场,然后根据现象去查找对应的可能原因,在通过 ...

  9. 【jvm】09-full gc分析思路

    [jvm]09-full gc分析思路 欢迎关注b站账号/公众号[六边形战士夏宁],一个要把各项指标拉满的男人.该文章已在github目录收录. 屏幕前的大帅比和大漂亮如果有帮助到你的话请顺手点个赞. ...

随机推荐

  1. Beta阶段第七次会议

    Beta阶段第七次会议 时间:2020.5.23 完成工作 姓名 工作 难度 完成度 ltx 1.修改小程序页面无法加载bug2.修改条件语句,使得页面能够正常显示 中 90% xyq 1.根据api ...

  2. [no code][scrum meeting] Beta 3

    $( "#cnblogs_post_body" ).catalog() 例会时间:5月15日11:30,主持者:肖思炀 下次例会时间:5月16日11:30,主持者:伦泽标 一.工作 ...

  3. [技术博客] K-Means算法

    遇到的问题 在对微软\(OCR\)的\(api\)进行测试的过程中,我发现有时候它并不能分析出一个表格的形态,也就是说不知道每个文本对应在表格中的第几行第几列.但是它可以较为准确的给出这些文本的坐标. ...

  4. 访问所有HTTPS网站显示连接不安全 (火狐浏览器)

    当 Firefox 连接到一个安全的网站时(网址最开始为"https://"),它必须确认该网站出具的证书有效且使用足够高的加密强度.如果证书无法通过验证,或加密强度过低,Fire ...

  5. 从零开始搭建你的nvim ide

    前言概述 vim由于其丰富的扩展性.出色的跨平台性.高效率的操作性深受一大批粉丝的追捧,甚至就连vim和emacs之间孰优孰劣的话题都能被引起一场编辑器之间的圣战,足以见vim是多么的优秀. vim的 ...

  6. Docker配置tomcat端口映射后无法访问(404)

    1.配置tomcat端口映射 2.访问测试 3.修改webapps文件,webapps.dist是所需文件 4.虚拟机中重新访问 5.在主机也能访问成功(注意路径为虚拟机IP,不是localhost)

  7. mysql查询表名和列名字

    -- 登录yellowcong 数据库 mysql -uroot -proot yellowcong -- 查看当前数据库 select database() -- 查看数据库里面的表 --table ...

  8. dart系列之:dart语言中的内置类型

    目录 简介 Null 数字 字符串 布尔值 列表 set和map 简介 和所有的编程语言一样,dart有他内置的语言类型,这些内置类型都继承自Object,当然这些内置类型是dart语言的基础,只有掌 ...

  9. Linux 服务器的基本性能及测试方法

    1. 摘要 一个基于 Linux 操作系统的服务器运行的同时,也会表征出各种各样参数信息.通常来说运维人员.系统管理员会对这些数据会极为敏感,但是这些参数对于开发者来说也十分重要,尤其当程序非正常工作 ...

  10. Unity——技能系统(一)

    技能系统(一) 一.Demo展示 二.功能介绍 集成了技能,冷却,buff,UI显示,倒计时,动画等: 技能类型:弹道技能,动画事件根据帧数采用延迟调用技能,自定义释放位置(偏移,发射点两种),buf ...