生命组学

蛋白质之间的互作可以有以下应用:

Eg:改变蛋白质基因,从而组改变结构,削弱蛋白质之间的相互作用。

Eg:数据模拟出蛋白质的靶点,即结合腔,将此数据存入结合化合物的dataset,用于制药

结构预测:

通用方法:首先将得到序列采用Fasta(全局序列比对)&blast(局部序列比对)在PDB中(此数据库中有实验数据和计算预测得到的数据)找模板modeling。找模板的方法可以基于sequence similarity。可以基于structure相似性,因为存在氨基酸序列不同但是最终组成相似结构的情况,此方法quality高。可以基于研究目的(ligands and cofactors)。对于alignment方面,最好采用全局比对,多模板序列比对可得到低相似度结果但比较准确,pair模板序列比对结果具有高相似度,可用于保守区验证。model building方法:1.满足钢铁模型直接把保守区域的copy到给未知序列。2.方法一对于序列要求很高,必有没能连上的部分,没连上部分fragment assembly,这样得到的结构与膜件相似度高3.通过空间限制条件,利用打分机制判断,结果准确同时与膜件相似度低。用于assembly的software有insight QUANTA和SYBYL COMPOSER,这两个软件是图形界面且收费。也可使用MODELLER编译。在线分析软件有SWISS_MODEL、WHAT IF、3D-JIGSAW、CPH-Model。

普通方法用于水环境,Membrane protein溶液环境。

实验测困难,所以采用bioinformation的方法预测结构,特殊之处在于modeling Membrane protein structure模板是GPCRs(有螺旋),主要预测蛋白质形态,所处位置和胞内胞外结构,再将三者组合成初始结构,然后进一步优化旋转方向。

功能预测基于已解析的功能信息,有以下五种原理:

1.可使用自动化脚本在数据库中找sequence similarity,利用experiment判据选择。

2.因为结构比序列更保守,所以可采用structure-based。利用结构相似性找对应序列,分解出序列特征,通过序列相似性找相似性功能SCOP。其中,不同层级准确性不同:class <fold <superfamily <family

3.可通过预测结合腔的大小、形状、理化性质,从而得到功能域信息,有功能域就有功能

4.以motif-based为基本单位预测,选择可用功能,之后做进化树判断选择近源功能。

5.从System level角度来说,在KEGG pathway找到通路中的功能。

蛋白质之间互作网络便是PPI网络,它有两种类型:1.几种蛋白质参与同一个生物学过程,这是间接互作。2.几种蛋白质组成同一个复合物,这是直接接触而互作(eg:蛋白质复合物;四级结构)共同作用结果是行使功能。

研究互作方法:

  1. Phylogenetic profile method:某些基因经常同时存在,则认为这些基因对应蛋白质互作。
  2. Gene neighborhood:基因相对位置保守,则认为这些蛋白质互作。
  3. 物种A中两个功能域在同一个蛋白上,物种B中转变为两个蛋白质,则认为这两个蛋白质互作。这是因为真核生物中的调控更复杂,需要更多原件,所以有些功能域分化出来,基因组变大。
  4. 基因共进化:因为基因组系统发育树相近所以有可能蛋白质拓扑关系一致(eg1:一个带正电一个带负电。Eg2:金属A与金属B互作,A变则B也变),可以用跨物种比对拓扑关系,比对可用打分矩阵,最后用相关系数来判断,若等于1则说明有互作。

Protein interaction|insight QUANTA|SYBYL COMPOSER|MODELLER|SWISS_MODEL|WHAT IF|3D-JIGSAW|CPH-ModelGPCRs|Membrane protein|的更多相关文章

  1. 用R的igraph包来画蛋白质互作网络图 | PPI | protein protein interaction network | Cytoscape

    igraph语法简单,画图快速. Cytoscape专业,个性定制. 最终效果图: 当然也可以用Cytoscape来画. 参考:Network visualization with R Cytosca ...

  2. 08 Translating RNA into Protein

    Problem The 20 commonly occurring amino acids are abbreviated by using 20 letters from the English a ...

  3. 文献笔记:Genome-wide associations for birth weight and correlations with adult disease

    该文献纳入了EGG(Early Growth Genetics Consortium)和UK biobank两大数据库,分为欧洲祖先和非欧洲祖先群体.这两个数据用到的样本量分别如下: Early Gr ...

  4. 生物数据库介绍——NCBI

    NCBI(National Center for Biotechnology Information,美国国家生物技术信息中心)除了维护GenBank核酸序列数据库外,还提供数据分析和检索资源.NCB ...

  5. MGI数据库挖掘 | MGI-Mouse Genome Informatics | InWeb database

    做生物信息,遗传发育,分析数据的时候总是要narrow down分析范围,高通量数据尤其是基因表达,在庞大的confounder面前,缩小分析范围是必须的,否则你会一直在混沌中游荡. 看一篇文章:20 ...

  6. Zn离子参数

    Generating Topology and Coordinates Files Using xLeap (AmberTools V1.5) Parameter and example files: ...

  7. 蛋白质结构模型和功能预测:I-TASSER工具的使用

    I-TASSER是一款用于预测蛋白质结构和功能的工具,网站链接:https://zhanglab.ccmb.med.umich.edu/I-TASSER/ 具体描述如下: I-TASSER (Iter ...

  8. 全球最大的3D数据集公开了!标记好的10800张全景图

    Middlebury数据集 http://vision.middlebury.edu/stereo/data/ KITTI数据集简介与使用 https://blog.csdn.net/solomon1 ...

  9. 构建NCBI本地BLAST数据库 (NR NT等) | blastx/diamond使用方法 | blast构建索引 | makeblastdb

    参考链接: FTP README 如何下载 NCBI NR NT数据库? 下载blast:ftp://ftp.ncbi.nlm.nih.gov/blast/executables/blast+ 先了解 ...

随机推荐

  1. C语言-字、半字、内存位宽相关

    1.32位系统:32位系统指的是32位数据线,但是一般地址线也是32位,这个地址线32位决定了内存地址只能有32位二进制,所以逻辑上的大小为2的32次方.内存限制就为4G.实际上32位系统中可用的内存 ...

  2. 视图家族之视图工具集viewsets

    视图家族之视图工具集viewsets 一.视图集ViewSet 使用视图集ViewSet,可以将一系列逻辑相关的动作放到一个类中: list() 提供一组数据 retrieve() 提供单个数据 cr ...

  3. 4418之Android Eclipse导入应用程序在开发板上调试

    由于在开发板上 LEDtest 应用已经默认安装了,所以在开发板上调试已安装应用的时候,需要做一下处理才能够正常连接.基于迅为iTOP4418开发板如下图所示,在打开工程“ledtest”,打开“bi ...

  4. ActiveMQ消息队列的搭建

    今天来写下消息队列 一.首先介绍下什么是activeMQ? ActiveMQ 是Apache出品,最流行的,能力强劲的开源消息总线.ActiveMQ 是一个完全支持JMS1.1和J2EE 1.4规范的 ...

  5. nginx 报错Malformed HTTP request line, git 报错fatal: git-write-tree: error building trees

    nginx 报错由于url里有空格,包括url本身或者参数有空格 git 报错是因为解决冲突的时候没有add,即没有merge

  6. 关于http协议的总结

    http协议知识结构图 简介 HTTP(HyperText Transfer Protocol),超文本传输协议,是Web应用的基本协议 HTTP规定了客户端(浏览器)和服务器之间的通信步骤以及通信时 ...

  7. ae基础二

    纯色文本操作快捷键:选中图层点击快捷键(变换)锚点:a(调节中心点)位置:p(左右移动)(利用位置k帧做动画)缩放:s(水平翻转垂直翻转)旋转:r(围绕中心点(锚点)进行旋转)不透明度:tu选中索引 ...

  8. Codeforces 1288C - Two Arrays

    题目大意: 给定n和m,有两个数组,两个数组的长度都等于m 数组内每个元素都在1到n中 对于两个数组对应的位置i,必须满足a[i]<=b[i] a数组必须是不下降的序列 b数组必须是不上升的序列 ...

  9. 题解【[BJOI2015]树的同构】

    切了省选题+紫题,来写个题解 这题其实挺水,才120行代码 该题写了我一天(上午1.5h,晚上10min = 一天) hash,对于节点A,\[hashval[A] = \{hashval[i]\ti ...

  10. amazon中文文档

    在线调试器 https://mws.amazonservices.com.cn/scratchpad/index.html mws 中心 https://developer.amazonservice ...