生命组学

蛋白质之间的互作可以有以下应用:

Eg:改变蛋白质基因,从而组改变结构,削弱蛋白质之间的相互作用。

Eg:数据模拟出蛋白质的靶点,即结合腔,将此数据存入结合化合物的dataset,用于制药

结构预测:

通用方法:首先将得到序列采用Fasta(全局序列比对)&blast(局部序列比对)在PDB中(此数据库中有实验数据和计算预测得到的数据)找模板modeling。找模板的方法可以基于sequence similarity。可以基于structure相似性,因为存在氨基酸序列不同但是最终组成相似结构的情况,此方法quality高。可以基于研究目的(ligands and cofactors)。对于alignment方面,最好采用全局比对,多模板序列比对可得到低相似度结果但比较准确,pair模板序列比对结果具有高相似度,可用于保守区验证。model building方法:1.满足钢铁模型直接把保守区域的copy到给未知序列。2.方法一对于序列要求很高,必有没能连上的部分,没连上部分fragment assembly,这样得到的结构与膜件相似度高3.通过空间限制条件,利用打分机制判断,结果准确同时与膜件相似度低。用于assembly的software有insight QUANTA和SYBYL COMPOSER,这两个软件是图形界面且收费。也可使用MODELLER编译。在线分析软件有SWISS_MODEL、WHAT IF、3D-JIGSAW、CPH-Model。

普通方法用于水环境,Membrane protein溶液环境。

实验测困难,所以采用bioinformation的方法预测结构,特殊之处在于modeling Membrane protein structure模板是GPCRs(有螺旋),主要预测蛋白质形态,所处位置和胞内胞外结构,再将三者组合成初始结构,然后进一步优化旋转方向。

功能预测基于已解析的功能信息,有以下五种原理:

1.可使用自动化脚本在数据库中找sequence similarity,利用experiment判据选择。

2.因为结构比序列更保守,所以可采用structure-based。利用结构相似性找对应序列,分解出序列特征,通过序列相似性找相似性功能SCOP。其中,不同层级准确性不同:class <fold <superfamily <family

3.可通过预测结合腔的大小、形状、理化性质,从而得到功能域信息,有功能域就有功能

4.以motif-based为基本单位预测,选择可用功能,之后做进化树判断选择近源功能。

5.从System level角度来说,在KEGG pathway找到通路中的功能。

蛋白质之间互作网络便是PPI网络,它有两种类型:1.几种蛋白质参与同一个生物学过程,这是间接互作。2.几种蛋白质组成同一个复合物,这是直接接触而互作(eg:蛋白质复合物;四级结构)共同作用结果是行使功能。

研究互作方法:

  1. Phylogenetic profile method:某些基因经常同时存在,则认为这些基因对应蛋白质互作。
  2. Gene neighborhood:基因相对位置保守,则认为这些蛋白质互作。
  3. 物种A中两个功能域在同一个蛋白上,物种B中转变为两个蛋白质,则认为这两个蛋白质互作。这是因为真核生物中的调控更复杂,需要更多原件,所以有些功能域分化出来,基因组变大。
  4. 基因共进化:因为基因组系统发育树相近所以有可能蛋白质拓扑关系一致(eg1:一个带正电一个带负电。Eg2:金属A与金属B互作,A变则B也变),可以用跨物种比对拓扑关系,比对可用打分矩阵,最后用相关系数来判断,若等于1则说明有互作。

Protein interaction|insight QUANTA|SYBYL COMPOSER|MODELLER|SWISS_MODEL|WHAT IF|3D-JIGSAW|CPH-ModelGPCRs|Membrane protein|的更多相关文章

  1. 用R的igraph包来画蛋白质互作网络图 | PPI | protein protein interaction network | Cytoscape

    igraph语法简单,画图快速. Cytoscape专业,个性定制. 最终效果图: 当然也可以用Cytoscape来画. 参考:Network visualization with R Cytosca ...

  2. 08 Translating RNA into Protein

    Problem The 20 commonly occurring amino acids are abbreviated by using 20 letters from the English a ...

  3. 文献笔记:Genome-wide associations for birth weight and correlations with adult disease

    该文献纳入了EGG(Early Growth Genetics Consortium)和UK biobank两大数据库,分为欧洲祖先和非欧洲祖先群体.这两个数据用到的样本量分别如下: Early Gr ...

  4. 生物数据库介绍——NCBI

    NCBI(National Center for Biotechnology Information,美国国家生物技术信息中心)除了维护GenBank核酸序列数据库外,还提供数据分析和检索资源.NCB ...

  5. MGI数据库挖掘 | MGI-Mouse Genome Informatics | InWeb database

    做生物信息,遗传发育,分析数据的时候总是要narrow down分析范围,高通量数据尤其是基因表达,在庞大的confounder面前,缩小分析范围是必须的,否则你会一直在混沌中游荡. 看一篇文章:20 ...

  6. Zn离子参数

    Generating Topology and Coordinates Files Using xLeap (AmberTools V1.5) Parameter and example files: ...

  7. 蛋白质结构模型和功能预测:I-TASSER工具的使用

    I-TASSER是一款用于预测蛋白质结构和功能的工具,网站链接:https://zhanglab.ccmb.med.umich.edu/I-TASSER/ 具体描述如下: I-TASSER (Iter ...

  8. 全球最大的3D数据集公开了!标记好的10800张全景图

    Middlebury数据集 http://vision.middlebury.edu/stereo/data/ KITTI数据集简介与使用 https://blog.csdn.net/solomon1 ...

  9. 构建NCBI本地BLAST数据库 (NR NT等) | blastx/diamond使用方法 | blast构建索引 | makeblastdb

    参考链接: FTP README 如何下载 NCBI NR NT数据库? 下载blast:ftp://ftp.ncbi.nlm.nih.gov/blast/executables/blast+ 先了解 ...

随机推荐

  1. 2. Rabbitmq php 安装 amqp 拓展

    记录一下 使用 rabbitmq 安装 amqp 拓展 环境 ubuntu   安装目录在 /user/local 下进行 1. 安装 wget apt-get update apt-get inst ...

  2. Python笔记_第四篇_高阶编程_进程、线程、协程_3.进程vs线程

    1.多任务的实现原理: 通常我们会设计Mater-Workder模式,Master负责分配任务,Worker负责执行任务,因此多任务环境下,通常是一个Master,多个Worker 2.多进程: 主进 ...

  3. gbdt在回归方面的基本原理以及实例并且可以做分类

    对书法的热爱,和编译器打数学公式很艰难,就这样的正例自己学过的东西,明天更新gbdt在分类方面的应用. 结论,如果要用一个常量来预测y,用log(sum(y)/sum(1-y))是一个最佳的选择. 本 ...

  4. slideshare文档下载

    if [ x"$1" = x1 ]; then for i in {1..46}; do url_i="https://image.slidesharecdn.com/b ...

  5. 吴裕雄--天生自然Linux操作系统:linux yum 命令

    yum( Yellow dog Updater, Modified)是一个在Fedora和RedHat以及SUSE中的Shell前端软件包管理器. 基於RPM包管理,能够从指定的服务器自动下载RPM包 ...

  6. block内存篇

    本文目的:对Block内存问题更加了解 概念理解:一种数据类型或比较特殊的对象,相当于一个指向函数的指针,该指针指向一段封装代码,调用block块代码好比调用该指针指向的函数代码 block分类: N ...

  7. Heavy Light Decomposition

    Note 1.DFS1 mark all the depth mark fathers mark the heavy/light children mark the size of each subt ...

  8. 蓝桥杯2015-省赛-C/C++-A组2题 星系炸弹

    在X星系的广袤空间中漂浮着许多X星人造“炸弹”,用来作为宇宙中的路标.每个炸弹都可以设定多少天之后爆炸.比如:阿尔法炸弹2015年1月1日放置,定时为15天,则它在2015年1月16日爆炸.有一个贝塔 ...

  9. vector内部的实现1

    写vector的内部方法 #include<vector> using std::vector; //写一个动态内存 class CA{ int a; public: CA(int i){ ...

  10. JavaSE--jdom解析之bom

    参考:http://www.cnblogs.com/findumars/p/3620078.html org.jdom2.input.JDOMParseException: Error on line ...