化学键|甘氨酸|谷氨酸|半胱胺酸|motif|domain|疏水相互作用|序列相似性|clustering analysis|Chou and Fasman|GOR|PHD|穿线法|first-principle ab initio folding|

生命组学

对Protein的分析可以从Sequence到structure到function,最后研究interaction。

Structure:

化学键形成骨架,化学元素的选取基于合成蛋白质选择容易获取的元素,氨基酸化学元素的选取决定了其结构,其结构又决定了function。氨基酸的组织结构可以解释其function:甘氨酸最小,所以可以放到不同位置;谷氨酸顺反式都有,所以便于结构调整;半胱胺酸因有二硫键而连接紧密。

蛋白质有four levels:一级结构由共价键连接,sequence与结构一一对应。二级结构由氢键连接,基本单位motif与不同环境组合具有不同功能,即功能暗示。三级结构由疏水相互作用控制,基本单位是domain(motif与domain区别在于:motif蛋白质暗示是依据周围氨基酸暗示不同功能,而domain具有独立性)。四级结构是复合结构。除此之外,相互作用力还有离子键和范德华力。

研究protein结构是为了更好研究、制药。Protein Prediction的主要思路是预测亚模块然后预测总体,这其中要联系亚模块之间的相互结构和角度。原始方法采用X-ray,物理上很难实现,所以采用信息学方法省时省力。信息学方法主要是利用类似PDB的Database。所以,信息学方法也可以作为X-ray未能及部分的补充。

二维结构预测:二维结构比三维结构难,这是因为motif 蛋白质暗示依据周围氨基酸暗示不同功能而domain具有独立性。预测方法有以下三种思路:1.因为sequence 相似导致structure相似。所以可以在数据库中寻找相似sequence后copy其结构,但是寻找sequence相似的难度较大。2.clustering analysis:采用机器学习方法,利用已知sequence与结构相对应的数据集作为training集学习,从而预测未知sequence对应结构。3.Chou and Fasman利用氨基酸对应二级结构(二级结构包括螺旋、折叠和转角)中存在概率来预测,但是存在motif问题,即不知道周围环境情况所以无法正确预测,所以采用GOR method。GOR method即以每一个氨基酸将周围17个氨基酸为一组实行数据学习。但是相同序列存在空间结构不同的问题,所以采用PHD方法,即原始数据比较得到profile,再neural network一遍又一遍training,最后用数字置信度判别结果,之后诞生相似原理的Psi-BLAST和PSIPRED,其中PSIPRED准确性最好。

三级结构预测:1.因为三级结构结构比序列更保守,所以可以采用sequence-structure相似性。2.穿线法:先预测sub-structure(二级结构)后assembly,但sub之间位置结构不确定。此情况下可以列出sub的全部组合,基于结合自由能公式建立打分函数进行choose,最后使预测结构与已知结构的误差值评价其精确率3.从头预测方法是first-principle ab initio folding基于energy function找global minimum,在能量最低时停止。原先以原子为基本单位,所以时间长也不精确,之后使用AA为基本单位。此方法适合100个AA或者重要AA。最后,综合使用三类思路,最后预测结果判别时应注意:序列相似性的前提是不同序列长度,长序列比短序列保守,短序列容易出错,需要使用合适模板结构,实际上大部分采用25%-40%的相似度。

 

化学键|甘氨酸|谷氨酸|半胱胺酸|motif|domain|疏水相互作用|序列相似性|clustering analysis|Chou and Fasman|GOR|PHD|穿线法|first-principle ab initio folding|的更多相关文章

  1. dp水题 序列问题 (9道)

    9道题.A了8道,A题看题解也没弄懂怎么维护m段子序列的,过一段时间再回来看看     dp试水 47:56:23 125:00:00   Overview Problem Status Rank ( ...

  2. 重新发现MATLAB

    现场编辑 创建不仅捕获代码的脚本 - 它们讲述了可以与他人共享的故事.自动化的上下文提示可让您在编程时快速移动,并将结果和可视化与代码一起显示. 学到更多 访问MATLAB实时脚本库         ...

  3. MIT molecular Biology 笔记10 翻译

    视频  https://www.bilibili.com/video/av7973580/ 教材 Molecular biology of the gene 7th edition  J.D. Wat ...

  4. MIT Molecular Biology 笔记6 转录的调控

    视频  https://www.bilibili.com/video/av7973580?from=search&seid=16993146754254492690 教材 Molecular ...

  5. MIT Molecular Biology 笔记1 DNA的复制,染色体组装

    视频  https://www.bilibili.com/video/av7973580?from=search&seid=16993146754254492690 教材 Molecular ...

  6. Docking非原生配体

    转载于 https://mp.weixin.qq.com/s/VDN1qAZGIMol6prwQW4umw Docking非原生配体 在前面的例子中,AutoDock Vina能把配体构象调整到几乎原 ...

  7. 用PyMOL展示配体和受体相互作用的原子和氢键

    转载于 https://mp.weixin.qq.com/s/P62sjqhSTxmWVicrEAk-RQ 为了简化展示过程,我们设计了一个pml脚本 (脚本内有很详细的解释),只需要修改脚本里面受体 ...

  8. J15W-J45W全铜截止阀厂家,J15W-J45W全铜截止阀价格 - 专题栏目 - 无极资讯网

    无极资讯网 首页 最新资讯 最新图集 最新标签   搜索 J15W-J45W全铜截止阀 无极资讯网精心为您挑选了(J15W-J45W全铜截止阀)信息,其中包含了(J15W-J45W全铜截止阀)厂家,( ...

  9. J15W-J45W铜质截止阀厂家,J15W-J45W铜质截止阀价格 - 专题栏目 - 无极资讯网

    无极资讯网 首页 最新资讯 最新图集 最新标签   搜索 J15W-J45W铜质截止阀 无极资讯网精心为您挑选了(J15W-J45W铜质截止阀)信息,其中包含了(J15W-J45W铜质截止阀)厂家,( ...

随机推荐

  1. vue title悬停

    title 设置name="peo" title="" v-on:mouseenter="peoAndCarHover(item.signStatus ...

  2. java相关书籍及网站

    原文链接:http://developer.51cto.com/art/201408/448609.htm 对于 Java™ 语言开发人员来说,信息过量是一个真正的问题.每个新入行的程序员都要面临一个 ...

  3. python 文件练习

    # 注册:# 1.账号.密码存到文件# 2.判断输入是否为空# 3.校验用户是否存在# 4.用户名和密码长度在6-12位之间#将文件读取到字典中def get_users(): f = open('1 ...

  4. 14)载入png图片

    1)之前在窗口中载入图片  一般都是bmp的  但是  我想从网上下一些图片,这些图片可能是png的 2)那么就有了下面的操作 3)png图片可以直接做成透明的. 4)首先是创建窗口的基本代码: #i ...

  5. selector的使用,android:clickable="true"

    <ImageView android:id="@+id/patrol_buzzer_btn" android:layout_width="80dp" an ...

  6. CPython中的GIL

    GIL:全局解释器锁(cpython中) GIL产生的背景,由于C语言底层原因,CPpython中多线程运行,每个线程都需要申请全局资源,但是Cpython并不能应对所有线程同时的资源请求,为防止发生 ...

  7. 如何判断Office是32位还是64位?

    对于持续学习VBA的老铁们,有必要了解Office的位数. 如果系统是32位的,则不需要判断Office位数了,因为只能安装32位Office. 下面只讨论64位系统中,Office的位数判断问题. ...

  8. UI Automation编程辅助工具Inspect的下载和使用

    UIAutomation微软提供的UI自动化库,主要用AutomationElement类来表示UI 自动化目录树中的一个UI自动化元素,.NET Windows的窗体应用程序和WPF应用程序. In ...

  9. 机器学习总结(参考源码ml.hpp)

    依据机器学习算法如何学习数据可分为3类: 有监督学习:从有标签的数据学习,得到模型参数,对测试数据正确分类: 无监督学习:没有标签,计算机自己寻找输入数据可能的模型: 强化学习(reinforceme ...

  10. 结构体初始化和new delete

    int *p; p=new int[100]; delete []p; 结构体中的指针需要初始化