化学键|甘氨酸|谷氨酸|半胱胺酸|motif|domain|疏水相互作用|序列相似性|clustering analysis|Chou and Fasman|GOR|PHD|穿线法|first-principle ab initio folding|

生命组学

对Protein的分析可以从Sequence到structure到function,最后研究interaction。

Structure:

化学键形成骨架,化学元素的选取基于合成蛋白质选择容易获取的元素,氨基酸化学元素的选取决定了其结构,其结构又决定了function。氨基酸的组织结构可以解释其function:甘氨酸最小,所以可以放到不同位置;谷氨酸顺反式都有,所以便于结构调整;半胱胺酸因有二硫键而连接紧密。

蛋白质有four levels:一级结构由共价键连接,sequence与结构一一对应。二级结构由氢键连接,基本单位motif与不同环境组合具有不同功能,即功能暗示。三级结构由疏水相互作用控制,基本单位是domain(motif与domain区别在于:motif蛋白质暗示是依据周围氨基酸暗示不同功能,而domain具有独立性)。四级结构是复合结构。除此之外,相互作用力还有离子键和范德华力。

研究protein结构是为了更好研究、制药。Protein Prediction的主要思路是预测亚模块然后预测总体,这其中要联系亚模块之间的相互结构和角度。原始方法采用X-ray,物理上很难实现,所以采用信息学方法省时省力。信息学方法主要是利用类似PDB的Database。所以,信息学方法也可以作为X-ray未能及部分的补充。

二维结构预测:二维结构比三维结构难,这是因为motif 蛋白质暗示依据周围氨基酸暗示不同功能而domain具有独立性。预测方法有以下三种思路:1.因为sequence 相似导致structure相似。所以可以在数据库中寻找相似sequence后copy其结构,但是寻找sequence相似的难度较大。2.clustering analysis:采用机器学习方法,利用已知sequence与结构相对应的数据集作为training集学习,从而预测未知sequence对应结构。3.Chou and Fasman利用氨基酸对应二级结构(二级结构包括螺旋、折叠和转角)中存在概率来预测,但是存在motif问题,即不知道周围环境情况所以无法正确预测,所以采用GOR method。GOR method即以每一个氨基酸将周围17个氨基酸为一组实行数据学习。但是相同序列存在空间结构不同的问题,所以采用PHD方法,即原始数据比较得到profile,再neural network一遍又一遍training,最后用数字置信度判别结果,之后诞生相似原理的Psi-BLAST和PSIPRED,其中PSIPRED准确性最好。

三级结构预测:1.因为三级结构结构比序列更保守,所以可以采用sequence-structure相似性。2.穿线法:先预测sub-structure(二级结构)后assembly,但sub之间位置结构不确定。此情况下可以列出sub的全部组合,基于结合自由能公式建立打分函数进行choose,最后使预测结构与已知结构的误差值评价其精确率3.从头预测方法是first-principle ab initio folding基于energy function找global minimum,在能量最低时停止。原先以原子为基本单位,所以时间长也不精确,之后使用AA为基本单位。此方法适合100个AA或者重要AA。最后,综合使用三类思路,最后预测结果判别时应注意:序列相似性的前提是不同序列长度,长序列比短序列保守,短序列容易出错,需要使用合适模板结构,实际上大部分采用25%-40%的相似度。

 

化学键|甘氨酸|谷氨酸|半胱胺酸|motif|domain|疏水相互作用|序列相似性|clustering analysis|Chou and Fasman|GOR|PHD|穿线法|first-principle ab initio folding|的更多相关文章

  1. dp水题 序列问题 (9道)

    9道题.A了8道,A题看题解也没弄懂怎么维护m段子序列的,过一段时间再回来看看     dp试水 47:56:23 125:00:00   Overview Problem Status Rank ( ...

  2. 重新发现MATLAB

    现场编辑 创建不仅捕获代码的脚本 - 它们讲述了可以与他人共享的故事.自动化的上下文提示可让您在编程时快速移动,并将结果和可视化与代码一起显示. 学到更多 访问MATLAB实时脚本库         ...

  3. MIT molecular Biology 笔记10 翻译

    视频  https://www.bilibili.com/video/av7973580/ 教材 Molecular biology of the gene 7th edition  J.D. Wat ...

  4. MIT Molecular Biology 笔记6 转录的调控

    视频  https://www.bilibili.com/video/av7973580?from=search&seid=16993146754254492690 教材 Molecular ...

  5. MIT Molecular Biology 笔记1 DNA的复制,染色体组装

    视频  https://www.bilibili.com/video/av7973580?from=search&seid=16993146754254492690 教材 Molecular ...

  6. Docking非原生配体

    转载于 https://mp.weixin.qq.com/s/VDN1qAZGIMol6prwQW4umw Docking非原生配体 在前面的例子中,AutoDock Vina能把配体构象调整到几乎原 ...

  7. 用PyMOL展示配体和受体相互作用的原子和氢键

    转载于 https://mp.weixin.qq.com/s/P62sjqhSTxmWVicrEAk-RQ 为了简化展示过程,我们设计了一个pml脚本 (脚本内有很详细的解释),只需要修改脚本里面受体 ...

  8. J15W-J45W全铜截止阀厂家,J15W-J45W全铜截止阀价格 - 专题栏目 - 无极资讯网

    无极资讯网 首页 最新资讯 最新图集 最新标签   搜索 J15W-J45W全铜截止阀 无极资讯网精心为您挑选了(J15W-J45W全铜截止阀)信息,其中包含了(J15W-J45W全铜截止阀)厂家,( ...

  9. J15W-J45W铜质截止阀厂家,J15W-J45W铜质截止阀价格 - 专题栏目 - 无极资讯网

    无极资讯网 首页 最新资讯 最新图集 最新标签   搜索 J15W-J45W铜质截止阀 无极资讯网精心为您挑选了(J15W-J45W铜质截止阀)信息,其中包含了(J15W-J45W铜质截止阀)厂家,( ...

随机推荐

  1. [C/C++]C/C++计算代码的运行时间

    有很多时候,实现一个功能后可能不仅仅要效果,还要效率,如果可以在极短的时间内完成一个功能那当然是最好不过的啦,但是可能经常会事与愿违. 这里就写一下,都可以怎样用C/C++或者Qt的方法来测试代码的运 ...

  2. Java 面向对象 异常处理:RunTimeexception,try-catch,异常声明throws,自定义异常,throw和throws的区别,多异常处理(9)

    Java 面向对象 异常处理:RunTimeexception,try-catch,异常声明throws,自定义异常,throw和throws的区别,多异常处理(9)

  3. VCRedist_x86.exe Vcredist_x64.exe

    Update for Visual C++ 2013 and Visual C++ Redistributable Package https://support.microsoft.com/en-u ...

  4. PAT Basic 1023 组个最⼩数 (20) [贪⼼算法]

    题目 给定数字0-9各若⼲个.你可以以任意顺序排列这些数字,但必须全部使⽤.⽬标是使得最后得到的数尽可能⼩(注意0不能做⾸位).例如:给定两个0,两个1,三个5,⼀个8,我们得到的最⼩的数就是1001 ...

  5. 文件下载post请求,返回文件流转换zip,

    最近一个需求是批量下载文件,最后打包成zip包,post请求, 因为是文件流下载,所以在取后台数据的时候,要多传递一个[responseType: ‘blob’]这个参数 download() { t ...

  6. 编程基础-servlet1

    1.Servelet是什么 sevlet是Server与Applet 的缩写,即服务端小程序.Sun公司提供的开发动态web资源的技术. servelet本质是java类,但遵循Servlet规范,没 ...

  7. PAT甲级——1152.Google Recruitment (20分)

    1152 Google Recruitment (20分) In July 2004, Google posted on a giant billboard along Highway 101 in ...

  8. shell里脚本里写个简单的函数,显示颜色

    如果多次用到颜色显示,还是定义一个函数比较实在,具体什么颜色上网找一下 #!/bin/bash # 定义一个红色显示的函数 function echo_red () { local what=$* e ...

  9. [ZJOI2019]浙江省选(半平面交)

    一眼看上去就应该能用半平面交去做. 首先考虑怎么求可能得第1名的人:每个人的函数为直线,就是在所有人的半平面交中的上边界者即可获得第一名,这个可以单调队列求解. 再考虑如何求可能得第2名的人:满足2个 ...

  10. [单调队列]XKC's basketball team

    XKC's basketball team 题意:给定一个序列,从每一个数后面比它大至少 \(m\) 的数中求出与它之间最大的距离.如果没有则为 \(-1\). 题解:从后向前维护一个递增的队列,从后 ...