Hmmer的安装与使用

 

从功能基因研究的角度来讲,相关的搜索,比如从序列数据库中,找同源的序列,或者对一个对一个新的基因功能进行鉴定,使用hmmer比使用blast有着更高的灵敏度已经更高的搜索速度,但其应用还远没有blast普及。


  • hmmer下载与安装

对于Mac OS/X, Linux, UNIX系统,用源代码编译安装:

   % wget ftp://selab.janelia.org/pub/software/hmmer3/3.0/hmmer-3.0.tar.gz
% tar zxf hmmer-3.0.tar.gz
% cd hmmer-3.0
% ./configure
% make
% make check

windows系统,直接下载二进制压缩包,解压就可以使用,下载地址:

http://hmmer.janelia.org/static/binaries/hmmer3.0_windows.zip

  • hmmer包含的程序

  • phmmer: 与Blastp类似,使用一个蛋白质序列搜索蛋白质序列库;
    > phmmer tutorial/HBB HUMAN uniprot sprot.fa
  • jackhmmer: 与psiBlast类似,蛋白质序列迭代搜索蛋白质序列库;
    > jackhmmer tutorial/HBB HUMAN uniprot sprot.fa
  • hmmbuild: 用多重比对序列构建HMM模型;
  • hmmsearch: 使用HMM模型搜索序列库;
  • hmmscan: 使用序列搜索HMM库;
  • hmmalign: 使用HMM为线索,构建多重比对序列;
    > hmmalign globins4.hmm tutorial/globins45.fa
  • hmmconvert: 转换HMM格式
  • hmmemit: 从HMM模型中,得到一个模式序列;
  • hmmfetch: 通过名字或者接受号从HMM库中取回一个HMM模型;
  • hmmpress:格式化HMM数据库,以便于hmmscan搜索使用;
  • hmmstat: 显示HMM数据库的统计信息;

  • 使用HMM模型搜索序列数据库

  1. 使用hmmbuild构建HMM模型,输入为Stockholm格式或者FASTA格式的多重比对序列文件(如:tutorial/globins4.sto),命令如下:
    > hmmbuild globins4.hmm tutorial/globins4.sto
    globins4.hmm为输出的HMM模型
  2. 使用hmmsearch搜索蛋白质序列数据库,蛋白质序列数据库为FASTA格式,命令如下:
    > hmmsearch globins4.hmm uniprot sprot.fasta > globins4.out
    globins4.out为输出的结果文件,如下:

*示例使用官方教程中的示例


使用蛋白质序列搜索HMM数据库

  1. 构建HMM数据库,HMM数据库是包含多个HMM模型的文件,可以从Pfam、SMART、TIGRFams下载,也可以自己由多重比对序列集中构建,如:
    > hmmbuild globins4.hmm tutorial/globins4.sto
    > hmmbuild fn3.hmm tutorial/fn3.sto
    > hmmbuild Pkinase.hmm tutorial/Pkinase.sto
    > cat globins4.hmm fn3.hmm Pkinase.hmm > minifam
  2. 使用hmmpress格式化数据库,包括压缩以及创建索引,命令如下:
    > hmmpress minifam
    这个步骤可以很快的执行完成,输出的内容如下:
    Working… done.
    Pressed and indexed 3 HMMs (3 names and 2 accessions).
    Models pressed into binary file: minifam.h3m
    SSI index for binary model file: minifam.h3i
    Profiles (MSV part) pressed into: minifam.h3f
    Profiles (remainder) pressed into: minifam.h3p
  3. 使用hmmscan搜索HMM数据库,命令如下:
    > hmmscan minifam tutorial/7LESS_DROME
    输出如下:

后记

这里主要是一个入门式的教程,介绍了hmmer的安装,以及最常用功能使用的命令示例。其他程序的使用,以及每个程序的详细参数说明,请参看官方手册,
官方文档手册(pdf):ftp://selab.janelia.org/pub/software/hmmer3/3.0/Userguide.pdf

使用中,遇到的问题,或者疑难,可以留言讨论。内容转自:http://boyun.sh.cn/bio/?p=1753

Hmmer安装与使用的更多相关文章

  1. hmmer 使用(转载)

    hmmer 使用 » 转载文章请注明,转载自:博耘生物 » <hmmer的安装与使用> » 原文链接:http://boyun.sh.cn/bio/?p=1753   从功能基因研究的角度 ...

  2. HMMPfam的安装使用手记(转载)

    转载至:http://blog.sina.com.cn/s/blog_3f6403290100rb61.html(感谢原文作者) HMMPfam的安装使用手记前言 简要介绍一下 HMMPfam吧.这还 ...

  3. 【转载】]基于RedHatEnterpriseLinux V7(RHEL7)下SPEC CPU 2006环境搭建以及测试流程 介绍、安装准备、安装、config文件以及运行脚本介绍

    https://www.codetd.com/article/1137423 <版权声明:本文为博主原创文章,未经博主允许不得转载> 本次利用SPECCPU2006测试工具来进行Intel ...

  4. 【转载】基于RedHatEnterpriseLinux V7(RHEL7)下SPEC CPU 2006环境搭建以及测试流程(之一)——介绍、安装准备、安装、config文件以及运行脚本介绍

    基于RedHatEnterpriseLinux V7(RHEL7)下SPEC CPU 2006环境搭建以及测试流程(之一)--介绍.安装准备.安装.config文件以及运行脚本介绍 其他 2018-0 ...

  5. RepeatModeler安装及使用

    如果进行重复序列的预测,则使用RepeatModeler,可自身比对进行查找 安装 (1)下载地址:http://www.repeatmasker.org/RepeatModeler/ (2)Repe ...

  6. docker——容器安装tomcat

    写在前面: 继续docker的学习,学习了docker的基本常用命令之后,我在docker上安装jdk,tomcat两个基本的java web工具,这里对操作流程记录一下. 软件准备: 1.jdk-7 ...

  7. 网络原因导致 npm 软件包 node-sass / gulp-sass 安装失败的处理办法

    如果你正在构建一个基于 gulp 的前端自动化开发环境,那么极有可能会用到 gulp-sass ,由于网络原因你可能会安装失败,因为安装过程中部分细节会到亚马逊云服务器上获取文件.本文主要讨论在不变更 ...

  8. Sublime Text3安装JsHint

    介绍 Sublime Text3使用jshint依赖Nodejs,SublimeLinter和Sublimelinter-jshint. NodeJs的安装省略. 安装SublimeLinter Su ...

  9. Fabio 安装和简单使用

    Fabio(Go 语言):https://github.com/eBay/fabio Fabio 是一个快速.现代.zero-conf 负载均衡 HTTP(S) 路由器,用于部署 Consul 管理的 ...

随机推荐

  1. git 格式化输出版本信息

    git log --graph --pretty=format:'%Cred%h%Creset -%C(yellow)%d%Creset %s %Cgreen(%cr) %C(bold blue)&l ...

  2. Kernel Methods (5) Kernel PCA

    先看一眼PCA与KPCA的可视化区别: 在PCA算法是怎么跟协方差矩阵/特征值/特征向量勾搭起来的?里已经推导过PCA算法的小半部分原理. 本文假设你已经知道了PCA算法的基本原理和步骤. 从原始输入 ...

  3. Entity Framework Code First (七)空间数据类型 Spatial Data Types

    声明:本文针对 EF5+, Visual Studio 2012+ 空间数据类型(Spatial Data Types)是在 EF5 中引入的,空间数据类型表现有两种: Geography (地理学上 ...

  4. 概率 light oj 1248

    t组样例 n<100010 dp[i]  从i翻到n面的期望 接下来翻 可能是i面已经有的 也可能是n-i面没有的 dp[i]=i/n*(dp[i]+1)+(n-i)/n*(dp[i+1]+1) ...

  5. iOS获取流量参考

    通过读取系统网络接口信息,获取当前iphone设备的流量相关信息,统计的是上次开机至今的流量信息. 2 倒入库: SystemConfiguration.framework 加入头文件: #inclu ...

  6. hadoop1.1.2安装过程

    实验环境:VMware 10.0.1+CentOS-6.6-i386 +jdk-6u24-linux-i586+hadoop-1.1.2.tar.gz 普通用户:michael 集群规划:1台mast ...

  7. 【BZOJ-3033】太鼓达人 欧拉图 + 暴搜

    3033: 太鼓达人 Time Limit: 1 Sec  Memory Limit: 128 MBSubmit: 204  Solved: 154[Submit][Status][Discuss] ...

  8. javaScript与MVC

    MVC,就是Module,View,Controller分离,使业务逻辑更加清晰,但是现在公司的项目中很多地方那个不是这样的,很多业务逻辑放在了javascript中实现,这样做的优点就是对于技术要求 ...

  9. CLR/.NET/C#/Visual Studio/ASP.NET各版本之间的关系(转)

    由于这篇文章记录的是2015年7月,那时.net core还是叫做.net core 5 名词定义 下列这些名词,写.NET 的人一定都不陌生,但你是否有真正理解呢?如果看了我的摘要文字说明还无法理解 ...

  10. Ext FileSystem Family、Ext2、Ext3

    catalog . 简介 . Ext2文件系统 . Ext3文件系统 . 小结 1. 简介 VFS虚拟文件系统接口和数据结构构成了一个框架,各个文件系统的实现都必须在框架内运转,但这并不要求每个文件系 ...