背景:
          FrameBot 用于纠正DNA序列中的插入和缺失,然后正确的翻译成蛋白质序列,frameBot 工具集成在RDPTools 中
 
源代码:
 
 
安装:
          wget wget https://github.com/rdpstaff/RDPTools/archive/2.0.2.tar.gz     
         
 
测试:
    

    java -jar /home/panrf/Softwares/RDPTools/FrameBot.jar framebot
          -o ./test 
           -l 1 
           -i 0.8
          -N fungene_9.0_nifH_1989_unaligned_protein_seqs.4Analysis.fasta
          input.fasta
 
备注:  -o 指定输出结果的前缀,-l 指定氨基酸过滤的长度,i 指定比对的相似度,-N 指定功能基因对应的数据库, input.fasta 为输出的DNA序列
 
输出结果:
          输出5个文件:
          test_corr_nucl.fasta      :   翻译成功的DNA序列
          test_corr_prot.fasta     : 翻译成功的蛋白质序列
          BL18_failed_nucl.fasta : 翻译失败的DNA序列
          
 
          test_framebot.txt            : 翻译成功的DNA序列的比对情况 
          test_failed_framebot.txt  : 翻译失败的DNA序列的比对情况
          
 
test_framebot.txt : 内容如下:
>    Target    Query    NuclLen    AlignLen    %Identity    Score    Frameshifts    Reversed
STATS    38256851    7001453_297_HC7NJBCXY_1_1114_2435_5316;barcodelabel=BL18;size=5;    318    106    99.057    530    0    false
Target   33 TRLILHAKAQDTILSLAAEAGSVEDLEIEDVMKIGFRDIRCVESGGPEPGVGCAGRGVIT    92
            ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
Query     1 TRLILHAKAQDTILSLAAEAGSVEDLEIEDVMKIGFRDIRCVESGGPEPGVGCAGRGVIT    60
Frame       111111111111111111111111111111111111111111111111111111111111
            ACCACCGAGCGAACTCGGGGGTGGGCGAGGGAAAGTCGACTGGTGGCGCGGGTGGCGGAA
            CGTTTACACAACTTCTCCACGCTAATATAATTATGTGATGGTACGGCACGTGGCGGGTTC
            GGGCGCCGCGCCCGGGCCACCGGGCGGCGCCGGCCCCCCCCGGCTCGGGCGCCCCTCGCG
 
Target   93 SINFLEENGAYDGVDYVSYDVLGDVVCGGFAMPIRENKAQEIYIVM   138
            ||||||||||| ||||||||||||||||||||||||||||||||||
Query    61 SINFLEENGAYEGVDYVSYDVLGDVVCGGFAMPIRENKAQEIYIVM   106
Frame       1111111111111111111111111111111111111111111111
            TAATCGGAGGTGGGGTGTTGGCGGGGTGGTGACACGAAGCGATAGA
            CTATTAAAGCAAGTAATCAATTGATTGGGTCTCTGAAACAATATTT
            GCCCGAACCCTACGCCCCCCGGCCGGCCCTCGCCCGCGCGGCCCCG
 
表头注释:
Target :       数据库中的序列           38256851
Query :       查询序列                     7001453_297_HC7NJBCXY_1_1114_2435_5316;barcodelabel=BL18;size=5;
NuclLen :    核酸序列长度              318
AlignLen  :   比对上的序列长度       106
%Identity :   比对的相似度             99.057
Score      :    比对的打分                530
Frameshifts : 移码                         0
Reversed :   是否相反                    false, 输入序列的氨基酸和数据库中的氨基酸序列是否反向互补
利用FrameBot 翻译氨基酸序列时, 首先将输入的核酸序列翻译成氨基酸,然后去和数据库中的氨基酸进行blast比对,如果该氨基酸长度大于预先设置的的长度阈值,而且比对的相似度大于预先设置的相似度的阈值,则输入序列成功翻译;
不同物种某个特定功能基因的氨基酸序列还是有很大差异的,如果一条核酸序列对应的氨基酸符合长度过滤的条件,但是由于和数据库中的氨基酸序列差异都较大,导致比对的相似度很低,也是翻译不成功;
从这个过程可以看到,数据库质量的好坏决定了输入序列能否翻译成功,对于功能基因而言,我们通常从FunGene 数据库下载对应的数据。
 
 
 
 
 

FrameBot 软件安装测试的更多相关文章

  1. motiMaker 软件安装测试

    背景: mitoMaker是一款线粒体/叶绿体组装的pipeline软件,可以从原始的下机数据开始,自动化的组装基因组,注释基因结构,最终生成genebank, fasta 等文件. 整个pipeli ...

  2. RAMPS1.4 3D打印控制板:软件下载\连接\安装\测试

    RAMPS1.4 3D打印控制板:软件下载\连接\安装\测试 特别说明: 电源接反,电机驱动板接反将有可能烧毁芯片和电路,请再三确认后再进行通电. 如何使用: 1.需要用到的模块或器件: Arduin ...

  3. 2019-9-16:渗透测试,基础学习,Linux下软件安装,环境搭建,笔记

    Centos linux下软件安装yum 通过分析rpm包头数据后,自动解决依赖关系,直接云端下载软件,根据不同版本系统获取不同软件信息,按顺序下载rpm包,安装软件yum search 软件名:搜索 ...

  4. 循序渐进Linux 3:Linux下软件安装与管理

    一.源码安装 ./configuremakemake install 二.RPM包 1. 安装软件包 rpm -i [辅助选项] file1.rpm file2.rpm主选项 -i: install, ...

  5. Ubuntu系统下面软件安装更新命令

    在ubuntu服务器下安装包的时候,经常会用到sudo apt-get install 包名 或 sudo pip install 包名,那么两者有什么区别呢? 1.区别 pip用来安装来自PyPI( ...

  6. openstack(liberty):部署实验平台(二,简单版本软件安装 part2)

    继续前面的part1,将后续的compute以及network部分的安装过程记录完毕! 首先说说compute部分nova的安装. n1.准备工作.创建数据库,配置权限!(密码依旧是openstack ...

  7. Linux下软件安装,卸载,管理

    一. 软件安装包的类型 通常Linux应用软件的安装有五种: 1) tar+ gz包,如software-1.2.3-1.tar.gz.     他是使用UNIX系统的打包工具tar打包的. 2) r ...

  8. Linux软件安装方法小结(附:rpm详解)(转载)

    在使用Linux系统的过程中,软件包的安装是避免不了的,在Linux下,软件安装程序的种类很多,安装方法也各式各样,(舒适性自然比不上windows :-))不过我们常见的软件包有两种: 1)含有软件 ...

  9. ubuntu下opencv2.4.9安装测试

    ubuntu下opencv2.4.9安装测试 whowhoha@outlook.com 一.依赖包安装 1.  build-essential 软件包 sudo apt-get install bui ...

随机推荐

  1. EL表达式取值中文再发送请求时会乱码

    问题描述: 在网站底部进行评论,点击提交按钮时,后台tomcat报错,通过火狐浏览器的firebug看到发送的POST请求体中,有一个title参数是乱码, 导致该字段超长违反了数据库字段的长度约束: ...

  2. sed行处理详解(交换行,合并行,删除行等)

    1.合并行 zj@zj:~/Script/blog_script$ cat test11234合并上下两行zj@zj:~/Script/blog_script$ sed '$!N;s/\n/\t/' ...

  3. 设计模式之模板方法模式&&迪米特法则(代码Objective-C展示)

    模板方法模式 模板方法模式:定义一个操作中的算法骨架,而将一些步骤延迟到子类中.模板方法使得子类可以在不改变一个算法的结构即可重定义该算法的某些特定步骤. 比如说,小时候数学老师的随堂检测,都是在黑板 ...

  4. 基于CSS3鼠标滑过放大突出效果

    还记得之前分享过一款CSS3图片悬停放大特效,效果非常不错.今天我们要再来分享一款类似的CSS鼠标滑过放大突出效果,只不过之前那个是图片,这次是色块,其实掌握了其CSS原理,任何网页元素都可以实现这种 ...

  5. spring data jpa的update操作

    简介 使用jpa进行update操作主要有两种方式: 1.调用保存实体的方法 1)保存一个实体:repository.save(T entity) 2)保存多个实体:repository.save(I ...

  6. am335x uboot, kernel 编译

    一.设置环境变量 // 写在家目录下面的 .bashrc 里面 export KERNEL_PATH=~/aplex/kernel3.2.0 // kernel 路径 export UBOOT_PAT ...

  7. Android——Fragment 真正的完全解析(下)(转)

    原文地址:http://blog.csdn.net/lmj623565791/article/details/37992017 上篇博客中已经介绍了Fragment产生原因,以及一些基本的用法和各种A ...

  8. 让jQuery的ajaxFileUpload插件支持onchange事件

    ajaxFileUpload插件只能上传一次的BUG发现还不少人遇到,很不幸我也遇到的,使用后发现里面的坑还不少,在createUploadForm方法中有句 var newElement = jQu ...

  9. Java编程的逻辑 (47) - 堆和PriorityQueue的应用

    本系列文章经补充和完善,已修订整理成书<Java编程的逻辑>,由机械工业出版社华章分社出版,于2018年1月上市热销,读者好评如潮!各大网店和书店有售,欢迎购买,京东自营链接:http:/ ...

  10. git 无法提交空目录

    git不能提交子文件夹?   空目录无法add,在最里面的目录下加上随便加上一个txt就可以了