bedtools 的安装与使用
1) 安装
bedtools 提供了3种安装方式
- 从google code 下载源代码进行安装
- 利用系统中的包管理工具进行安装, 比如cnetos 下的yum, ubuntu下的apt-get, mac 下的homebrew
- 从github下载源代码,进行安装
由于访问不了google code,又想编译安装,就从github上下载最新版:https://github.com/arq5x/bedtools2
下载v2.25.0版本的源代码,进行安装
wget https://github.com/arq5x/bedtools2/archive/v2.25.0.tar.gz
tar xzvf v2.25.0
cd bedtools2-2.25./
make
cd bin/
export PATH=$PWD:$PATH
2) 使用
intersect: 求两个区间的交集,输入文件可以是bed,gff,vcf
准备两个测试文件,
cpg.bed,其内容为
chr1 20 70 CPG_1
chr1 100 120 CPG_2
chr1 150 250 CPG_3
exon.bed,其内容为
chr1 10 40 exon_1
chr1 50 60 exon_2
chr1 130 180 exon_3
chr1 200 280 exon_4
使用默认参数,求这个文件的overlap,运行
bedtools intersect -a cpg.bed -b exon.bed
结果为
chr1 20 40 CPG_1
chr1 50 60 CPG_1
chr1 150 180 CPG_3
chr1 200 250 CPG_3
可以看出,默认情况下只输出A中overlap的区域
添加-wa 参数, 再次运行
bedtools intersect -a cpg.bed -b exon.bed -wa
结果为:
chr1 20 70 CPG_1
chr1 20 70 CPG_1
chr1 150 250 CPG_3
chr1 150 250 CPG_3
可以看出,加上-wa 参数后,只要A中的这段区域与B中区域有交集,就输出,而且overlap几次,就输出几次
添加-wb 参数,运行
bedtools intersect -a cpg.bed -b exon.bed -wb
结果为:
chr1 20 40 CPG_1 chr1 10 40 exon_1
chr1 50 60 CPG_1 chr1 50 60 exon_2
chr1 150 180 CPG_3 chr1 130 180 exon_3
chr1 200 250 CPG_3 chr1 200 280 exon_4
可以看出,加上-wb参数后,除了输出A中的overlap区域外,还会输出B中的整个区间
加上-wa, -wb 参数,再次运行
bedtools intersect -a cpg.bed -b exon.bed -wa -wb
结果为:
chr1 20 70 CPG_1 chr1 10 40 exon_1
chr1 20 70 CPG_1 chr1 50 60 exon_2
chr1 150 250 CPG_3 chr1 130 180 exon_3
chr1 150 250 CPG_3 chr1 200 280 exon_4
可以看出,同时添加-wa和-wb参数会将overlap 区域成对输出
-c参数,统计A中每个区域与Boverlap的次数
bedtools intersect -a cpg.bed -b exon.bed -c
结果为:
chr1 20 70 CPG_1 2
chr1 100 120 CPG_2 0
chr1 150 250 CPG_3 2
-v参数:只输出A中没有与Boverlap的区域
bedtools intersect -a cpg.bed -b exon.bed -v
结果为:
chr1 100 120 CPG_2
可以看出,只要只要与B有overlap就不输出。
bedtools 的安装与使用的更多相关文章
- linux 安装SAMtools,bcftools,htslib,sratoolkit,bedtools,GATK,TrimGalore,qualimap,vcftools,bwa
--------------------安装Samtools---------------------------------------------------------------------- ...
- genome MuSic安装
系统:ubuntu 15.04全程在root权限下安装 首先安装软件samtools ,必须是samtools-0.1.19 版本tar jxf samtools-0.1.19.tar.bz2cd s ...
- bedtools 每天都会用到的工具
详细的使用说明:http://bedtools.readthedocs.org/en/latest/ Collectively, the bedtools utilities are a swiss- ...
- 使用bedtools提取vcf多个位置的变异(extract multi-region of genotypes by bedtools)
1.下载安装bedtools: 2.生成bed文件:标准的bed文件格式如下: chr7 127471196 127472363 Pos1 0 + 127471196 127472363 255,0, ...
- linux 基本命令___0003 字符串处理和yum安装软件的路径
字符串变量的处理 参考链接:SHELL字符串处理技巧 计算字符串的字符数量: ${#str} str="xxx-Lane1_S2_L001_R1_trim.fastq" echo ...
- centos7 下安装生物信息软件的问题小总结
1.安装samtools与bwa时: 缺少zlib库 下载zlib库 cd zlib/ CFLAGS="-O3 -fPIC" ./configure make make insta ...
- docker——容器安装tomcat
写在前面: 继续docker的学习,学习了docker的基本常用命令之后,我在docker上安装jdk,tomcat两个基本的java web工具,这里对操作流程记录一下. 软件准备: 1.jdk-7 ...
- 网络原因导致 npm 软件包 node-sass / gulp-sass 安装失败的处理办法
如果你正在构建一个基于 gulp 的前端自动化开发环境,那么极有可能会用到 gulp-sass ,由于网络原因你可能会安装失败,因为安装过程中部分细节会到亚马逊云服务器上获取文件.本文主要讨论在不变更 ...
- Sublime Text3安装JsHint
介绍 Sublime Text3使用jshint依赖Nodejs,SublimeLinter和Sublimelinter-jshint. NodeJs的安装省略. 安装SublimeLinter Su ...
随机推荐
- 分享六:php脚本守护进程
http://www.baidufe.com/item/9565cec0004cb49d25fd.html
- Maven pom.xml 报 Missing artifact jdk.tools:jdk.tools:jar:1.7
linux中用eclipse 新建maven project,pom.xml中报Missing artifact jdk.tools:jdk.tools:jar:1.7 解决方法: 在pom.xml中 ...
- 关于VS中的调试信息输出
有时候一些项目的调试信息不方便输出到界面中,比如ASP.NET或者WPF之类的 可以使用Debug.WriteLine()等方法输出到"输出"窗口,不过"输出" ...
- libgdx 1.4.1公布
(转载自http://www.libgdx.cn/topic/4/libgdx-1-4-1%E5%8F%91%E5%B8%83) libgdx从未停止进步的脚步.10月10日.libgdx1.4.1公 ...
- Msys2:windows下好用的unix模拟器
msys2是基于mingw的bash模拟器,他为在windows下使用类似unix的环境提供了方便.同时,他还是基于mingw的,所以,他生成的也是原生的windows程序. msys2官方网站是:h ...
- 一文读懂什么是Java中的自动拆装箱
基本数据类型 基本类型,或者叫做内置类型,是Java中不同于类(Class)的特殊类型.它们是我们编程中使用最频繁的类型. Java是一种强类型语言,第一次申明变量必须说明数据类型,第一次变量赋值称为 ...
- Calendar.NET
Please Sign up or sign in to vote.请注册或登录投票. Download Binaries 下载二进制文件 Download source 下载源代码 Introd ...
- mysql 5.7.13 安装配置方法图文教程(win10) (转)
http://www.jb51.net/article/87152.htm ***************************** MySQL是一款关系型数据库管理系统,是由Oracle旗下公司M ...
- Web应用程序开发的标准架构
- vim 删除一整块,vim 删除一整行
dd: 删除游标所在的一整行(常用) ndd: n为数字.删除光标所在的向下n行,例如20dd则是删除光标所在的向下20行 d1G: 删除光标所在到第一行的所有数据 dG: 删除光标所在到最后一行的所 ...