生信分析常用脚本(二)--SOAPdenovo
1.SOAPDenovo配置文件示例
软件下载安装和使用:http://soap.genomics.org.cn/soapdenovo.html
asm.cfg
#maximal read length
max_rd_len= [LIB]
avg_ins=450 #if sequence needs to be reversed
reverse_seq=0 #in which part(s) the reads are used
asm_flags=3 #use only first 100 bps of each read
rd_len_cutoff=100 #in which order the reads are used while scaffolding
rank=1 # cutoff of pair number for a reliable connection (at least 3 for short insert size)
pair_num_cutoff=
#minimum aligned length to contigs for a reliable read location (at least 32 for short insert size)
map_len=32
#a pair of fastq file, read 1 file should always be followed by read 2 file
q1=../../data/newBGIseq500_1.fq.gz
q2=../../data/newBGIseq500_2.fq.gz
运行脚本:
run.sh
/home/stu2/Software/Assemblathon1_pipeline/SOAPdenovo-63mer_v2. all -s asm.cfg -K -p -R -o asm >cout.log >cerr.log
./SOAPdenovo-63mer_v2. pregraph -K -s asm.cfg -o asm -p >pregraph.log >pregraph.err
./SOAPdenovo-63mer_v2. contig -s asm.cfg -g asm -M -e -p -R -D >contig.log >contig.err
./SOAPdenovo-63mer_v2. map -s asm.cfg -g asm -k -p >map.log >map.err
./SOAPdenovo-63mer_v2. scaff -g asm -p -F >scaff.log >scaff.err
02. VCFtools的使用
软件下载和使用:
https://vcftools.github.io/documentation.html
https://vcftools.github.io/man_latest.html
# get Qual
./vcftools --gzvcf chr17.vcf.gz --site-quality --out Qual
# get interval
./vcftools --gzvcf chr17.vcf.gz --chr chr17 --from-bp --to-bp --remove-indels --out TP53 --recode
03.变异位点信息统计
#!/usr/bin/perl
use strict; my $file = shift; open(In,"gzip -dc $file|") or die ("can't open the file!\n"); my @type;
my @array = ( );
while(<In>){
chomp;
next if (/^##/);
if (/^#/){
my @line = split;
push @type, $line[];
push @type, $line[];
push @type, $line[];
next;
}
my @line = split;
if ($line[] >= && $line[] <= && $line[] ne "."){
my @type1 = split(/\/|:/, $line[]);
my @type2 = split(/\/|:/, $line[]);
my @type3 = split(/\/|:/, $line[]);
#print "$type1[0]\t$type1[1]\n";
if ($type1[]==$type1[]){
$array[][] ++;
}else{
$array[][] ++;
}
if ($type2[] == $type2[]){
$array[][] ++;
}else{
$array[][] ++;
}
if($type3[] == $type3[]){
$array[][] ++;
}else{
$array[][] ++;
}
}
}
close IN; print "Sample\tHomozygous\tHeterozygote\n";
print "$type[0]: $array[0][0]\t$array[0][1]\n";
print "$type[1]: $array[1][0]\t$array[1][1]\n";
print "$type[2]: $array[2][0]\t$array[2][1]\n";
04. KmerFreq使用脚本
工具包地址:ftp://public.genomics.org.cn/BGI/SOAPdenovo2
kmer.sh
./kmerfreq -k -l lib.list -t >17mer.freq >17mer.log
lib.list
reads1.fq.gz
reads2.fq.gz
友情参考链接:http://20xue.com/3997.html,https://www.cnblogs.com/azrael-cc/
生信分析常用脚本(二)--SOAPdenovo的更多相关文章
- MS SQL 日常维护管理常用脚本(二)
监控数据库运行 下面是整理.收集监控数据库运行的一些常用脚本,也是MS SQL 日常维护管理常用脚本(一)的续集,欢迎大家补充.提意见. 查看数据库登录名信息 Code Snippet SELEC ...
- 监控数据库运行 - MS SQL 日常维护管理常用脚本(二)
查看数据库登录名信息 use mastergoSELECT name AS LoginName , dbname AS DefaultDB , createdate AS CreateDate, up ...
- 生信基础知识【04】GO和pathway分析
非原创 参考资料: 一文掌握GO和pathway分析 - 生物信息学讨论版 -丁香园论坛http://www.dxy.cn/bbs/thread/34904124#34904124 GO富集 GO是G ...
- 精心整理(含图版)|你要的全拿走!(R数据分析,可视化,生信实战)
本文首发于“生信补给站”公众号,https://mp.weixin.qq.com/s/ZEjaxDifNATeV8fO4krOIQ更多关于R语言,ggplot2绘图,生信分析的内容,敬请关注小号. 为 ...
- 常用脚本语言Perl,Python,Ruby,Javascript一 Perl,Python,Ruby,Javascript
常用脚本语言Perl,Python,Ruby,Javascript一 Perl,Python,Ruby,Javascript Javascript现阶段还不适合用来做独立开发,它的天下还是在web应用 ...
- (转载)shell日志分析常用命令
shell日志分析常用命令总结 时间:2016-03-09 15:55:29来源:网络 导读:shell日志分析的常用命令,用于日志分析的shell脚本,统计日志中百度蜘蛛的抓取量.抓取最多的页面.抓 ...
- wavecom短信猫常用AT命令
wavecom短信猫常用AT命令 一.一般命令 1. AT+CGMI 给出模块厂商的标识. 2. AT+CGMM 获得模块标识.这个命令用来得到支持的频带 (GSM 900,DCS 1800 或PCS ...
- 游戏编程之Unity常用脚本类的继承关系
前言学习Unity开发引擎的初学者会接触大量的脚本类,而这些类之间的关系往往容易被忽略.本文对Unity引擎开发中的一些常用类及其关系进行了简单的归纳总结. 博文首发地址:http://tieba.b ...
- oracle 常用脚本以及语句
oracle 常用脚本以及语句 一.oracle 安装10G 单机初始化环境: #!/bin/bash #关闭selinuxsed -i 's\SELINUX=enforcing\SELINUX=di ...
随机推荐
- C 语言 计算
note1: 不要把表达式写的太复杂,不容易阅读和理解,容易造成读程序的误解,所以要避免写出复杂的表达式. note2:程序是按步执行的,程序表达的是顺序执行的动作,而不是关系.
- python ----django---打包重用
https://www.cnblogs.com/wcwnina/p/9122469.html https://blog.csdn.net/qq_30501975/article/details/804 ...
- 路由对象route
路由对象是不可变 (immutable) 的,每次成功的导航后都会产生一个新的对象.不过你可以 watch (监测变化) 它. 通过 this.$route 访问当前路由,还可以通过router.ma ...
- 6Linux用户身份与文件权限
3类用户身份: (1)管理员UID为0,root (2)系统用户UID为1-999:nologin不能登录系统,老版本5.6中是1-499 (3)普通用户UID为1000开始,老版本5.6中是1000 ...
- git取别名配置
已经配置的别名 $ git config --global alias.st status $ git config --global alias.co checkout $ git config - ...
- ReactiveX 学习笔记(27)使用 RxJS + Vue.js 进行 GUI 编程
课题 程序界面由3个文本编辑框和1个文本标签组成. 要求文本标签实时显示3个文本编辑框所输入的数字之和. 文本编辑框输入的不是合法数字时,将其值视为0. 3个文本编辑框的初值分别为1,2,3. 创建工 ...
- Linux安装OPENJDK配置环境变量
# yum search openjdk 回车 找到open开发者环境jdk版本复制它的名字 安装java-1.8.0-openjdk-headless.x86_64 yum install j ...
- bash小技巧1 获取文件当前路径
我们linux获取文件当前路径一般问 #逼格不够高 [root@xxxx]# pwd 高逼格 SHELL_FOLDER=$(dirname $(readlink -f "$0"))
- spring AOP capbilities and goal
Spring AOP 是用纯JAVA 实现的. 不需借助JAVA代码在编译处理阶段来实现. Spring 是在运行期实现的.AOP的实现可以在编译,加载,运行三个阶段来实现:Spring AOP 也不 ...
- 一些常用的 std 类型
[std::allocator] 标准库中包含一个名为allocator的类,允许我们将分配和初始化分离.使用allocator通常会提供更好的性能和更灵活的内存管理能力. 标准库allocator类 ...