wgsim说明
介绍
============ Wgsim是从参照基因组中模拟序列的小工具。
它能够模拟二倍体基因组与SNP和插入/缺失(INDEL)
多态性,并能够模拟均匀替代测序错误的reads。
它不产生INDEL测序错误,但是这可能是部分地
通过模拟INDEL多态性补偿。 Wgsim输出是模拟多态性,并写入真正的reads坐标
以及在reads名称的多态性和测序错误的数量。
我们可以wgsim_eval.pl自带的包评估映射的准确性或SNP caller。 编译
=========== GCC -g -O2 -Wall -o wgsim wgsim.c -lz -lm 评估
========== 仿真与评估
------------------------- 仿真命令行: wgsim -Nxxx -1yyy -d0 -S11 -e0 -rzzz hs37m.fa YYY-zzz.fq的/ dev / null的 其中yyy是read长,zzz为错误率和$ XXX * $ YYY =10000000。
默认情况下,多态性的15%以上是插入缺失和它们的长度是从绘制
几何分布密度0.7 * 0.3 ^ {L-1}。 评估命令行: wgsim_eval.pl独特aln.sam | wgsim_eval.pl alneval -g 20 在'-g'选项可以和映射器来改变。 系统
------
GCC: 4.1.2
CPU: AMD Opteron 8350 @ 2.0GHz
Mem: 128GB 实际操作:
使用过的命令:
../seqtk_concat out_1.fq out_2.fq | head -n 8
../seqtk_concat out_1.fq out_2.fq > ../wgsim.fq #双端序列合并
seqtk_names wgsim.fq | cut -f1,2 -d'_'| cut -f3 -d'|' | perl -ane 's/chr\S+/9606/; print' | perl -ne 'print qq{$.\t$_}' | tabtk_bins - 1 >tabtk_stats
seqtk_names wgsim.fq | cut -f1,2 -d'_'| cut -f3 -d'|' | perl -ane 's/chr\S+/9606/; print' | perl -ne 'print qq{$.\t$_}' | tabtk_bins - 1 >tabtk_stats.tsv
cut -f1,2 tabtk_stats.tsv | tabtk_decorate /biostack/database/taxonomy/node-name.tsv 0 - > tab.xls
/*
perl -ane 's/chr\S+/9606/; print' 将每一行中包含chr并且其后非空格部分(比如chrab和chrbc)替换为9606
perl -ne 'print qq{$.\t$_}' 打印每一行的行号和内容;
*/
cut说明:
cut 不就是『切』吗?没错啦!这个指令可以将一段讯息的某一段给他『切』出来~ 处理的讯息是以
『行』为单位喔!
常用的参数:
wgsim说明的更多相关文章
随机推荐
- Sql server 2008 中varbinary查询
sqlserver2008中遇到一个坑爹的问题,使用以下语句添加的数据 insert into testtable ( username, password, productcode ) select ...
- 第十篇.bootstrap轮播
使用bootstrap的轮播插件可以向站点添加滑块,内容可以是图像,内嵌框架,视频或其它任何内容,使用轮播插件需要引入bootstrap.min.js. <div id="carous ...
- cocoapods无法使用(mac os 10.11升级导致pod: command not found)
之前安装了cocoapods, 那么输入 : sudo gem install -n /usr/local/bin cocoapods 如果还不行的话 首先在终端输入 gem sources -l 查 ...
- 抽象工厂模式(Abstract Factory Pattern)
动机(Motivation) 在软件系统中,经常面临着“一系列相互依赖的对象”的创建工作:同时,由于需求的变化,往往存在更多系列对象的创建工作.如何应对这种变化?如何绕过常规的对象创建方法(new), ...
- [make]makefile使用积累
[注]:文中所指手册皆为GNU make Version 4.1 1.make的一般特性 1.1.Makefiles的构成 Makefiles包含五种元素: 显式规则(explicit rules), ...
- C语言的编译过程、安装gcc编译器以及设置环境变量
以我对C语言编译过程的了解,我用了一点时间画了一个图,提供给大家参考一下,希望有些能对您的问题提上帮助. 前几天刚初步学习了C语言的编译过程,感触挺深的.在C语言中头文件其实起了一个很大的作用. 1. ...
- Socket支持多用户并发访问的解决办法
//创建线程池,池中具有(cpu个数*50)条线程 ExecutorService executorService = Executors.newFixedThreadPool(Runtime.get ...
- 一步一步搭框架(asp.netmvc+easyui+sqlserver)-01
一步一步搭框架(asp.netmvc+easyui+sqlserver)-01 要搭建的框架是企业级开发框架,适用用企业管理信息系统的开发,如:OA.HR等 1.框架名称:sampleFrame. 2 ...
- java中开源日志记录工具log4j
日志:除了能记录异常信息,还可以记录程序正常运行时的关键信息. 使用log4j来进行日志文件记录经典步骤: 001.在项目中创建一个lib文件夹,然后将下载好的jar包copy到该文件夹下 002.对 ...
- net iis 部署中出现的问题及解决方案
1.HTTP500.21 错误 解决方法:重新注册asp.net C:\Windows\Microsoft.NET\Framework\v2.0.50727\aspnet_regiis.exe –i ...