NECAT组装ONT long reads

NECAT 可用于ONT数据的纠错，组装，如果想对ONT long reads进行call SV，也可以使用necatsv.

githup网址：https://github.com/xiaochuanle/NECAT/blob/master/README.md

安装

两种方法：

第一种方法

 wget https://github.com/xiaochuanle/NECAT/releases/download/v0.0.1_update20200803/necat_20200803_Linux-amd64.tar.gz

 tar xzvf necat_20200803_Linux-amd64.tar.gz

 cd NECAT/Linux-amd64/bin

 export PATH=$PATH:$(pwd)

第二种方法

 git clone https://github.com/xiaochuanle/NECAT.git

 cd NECAT/src/

 make

 cd ../Linux-amd64/bin

 export PATH=$PATH:$(pwd)

最后加入环境变量即可

简单使用

Step 1 配置文件

necat.pl config config.txt

会得到一个config.txt的配置文件，并对其进行配置，比如

PROJECT=17s1XX

ONT_READ_LIST=read_list.txt

GENOME_SIZE=1000000000

THREADS=4

MIN_READ_LENGTH=3000

起他可以默认即可

read_list.txt 为long reads的绝对路径

Step 2 correct raw reads

necat.pl correct ecoli_config.txt

只对40X（PREP_OUTPUT_COVERAGE）的reads进行纠错，Corrected reads路径位于./17s1XX/1-consensus/cns_iter${NUM_ITER}/cns.fasta.

Step 3 组装

necat.pl assemble ecoli_config.txt

针对纠错后的reads进行组装，如果么有纠错，则自动进行纠错步骤.

运行结果位于./17s1XX/4-fsa/contigs.fasta.

Step 4 Bridge contigs

necat.pl bridge ecoli_config.txt

结果位于：./17s1XX/6-bridge_contigs/bridged_contigs.fasta.

如果设置了POLISH_CONTIGS，则会利用纠错后的reads 对bridged contigs进行polish。

结果位于：6-bridge_contigs/polished_contigs.fasta

多节点计算

如果使用的是PBS或者SGE系统，可以设置配置文件中的如下参数进行多节点运行

USE_GRID=true

GRID_NODE=4

欢迎扫码交流

NECAT组装ONT long reads的更多相关文章

NextDenovo 组装基因组
NextDenovo 是有武汉未来组团队开发出来用于组装ONT,Pacbio, HIFI (默认参数可对60-100X数据更有效),可通过correct--assemble对其进行组装.组装后,每个碱 ...
基因组 de novo 组装原理
Falcon软件的组装流程为了错误校正,将原始子reads进行overlap 预组装和错误校正错误校正后reads的overlap检测 overlap的过滤从overlap构建图从图构建con ...
转录本组装软件StringTie的使用说明
转录本组装软件StringTie的使用说明 StringTie 转录本组装软件StringTie的使用说明转录组分析流程 HISTA + StringTie 组合.其Protocol 发表在Natu ...
转录组组装软件stringtie
StringTie是約翰·霍普金斯大學计算机生物中心开发的一款转录组组装软件,在组装转录本的完整度,精度和速度方面都较以往的cufflinks 有很大的提升,也是目前有参考基因组转录组主流的组装软件. ...
Falcon：三代reads比对组装工具箱
主页:github: PacificBiosciences/FALCON 简介 Falcon是一组通过快速比对长reads,从而来consensus和组装的工具. Falcon工具包是一组简单的代码集 ...
PacBio长reads的大基因组组装
原文链接:Large Genome Assembly with PacBio Long Reads 可以以多种方式利用PacBio长reads来生成和改进大型基因组的de novo组装. 你可以用几种 ...
三代PacBio reads纠错 - 专题
三代纠错的重要性不言而喻,三代的核心优势就是长,唯一的缺点就是错误率高,但好就好在错误是随机分布的,可以通过算法解决,这也就是为什么现在有这么多针对三代开发的纠错工具. 纠错和组装是分不开的,纠错就是 ...
PBcR - 纠错及组装算法
单分子测序reads(PB)的混合纠错和denovo组装我们广泛使用的PBcR的原始文章就是这一篇原文链接:Hybrid error correction and de novo assembly ...
用单分子测序（single-molecule sequencing）和局部敏感哈希（locality-sensitive hashing）来组装大型基因组
Assembling large genomes with single-molecule sequencing and locality-sensitive hashing 好好读读,算法系列的好文 ...

随机推荐

RabbitMQ：从入门到搞定面试官
安装使用docker安装,注意要安装tag后缀为management的镜像(包含web管理插件),我这里使用的是rabbitmq:3.8-management 1. 拉取镜像 shell docke ...
关于tkinter
tkinter介绍 tkinter是python自带的GUI库,是对图形库TK的封装tkinter是一个跨平台的GUI库,开发的程序可以在win,linux或者mac下运行组件概念一个窗口中任意内 ...
Redis：学习笔记-02
Redis:学习笔记-02 该部分内容,参考了 bilibili 上讲解 Redis 中,观看数最多的课程 Redis最新超详细版教程通俗易懂,来自 UP主遇见狂神说 4. 事物 Redis 事务本 ...
并发编程从零开始（八）-ConcurrentHashMap
并发编程从零开始(八)-ConcurrentHashMap 5.5 ConcurrentHashMap HashMap通常的实现方式是"数组+链表",这种方式被称为"拉链 ...
elasticsearch使用ik中文分词器
elasticsearch使用ik中文分词器一.背景二.安装 ik 分词器 1.从 github 上找到和本次 es 版本匹配上的分词器 2.使用 es 自带的插件管理 elasticsearc ...
mybatis自定义分页拦截器
最近看了一下项目中代码,发现系统中使用的mybatis分页使用的是mybatis自带的分页,即使用RowBounds来进行分页,而这种分页是基于内存分页,即一次查出所有的数据,然后再返回分页需要的数据 ...
shell 匿名管道和命名管道
管道的特点:如果管道中没有数据,那么取管道数据的操作就会滞留,直到管道内进入数据,然后读出后才会终止这一操作:同理,写入管道的操作如果没有读取管道的操作,这一动作也会滞留. 1,匿名管道匿名管道使用 ...
Qt信号与槽传递自定义数据类型——两种解决方法
信号与槽作为qt中的核心机制,在qt应用开发中经常会用的,但是原生的信号与槽连接传参,只支持基本的数据类型,比如char,int, float,double. 如果想要在信号与槽之间传递自定义参数,比 ...
Labview一个循环中放两个事件结构会导致前面板锁定的问题
建议在同一个循环中,只放置一个事件结构.此时,当一个事件发生时,事件结构将对事件进行处理,然后继续循环,事件结构再等待下一个事件发生. 如在同一个循环中放置两个事件结构,只有在两个事件结构都处理了事件 ...
Docker 部署前后端项目
Docker 部署前后端项目平生不会相思,才会相思,便害相思. 简介:都是被逼的,从零开始一个Docker 部署九个微服务和三个前端项目.其中,这些服务需要用到Nacos.MySQL.Nginx.E ...

NECAT组装ONT long reads

安装

简单使用

Step 1 配置文件

Step 2 correct raw reads

Step 3 组装

Step 4 Bridge contigs

多节点计算

欢迎扫码交流

NECAT组装ONT long reads的更多相关文章

随机推荐

热门专题