Trinity的分步运行
- 当使用Trinity组装时,如果数据量过大,可以考虑使用
--min_kmer_cov 2参数丢弃uniquely occurring kmer, 从而降低内存消耗 - 设置
--no_distributed_trinity_exec会在输出目录下面(trinity_out_dir)生成一个recursive_trinity.cmds文件,这里面包含了下一步运行的所有命令,这些命令是可以并行执行的时候 - 然后运行Trinity会自动识别已经完成部分,接着未完成的命令继续运行
运行命令如下:
/home/yueyao/bio/trinityrnaseq-Trinity-v2.4.0/Trinity --seqType fq --max_memory 100G --CPU 50 --min_kmer_cov 3 --left /home/yueyao/10.GongTong/00.data/FCHK2FVCCXY_L3_WHDAVllgEAAARAAPEI-96_1.fq.gz,/home/yueyao/10.GongTong/00.data/FCHK2FVCCXY_L3_WHDAVllgEAABRAAPEI-97_1.fq.gz,/home/yueyao/10.GongTong/00.data/FCHK2FVCCXY_L3_WHDAVllgEAABRAAPEI-97_1.fq.gz --right /home/yueyao/10.GongTong/00.data/FCHK2FVCCXY_L3_WHDAVllgEAAARAAPEI-96_2.fq.gz,/home/yueyao/10.GongTong/00.data/FCHK2FVCCXY_L3_WHDAVllgEAABRAAPEI-97_2.fq.gz,/home/yueyao/10.GongTong/00.data/FCHK2FVCCXY_L3_WHDAVllgEAACRAAPEI-98_2.fq.gz --output gongtong_trinity_out --group_pairs_distance 230 --no_version_check --verbose --min_contig_length 250 --min_glue 3 --no_distributed_trinity_exec
/home/yueyao/bio/trinityrnaseq-Trinity-v2.4.0/trinity-plugins/parafly/bin/ParaFly -c recursive_trinity.cmds -CPU 50 -v
--trinity_complete在递归运行Trinity时作为一个flag控制程序运行ButterflyButterfly是一个通过德布鲁因图寻找正确的路径并得到相应的contig序列的jar包。对于一个德布鲁因图会根据reads的关系来进行拆分,同时对于多个可能的路径都会输出为contig- 拆分得到的contig可以认为是属于一个基因家族的转录本序列或者认为是旁系同源基因,而对于一条路径延伸时有多个选择得到的不同contig则认为是同一个基因的不同转录本
c1_g1_i1与c1_g1_i2属于同一个基因的不同转录本,c1_g1_i1与c1_g2_i1属于旁系同源基因此结果的理解属于分类后的reads重新运行Trinity得到的Trinity.fasta文件,而最终的Trinity结果是对每一类的Trinity.fasta文件的合并
Trinity的分步运行的更多相关文章
- ejabberd 在eclipse(erlide)中的配置、调试、运行
最近在折腾ejabberd,将ejabberd项目配置到eclipse中进行编译.调试等,现在将过程记下来,希望能帮助到需要的人. 准备 本次环境是在linux中进行,博主的linux是fedora2 ...
- Ejabberd导入到eclipse
ejabberd 在eclipse(erlide)中的配置.调试.运行 最近在折腾ejabberd,将ejabberd项目配置到eclipse中进行编译.调试等,现在将过程记下来,希望能帮助到需要 ...
- 图-最短路径-Dijktra(迪杰斯特拉)算法
1. 迪杰斯特拉算法是由荷兰计算机科学家狄克斯特拉算法于1959 年提出的,因此又叫狄克斯特拉算法.是从一个顶点到其余各顶点的最短路径算法,解决的是有向图中最短路径问题.迪杰斯特拉算法主要特点是以起始 ...
- HOG(方向梯度直方图)
结合这周看的论文,我对这周研究的Histogram of oriented gradients(HOG)谈谈自己的理解: HOG descriptors 是应用在计算机视觉和图像处理领域,用于目标检測 ...
- 转:loadrunner经典面试题
在LoadRunner中为什么要设置思考时间和pacing 答: 录制时记录的是客户端和服务端的交互,如果要精确模拟 用户的行为,那么客户操作客户端时花费了很多时间要怎么模拟呢?录入 填写提交的内容, ...
- LoadRunner面试题
在LoadRunner中为什么要设置思考时间和pacing 答: 录制时记录的是客户端和服务端的交互,如果要精确模拟 用户的行为,那么客户操作客户端时花费了很多时间要怎么模拟呢?录入 填写提交的内容, ...
- REST API设计指导——译自Microsoft REST API Guidelines(一)
前言 前面我们说了,有章可循,有据可依,有正确的产品流程和规范,我们的工作才不至于产生混乱,团队的工作才能更有成效.我们经常见到,程序开发可能只用了半个月,但是接口的联调却经常需要花费半个月甚至一个月 ...
- Loadrunner使用键盘快捷键
---------Loadrunner使用键盘快捷键------------ alt+f8 比较当前快照(仅限于 Web Vuser) alt+ins 新建步骤 ctrl+a 全选 ctrl+c 复制 ...
- lr的脚本调试方法
1) 设置调试断点(快捷键F9)当设置断点的脚本,脚本运行到断点处,自动停止运行,我们可以通过查看运行日志,来观察脚本执行的情况: LR中也能设置断点,具体菜单在:Insert - Toggle B ...
随机推荐
- Linux命令简写和全称
alias :Create your own name for a commandcat: Concatenate 串联cd:Change directory 切换目录cp: Copy file 复制 ...
- ReactiveX 学习笔记(24)使用 RxCpp + C++ REST SDK 调用 REST API
JSON : Placeholder JSON : Placeholder (https://jsonplaceholder.typicode.com/) 是一个用于测试的 REST API 网站. ...
- Android Studio模拟器磁盘空间不足(Not enough disk space to run AVD)
在Android Studio中运行模拟器时,提示Error: Not enough disk space to run AVD '....'. Exiting.是说安装模拟的磁盘空间不足,导致无法运 ...
- ArcGIS自定义工具箱-修复损坏的工作空间
ArcGIS自定义工具箱-修复损坏的工作空间 联系方式:谢老师,135-4855-4328,xiexiaokui#qq.com 目的:替换数据源的工作空间 用途:针对损坏的数据源,批量进行修复 案例数 ...
- BM递推
从别的大佬处看到的模板 #include<bits/stdc++.h> #define fi first #define se second #define INF 0x3f3f3f3f ...
- mysql case when then else end 写法
今天改SQL用到了就搜了搜,现在记下来. case when tableName.type in (1,2,3,4) and tableName.state in (5,6) then 1 when ...
- 100-days: twelve
Title: Mark Zuckerberg wants Facebook's to emulate China's WeChat, but can it? emulate v.效仿,模仿 As ...
- Vue框架H5商城类项目商品详情点击返回弹出推荐商品弹窗的实现方案
需求场景: 非推荐商品详情页返回的时候弹出弹窗推荐商品,点击弹窗按钮可以直接访问推荐商品: 只有直接进入商品详情页返回才会弹出推荐商品弹窗: 每个用户访问只能弹一次(除非清除缓存). 需求分析: 1. ...
- dfs | Security Badges
Description You are in charge of the security for a large building, with n rooms and m doors between ...
- Shell 脚本获取当前目录 和 获得 文件夹名
#!/bin/bash project_path=$(cd ``; pwd) project_name="${project_path##*/}" echo $project_pa ...