Trinity的分步运行
- 当使用Trinity组装时,如果数据量过大,可以考虑使用
--min_kmer_cov 2
参数丢弃uniquely occurring kmer, 从而降低内存消耗 - 设置
--no_distributed_trinity_exec
会在输出目录下面(trinity_out_dir)生成一个recursive_trinity.cmds文件,这里面包含了下一步运行的所有命令,这些命令是可以并行执行的时候 - 然后运行Trinity会自动识别已经完成部分,接着未完成的命令继续运行
运行命令如下:
/home/yueyao/bio/trinityrnaseq-Trinity-v2.4.0/Trinity --seqType fq --max_memory 100G --CPU 50 --min_kmer_cov 3 --left /home/yueyao/10.GongTong/00.data/FCHK2FVCCXY_L3_WHDAVllgEAAARAAPEI-96_1.fq.gz,/home/yueyao/10.GongTong/00.data/FCHK2FVCCXY_L3_WHDAVllgEAABRAAPEI-97_1.fq.gz,/home/yueyao/10.GongTong/00.data/FCHK2FVCCXY_L3_WHDAVllgEAABRAAPEI-97_1.fq.gz --right /home/yueyao/10.GongTong/00.data/FCHK2FVCCXY_L3_WHDAVllgEAAARAAPEI-96_2.fq.gz,/home/yueyao/10.GongTong/00.data/FCHK2FVCCXY_L3_WHDAVllgEAABRAAPEI-97_2.fq.gz,/home/yueyao/10.GongTong/00.data/FCHK2FVCCXY_L3_WHDAVllgEAACRAAPEI-98_2.fq.gz --output gongtong_trinity_out --group_pairs_distance 230 --no_version_check --verbose --min_contig_length 250 --min_glue 3 --no_distributed_trinity_exec
/home/yueyao/bio/trinityrnaseq-Trinity-v2.4.0/trinity-plugins/parafly/bin/ParaFly -c recursive_trinity.cmds -CPU 50 -v
--trinity_complete
在递归运行Trinity时作为一个flag控制程序运行ButterflyButterfly
是一个通过德布鲁因图寻找正确的路径并得到相应的contig序列的jar包。对于一个德布鲁因图会根据reads的关系来进行拆分,同时对于多个可能的路径都会输出为contig- 拆分得到的contig可以认为是属于一个基因家族的转录本序列或者认为是旁系同源基因,而对于一条路径延伸时有多个选择得到的不同contig则认为是同一个基因的不同转录本
c1_g1_i1与c1_g1_i2属于同一个基因的不同转录本,c1_g1_i1与c1_g2_i1属于旁系同源基因
此结果的理解属于分类后的reads重新运行Trinity得到的Trinity.fasta文件,而最终的Trinity结果是对每一类的Trinity.fasta文件的合并
Trinity的分步运行的更多相关文章
- ejabberd 在eclipse(erlide)中的配置、调试、运行
最近在折腾ejabberd,将ejabberd项目配置到eclipse中进行编译.调试等,现在将过程记下来,希望能帮助到需要的人. 准备 本次环境是在linux中进行,博主的linux是fedora2 ...
- Ejabberd导入到eclipse
ejabberd 在eclipse(erlide)中的配置.调试.运行 最近在折腾ejabberd,将ejabberd项目配置到eclipse中进行编译.调试等,现在将过程记下来,希望能帮助到需要 ...
- 图-最短路径-Dijktra(迪杰斯特拉)算法
1. 迪杰斯特拉算法是由荷兰计算机科学家狄克斯特拉算法于1959 年提出的,因此又叫狄克斯特拉算法.是从一个顶点到其余各顶点的最短路径算法,解决的是有向图中最短路径问题.迪杰斯特拉算法主要特点是以起始 ...
- HOG(方向梯度直方图)
结合这周看的论文,我对这周研究的Histogram of oriented gradients(HOG)谈谈自己的理解: HOG descriptors 是应用在计算机视觉和图像处理领域,用于目标检測 ...
- 转:loadrunner经典面试题
在LoadRunner中为什么要设置思考时间和pacing 答: 录制时记录的是客户端和服务端的交互,如果要精确模拟 用户的行为,那么客户操作客户端时花费了很多时间要怎么模拟呢?录入 填写提交的内容, ...
- LoadRunner面试题
在LoadRunner中为什么要设置思考时间和pacing 答: 录制时记录的是客户端和服务端的交互,如果要精确模拟 用户的行为,那么客户操作客户端时花费了很多时间要怎么模拟呢?录入 填写提交的内容, ...
- REST API设计指导——译自Microsoft REST API Guidelines(一)
前言 前面我们说了,有章可循,有据可依,有正确的产品流程和规范,我们的工作才不至于产生混乱,团队的工作才能更有成效.我们经常见到,程序开发可能只用了半个月,但是接口的联调却经常需要花费半个月甚至一个月 ...
- Loadrunner使用键盘快捷键
---------Loadrunner使用键盘快捷键------------ alt+f8 比较当前快照(仅限于 Web Vuser) alt+ins 新建步骤 ctrl+a 全选 ctrl+c 复制 ...
- lr的脚本调试方法
1) 设置调试断点(快捷键F9)当设置断点的脚本,脚本运行到断点处,自动停止运行,我们可以通过查看运行日志,来观察脚本执行的情况: LR中也能设置断点,具体菜单在:Insert - Toggle B ...
随机推荐
- 早期自学jQuery-二事件
本节目录 ----------①鼠标事件 ----------②键盘事件 ----------③表单事件 ----------④文档窗口事件 ----------⑤举例,按下回车键触发事件 事件函数 ...
- ajax用FormData方式提交
<!DOCTYPE html> <html lang="en"> <head> <meta charset="UTF-8&quo ...
- 通过jquery 获取用户当前所在的城市名称和IP地址
下面这段JS代码是通过jquery 结合新浪IP地址库和QQip地址库接口获取用户当前所在的城市(省份)名称. 用户当前IP地址等数据.其中当前IP是通过 QQip地址库接口获取,其他数据都是通过 新 ...
- Android Studio Intent使用(显式、隐式)
https://blog.csdn.net/u012005313/article/details/47006689 使用Intent能够使程序在不同活动中跳转,意及能够使用不同界面.Intent用法分 ...
- 在chrome console添加jQuery支持
有时候想在chrome console使用jq,那么下面这段代码就可以完美解决问题了. var script = document.createElement('script');script.src ...
- Java中的包装数据类型
基本类型 包装器类型 boolean Boolean char Character int Integer byte Byte short Short long Long float Float do ...
- mysql 表结构
1.登录数据库>mysql -u root -p 数据库名称 2.查询所有数据表>show tables; 3.查询表的字段信息>desc 表名称; 4.1添加表字段 alter t ...
- CSS表单3 光标样式 (每个位置鼠标放上去的样式不同)
<!DOCTYPE html> <html> <head> <title>单选按钮对齐</title> ...
- R语言-散点图进阶
1.分组散点图 ①xyplot()函数 > library(lattice) > xyplot(mpg~disp, #定义Y~X轴 + data=mtcars, + groups=cyl, ...
- Modelsim command line 传参数到 .do 文件
gui跑mdelsim总觉得很麻烦,使用命令来启动方便了很多,类似linux一样,其实目前windows也可以做到,只是业界不怎么用windows罢了. 基于modelsim搭了一个UVM环境, 用 ...