ITS简要分析流程(using Qiime)
Qiime安装
参考资料:http://blog.sina.com.cn/s/blog_83f77c940101h2rp.html
Qiime script官方说明http://qiime.org/scripts/index.html
一般ITS数据简要分析过程
reference下载:https://github.com/downloads/qiime/its-reference-otus/its_12_11_otus.tar.gz
其中97_* 和99_*分别是相似度97和99的reference
以下过程仅做参考,具体根据详细项目更改,
1 质控
对数据进行质量控制,去除低质量数据
2 拼接
针对不同平台数据,采用相应的拼接软件拼接,根据contig长度,方差,N50(主要)等指标使用最佳k-mer值
3 pick_otus.py
官方文档:http://qiime.org/scripts/pick_otus.html;
从fasta文件中提取OTUs,提取方法可选,具体有cd-hit,blast,Mothur,usearch等等
具体使用方法:
python pick_otus.py -i seqs.fna -o picked_otus_default
-i参数指定输入序列,-o参数指定输出文件目录,输出文件为seqs_otus.txt和seqs_otus.log,-m可指定提取方法,更多具体参数说明参见官方文档
4 assign_taxonomy.py
官方文档:http://qiime.org/scripts/assign_taxonomy.html
使用下载的reference中的rep_set和 taxonomy文件夹中对应的文件,对序列分类,使用方法:
python assign_taxonomy.py –i seqs.fna -r <otus_dir>/rep_set/97_otus.fasta -t <otus_dir>/taxonomy/97_otu_taxonomy.txt
更多具体参数说明参见官方文档,输出文件示例:tax_assignments.txt
5 make_otu_table.py
官方文档:http://qiime.org/scripts/make_otu_table.html
将提取出的seqs_otus.txt和分类文件tax_assignments.txt制作成out_table,即.biom文件
使用方法:
python make_otu_table.py -i otu_map.txt -t tax_assignments.txt -o otu_table.biom
6 pick_open_reference_otus.py
官方文档:http://qiime.org/scripts/pick_open_reference_otus.html
以上三个步骤可以通过Qiime中自带的pick_open_reference_otus.py流程完成,将需要使用到的参数写到文件params.txt中,并通过-p参数调用,param文件说明文档: http://qiime.org/documentation/qiime_parameters_files.html
7 summarize_taxa_through_plots.py
官方文档:http://qiime.org/scripts/summarize_taxa_through_plots.html
统计各个样品中的OUT中物种丰度信息,并从门纲目科属水平分别绘制物种丰度bar图
python summarize_taxa_through_plots.py -o taxa_summary -i otu_table.biom 在输出文件夹中,双击html文件即可观察bar图
8 alpha_rarefaction.py
官方文档:http://qiime.org/scripts/alpha_rarefaction.html
对拼接后的reads
使用示例:python alpha_rarefaction.py -i otu_table.biom -o arare/ -m map.txt,对reads进行随机抽样,得到的序列数和out数目比较,做出稀释曲线图,得到同样可以通过html文件查看
9 alpha_diversity.py
官方文档:http://qiime.org/scripts/alpha_diversity.html
使用示例:python alpha_diversity.py -i otu_table.biom -m chao1 -o adiv_chao1.txt,单样品多样性分析,绘制Alpha多样性bar图
10 统计.biom文件长度,并选取最短长度作为beta多样性的深度参数
可以借助ipython工具中提供的biom summarize-table方法,选取最短长度n,作为下一步骤中-e 参数(覆盖深度)
11 beta_diversity_through_plots.py
官方文档:http://qiime.org/scripts/beta_diversity_through_plots.html
该流程包含beta_diversity.py principal_coordinates.py make_prefs_file.py三个脚本,能够给出(un)weignted unifrac距离矩阵,并做出2D和3D的PCoA图形
使用示例:python beta_diversity_through_plots.py -i otu_table.biom -o bdiv_even100/ -m map.txt -e 100,使用-p参数指定距离范式
ITS简要分析流程(using Qiime)的更多相关文章
- RxJava && Agera 从源码简要分析基本调用流程(2)
版权声明:本文由晋中望原创文章,转载请注明出处: 文章原文链接:https://www.qcloud.com/community/article/124 来源:腾云阁 https://www.qclo ...
- Activity源码简要分析总结
Activity源码简要分析总结 摘自参考书籍,只列一下结论: 1. Activity的顶层View是DecorView,而我们在onCreate()方法中通过setContentView()设置的V ...
- Android Hal层简要分析
Android Hal层简要分析 Android Hal层(即 Hardware Abstraction Layer)是Google开发的Android系统里上层应用对底层硬件操作屏蔽的一个软件层次, ...
- 转:InnoDB多版本(MVCC)实现简要分析
InnoDB多版本(MVCC)实现简要分析 基本知识 假设对于多版本(MVCC)的基础知识,有所了解.InnoDB为了实现多版本的一致读,采用的是基于回滚段的协议. 行结构 InnoDB表数据的组织方 ...
- Android 5.1 Settings源代码简要分析
转载请注明出处,谢谢~http://blog.csdn.net/u011974987/article/details/51004854. 概述: 先声明:本人工作快两年了,仍是菜鸟级别的.羞愧啊!曾经 ...
- Google发布SSLv3漏洞简要分析报告
今天上午,Google发布了一份关于SSLv3漏洞的简要分析报告.根据Google的说法,该漏洞贯穿于所有的SSLv3版本中,利用该漏洞,黑客可以通过中间人攻击等类似的方式(只要劫持到的数据加密两端均 ...
- 构建ASP.NET MVC4+EF5+EasyUI+Unity2.x注入的后台管理系统(34)-文章发布系统①-简要分析
原文:构建ASP.NET MVC4+EF5+EasyUI+Unity2.x注入的后台管理系统(34)-文章发布系统①-简要分析 系列目录 最新比较闲,为了学习下Android的开发构建ASP.NET ...
- CVE-2015-5122 简要分析(2016.4)
CVE-2015-5122 简要分析 背景 最近在学习Flash漏洞的分析,其与IE漏洞的分析还是有诸多的不同(不便)之处,折腾了一阵子终于克服了没有符号表.Flash的超时定时器等问题.所以找到了去 ...
- Java7中的ForkJoin并发框架初探(中)——JDK中实现简要分析
原文发表于 2013 年 8 月 28 日 由 三石 根据前文描述的Doug Lea的理论基础,在JDK1.7中已经给出了Fork Join的实现.在Java SE 7的API中,多了ForkJoin ...
随机推荐
- git学习资料包
1.廖雪峰老师的git教程:https://www.liaoxuefeng.com -----点击“GIT教程”开始学习 2.菜鸟教程git学习:http://www.runoob.com/gi ...
- Python的集合
1. Python的集合 1.1 集合的定义 在Python中, 集合set是基本数据类型的一种集合类型,它有可变集合(set())和不可变集合(frozenset)两种.Python中的集合set类 ...
- JaveScript变量的简介及其变量的简单使用(JS知识点归纳一)
变量简介 "变量是一个容器" 为什么要有变量? 程序的执行过程中,会使用到许多的数据(用户输入的内容,动态效果的运动数据等),当这些数据需要重复在多个地方使用的时候,就需要一个容器 ...
- netty详解之io模型
提起IO模型首先想到的就是同步,异步,阻塞,非阻塞这几个概念.每个概念的含义,解释,概念间的区别这些都是好理解,这里深入*nix系统讲一下IO模型. 在*nix中将IO模型分为5类. Blocking ...
- [Elasticsearch] 邻近匹配 (二) - 多值字段,邻近程度与相关度
多值字段(Multivalue Fields) 在多值字段上使用短语匹配会产生古怪的行为: PUT /my_index/groups/1 { "names": [ "Jo ...
- C语言中的typedef
说明: ******使用typedefkeyword定义新的数据类型. ***如:typedef unsigned short U16.在定义变量时.unsigned short a和U16 a ...
- PushMeBaby 使用
github 下载地址 https://github.com/stefanhafeneger/PushMeBaby 1.执行假设报错,那么导入CoreServices.framawork 替换这句 # ...
- 中颖内带LED资源驱动代码
//上一篇写了LCD驱动,本篇写下LED驱动 //DISPCON 最高位为1时, 选择LED驱动,LCD驱动无效 最高位为0时, 选择LCD驱动.LED驱动无效 void Sh79fLed_Init( ...
- 十三、 Spring Boot 启动加载数据 CommandLineRunner
实际应用中,我们会有在项目服务启动的时候就去加载一些数据或做一些事情这样的需求. 为了解决这样的问题,spring Boot 为我们提供了一个方法,通过实现接口 CommandLineRunner 来 ...
- QQ 相册后台存储架构重构与跨 IDC 容灾实践
欢迎大家前往云加社区,获取更多腾讯海量技术实践干货哦~ 作者简介:xianmau,2015 年加入腾讯 TEG 架构平台部,一直负责 QQ 相册平台的维护和建设,主导相册上传架构重构和容灾优化等工作. ...