MetaPhlAn 2:宏基因组进化分析
描述
MetaPhlAn是分析从物种水平分辨率宏基因组鸟枪法测序数据的微生物群落(细菌,古细菌,真核细胞和病毒)的组成的计算工具。从版本2.0,MetaPhlAn还能够确定具体的菌株(在将样品含有先前测序的菌株的不那么频繁的情况下),并跟踪跨越样品菌株的所有物种。
MetaPhlAn 2依靠〜1M唯一的特定分支,标记基因(标记信息文件可以在SRC / utils的/ markers_info.txt.bz2或在这里找到)从〜17000的参考基因组鉴定(〜13500细菌和古细菌,3500〜病毒,和〜110真核),使得:
- 明确的分类任务;
- 有机体相对丰度的准确估计;
- 对于细菌,古细菌,真核生物和病毒种级别分辨率;
- 菌种鉴定和跟踪
- 幅度的加速比的订单相比现有的方法。
- 宏基因组应变水平的人口基因组学
先决条件
MetaPhlAn需要Python 2.7版或更高argparse,临时文件和numpy的安装库(除了为numpy的,他们通常与蟒蛇分布一起安装)。现在还支持Python3。
如果提供的SAM输出BowTie2作为输入,没有额外的前提条件。
如果您想使用BowTie2集成在MetaPhlAn,你需要有BowTie2版本2.0.0或更高版本和Perl安装(bowtie2需要在与执行系统路径和读权限)
如果使用“utils的/ metaphlan_hclust_heatmap.py”的剧本绘制和聚类多MetaPhlAn异形样本,还需要以下Python库:matplotlib,SciPy的,pylab(如果不与MatPlotLib一起安装)。
如果要产生输出为“BIOM”文件,你还需要BIOM安装
MetaPhlAn不紧密地与先进的热图密谋整合hclust2和进化树可视化GraPhlAn。如果使用这样的可视化工具,请参考他们的先决条件。
安装: clone https://bitbucket.org/biobakery/metaphlan2
基本用法:
========== MetaPhlAn 2 分支- 丰 估计 =================
========== MetaPhlAn 2 株 跟踪 ============================
INPUT_FILE 的 输入 文件 可以 是:
* 一个 FASTQ 文件 包含 宏基因组 读取
或
* 一个 BowTie2 产生的 SAM 文件。
OR
* 一个 中介 映射 文件 中 的 宏基因组 产生 由 一个 先前 MetaPhlAn 运行
如果 该 输入 文件 的 丢失, 该 脚本 假定 是 在 输入 时 提供 使用 的 标准
输入, 或 命名 管道。
重要提示: 该 类型 的 输入 需要 到 被 指定 与 - INPUT_TYPE
OUTPUT_FILE 的 选项卡- 分隔 输出 文件 中 的 预测 分类群 的相对 丰度
[ stdout中 ,如果 不 存在] 必需的 参数:
- mpa_pkl MPA_PKL 的 元数据 腌制 MetaPhlAn 文件
- INPUT_TYPE { FASTQ ,FASTA ,multifasta ,multifastq ,bowtie2out ,SAM }
设置 是否 该 输入 是 在 multifasta 文件 的 宏基因组 读取 或
将 SAM 文件 中 的 映射 中 的 读取 反对 在 MetaPhlAn 分贝。
[ 默认的 “ 自动” , 我。Ë 。 该 脚本 将 尝试 以 猜测 的 输入 格式]
MetaPhlAn 2:宏基因组进化分析的更多相关文章
- 微生物组学数据分析工具综述 | 16S+宏基因组+宏病毒组+宏转录组--转载
转载:https://mp.weixin.qq.com/s/xsL9GuLs7b3nRF8VeRtinQ 建立在高通量测序基础上的微生物群落研究,当前主要有三大类:基于16S/18S/ITS等扩增子做 ...
- 宏基因组扩增子图表解读2散点图:组间整体差异分析(Beta多样性)
散点图 数据点在直角坐标系平面上的分布图.在宏基因组领域,散点图常用于展示样品组间的Beta多样性,常用的分析方法有主成分分析(PCA),主坐标轴分析(PCoA/MDS)和限制条件的主坐标轴分析(CP ...
- 【GWAS文献】基于GWAS与群体进化分析挖掘大豆相关基因
Resequencing 302 wild and cultivated accessions identifies genes related to domestication and improv ...
- 【GWAS文献解读】疟原虫青蒿素抗药性的全基因组关联分析
英文名:Genetic architecture of artemisinin-resistant Plasmodium falciparum 中文名:疟原虫青蒿素抗药性的全基因组关联分析 期刊:Na ...
- 全基因组关联分析(Genome-Wide Association Study,GWAS)流程
全基因组关联分析流程: 一.准备plink文件 1.准备PED文件 PED文件有六列,六列内容如下: Family ID Individual ID Paternal ID Maternal ID S ...
- WeakSelf宏的进化(转载)
我们都知道在防止如block的循环引用时,会使用__weak关键字做如下定义: __weak typeof(self) weakSelf = self; 后来,为了方便,不用每次都要写这样一句固定代码 ...
- 内核中container_of宏的详细分析【转】
转自:http://blog.chinaunix.net/uid-30254565-id-5637597.html 内核中container_of宏的详细分析 16年2月28日09:00:37 内核中 ...
- 基因组表达分析:如何选择RNA-seq vs. 芯片
基因组表达分析:如何选择RNA-seq vs. 芯片 发布日期:2017-03-29 10:00 DNA 芯片(上图左侧)由附着在表面的核酸探针组成.首先,从样品中提取 RNA 并转化为互补 DNA( ...
- 全基因组关联分析(GWAS)的计算原理
前言 关于全基因组关联分析(GWAS)原理的资料,网上有很多. 这也是我写了这么多GWAS的软件教程,却从来没有写过GWAS计算原理的原因. 恰巧之前微博上某位小可爱提问能否写一下GWAS的计算原理. ...
随机推荐
- JavaScript格式化时间
最近最练习遇到一个问题,就是从数据库中获取时间,利用EasyUI界面来显示时间类型的生日,发现它是按照毫秒来计算的long型数据,在界面显示并不能到达到一目了然,这里可以用两种方法来解决这个问题 在d ...
- MySQL数据库一个字段对应多个值得模糊查询
当一个字段想模糊查询出多个字段的时候,正常情况下一般会这么作 select * from a where name like 'a%' or name like 'b%' ....or ...; 但是 ...
- zoj3228Searching the String(ac自动机)
链接 这个题把病毒分为了两种,一种包含可以覆盖,另一种不可以,需要分别求出包含他们的个数,可以把两种都建在一颗tire树上,在最后求得时候判断一下当前节点是属于哪种字符串,如果是不包含的需要判断一下p ...
- 【转载,整理】域名CNAME解析配置,使用域名B作为域名A的CNAME记录值
最近有个需求,未备案的域名A,想解析到香港 或 国内的服务器上,但是由于未备案,直接使用cdn解析在国内访问会很慢 但是不想直接直接到ip,所以找到两个方法可以解决: 方案一:转移到其他服务器做301 ...
- android 5.0 水波纹 实现
1. 定义一个普通圆角背景的xml; rounded_corners.xml <?xml version="1.0" encoding="utf-8"?& ...
- JAVA学习之路(环境配置,)
最近过去的寒假我就开始看一些JAVA的学习视频了,视频是毕向东老师的,讲得还不错,东北口音,欧了没? 首先是一些基础概念. 1.JAVA的三种技术架构 企业版 J2EE 标准版 J2SE 小型版 J2 ...
- MVC发布问题(一直显示目录浏览)
写了一个MVC的Demo,发布之后一直显示目录浏览,始终无法展示网站. 步骤如下: 1.生成解决方案,发布应用程序 2.打开IIS,新建网站,选择发布程序的代码路径 3.设置应用程序池为4.0,集成 ...
- Octopus系列之一些问题的汇总
1._WidgetCart.html中的数量更新函数和删除函数,转移到MyShoppingCart.html中出错 如果你使用的是jQuery的方式banding函数 比如change 和click, ...
- C#测试web服务是否可用
winform客户端经常需要调用webservice或者WCF进行数据交互,但是远程服务有可能不存在或者服务器不可用,客户端只能通过超时或者捕获到异常感知服务不可用.其实有一个COM借口可用快速的检测 ...
- WCF初探-3:WCF消息交换模式之单向模式
单向模式(One-Way Calls): 在这种交换模式中,存在着如下的特征: 只有客户端发起请求,服务端并不会对请求进行回复 不能包含ref或者out类型的参数 没有返回值,返回类型只能为void ...