火山图 Volcano plot
在统计学上,火山图是一种类型的散点图,被用于在大数据中快速鉴定变化。由于它的形成像火山喷发的样子,所以被称为火山图。和上文讲的曼哈顿图类似。
 
火山图基本元素
火山图也有很多种样式,在生物学高通量测序结果中,常见有的X和Y轴分别为aboundance 和 fold-change,或p-value和fold-change两种样式。如上图中为p-value versus fold-change的样式,,先此为例进行图中基本元素解读:
- X轴:通常为两组基因表达或OTU相对丰度比较的变化倍数取2的对数log2(Fold change)。 取log2的原因:由于两数相比,倍数取值范围为0 - 正无穷,上调的倍数为1 - 正无穷,比较容易理解;而下调倍数为0-1很难理解。如果取对数可将倍数以1为中心左右对称,取2的对数是因为经验上2倍差异比较常用,故取log2变换既可以使上调或下调数据对称(上、下调的目标同等重要,无偏好),而且坐标轴1个单位刻度的变化即为2倍差异(方便快速筛选足够差异的点);
- Y轴:两组基因表达或OTU相对丰度相比统计上的显著性Pvalue值,通常取负对数10变换 -log10(P-value)。取负对数与转换下调表达数值原理类似,将0-1范围pvalue数据变为0-正无穷,且将越小越显著的P-vale转换为与显著性正相关,方便观察显著差异目标。Pvalue取负对数10转换后,坐标轴数值2,3对应0.01和0.001的显著阈值,便于理解。有时也用-ln或-log2对Pvalue值进行转换。
- 图中点:代表每个基因或OTU在两组相比时差异倍数和显著性的值;通常将显著变化并且差异倍数大于指定阈值的点规定为显著差异的结果,常用颜色高亮显示(图中绿色点)。有些重点关注的点可以添加箭头或标签进一步突出显示(图中绿色箭头)。有时还会有点大小代表相关丰度,点的形状代表其它一些属性,如物种分类信息等。
 
火山图绘制
常用R语言的ggplot2绘制。接一来的统计和绘图课会有详细源代码和分析实例。
 
看图实战(Result)
 
示例1. 各比较组间上/下调显著差异OTU的数量
这篇文章分析了水稻根不同区域的细菌组成,16S分析文章较系统的作品,两年被引用147次,推荐阅读
图2.A 水稻根不同生态位相对于土壤中显著差异的OTU
1. 图中元素解释:不同于上面例子,此图为Fold change versus Average Abundance样式,大家注意一下,常见就这两种。
- X轴标签为Log10(Average Abundance),是相对丰度平均值 取10的对数,这里用X轴展示了OTU的丰度,而不是pvalue值。其实作者X标题可能将Log2错写为了Log10,因为OTU相对丰度分析常用百分、千分和百万分数,即使是最大的百万分数取Log10最大值仅为6,而不会坐标轴刻度至15,这种0-15的刻度是典型的Log2(RPM)百万分数的数据。
- Y轴标签为Log10(Fold Change)是指两组间比较差异倍数经10的对数变换;标签也可能是错误的,因为想让倍数对称必须取负对数,而且通常用-Log2,Log10的值是10时就有上百亿倍,扩增子不可能有这么大的差异或深度(扩增子差异倍数为了防止分母为零需要加某值,因此也减小了差异倍数,不会有非常大的情况;扩增子测序深度一般只有几千至几十万,不可能有上亿的量)。
- 图中的每个点代表一个OTU,其中图上部有颜色的点为显著富集(enriched)的OTU,下部有颜色的点为显著下降(depleted)的OTU,黑灰色的点为没有显著差异的OTU;图中标记的数字为显著富集或下降的OTU的数量;
2. 图表结果:图中展示了从根际、根表到根内与土壤相比,所有OTU的相对丰度和差异倍数,其中高亮显示显著富集或下降差异OTU和数量;
3. 图表结论和规律:从根际-根表-根内,从外到内,显著差异的OTU总数量是逐渐上升的,代表变化越来越大;其中根际有较多富集的OTU,而根表和根内则较多为下降的OTU;
4. 经验和技巧:本图虽然有X/Y轴标签描述有待商榷,但许多优点值得学习;
1. 大家经常看到的看火山图都是竖起的,左、右部分高亮的为差异OTU,而作者将图像放倒(顺时针旋转90度),以Y轴零刻度为分界面,上部为富集OTU,下部为下降OTU也很直观,而且耳目一新;
2. 图中差异OTU的数量标出,不用读者自己去估计,直接明了,感觉信息量更丰富;
3. 三组图并排且变化明显,不用多説,读者自然会去比较差异,引导读者参与分析比较和规律发现。

扩增子图表解读5火山图:差异OTU的数量及变化规律的更多相关文章

  1. 扩增子图表解读3热图:差异菌、OTU及功能

    热图是使用颜色来展示数值矩阵的图形.通常还会结合行.列的聚类分析,以表达实验数据多方面的结果.  热图在生物学领域应用广泛,尤其在高通量测序的结果展示中很流行,如样品-基因表达,样品-OTU相对丰度矩 ...

  2. 扩增子图表解读6韦恩图:比较组间共有和特有OTU或分类单元

    韦恩图 Venn Diagram Venn Diagram,也称韦恩图.维恩图.文氏图,用于显示元素集合重叠区域的图示.   韦图绘制工具 常用R语言的VennDiagram包绘制,输出PDF格式方便 ...

  3. 扩增子图表解读4曼哈顿图:差异分类级别Taxonomy

    曼哈顿图 Manhattan Plot 曼哈顿图本质上是一个散点图,用于显示大量非零大范围波动数值,最早应用于全基因组关联分析(GWAS)研究展示高度相关位点.它得名源于样式与曼哈顿天际线相似(如下图 ...

  4. 扩增子图表解读8网络图:节点OTU或类Venn比较

    网络图 Network 网络图虽然给人高大上的感觉,但是由于信息太多,无法给读者提供读有效的可读信息或是读者不知道该理解什么,总是让人望尔却步.那是因为大家太不了解网络,自己读不懂网络想表达的意思及其 ...

  5. 扩增子图表解读1箱线图:Alpha多样性

    箱线图 箱形图(Box-plot)又称为盒须图.盒式图或箱线图,是一种用作显示一组数据分散情况资料的统计图.因形状如箱子而得名.在宏基因组领域,常用于展示样品组中各样品Alpha多样性的分布 第一种情 ...

  6. 宏基因组扩增子图表解读2散点图:组间整体差异分析(Beta多样性)

    散点图 数据点在直角坐标系平面上的分布图.在宏基因组领域,散点图常用于展示样品组间的Beta多样性,常用的分析方法有主成分分析(PCA),主坐标轴分析(PCoA/MDS)和限制条件的主坐标轴分析(CP ...

  7. 扩增子分析解读6进化树 Alpha Beta多样性

    分析前准备 # 进入工作目录 cd example_PE250 上一节回顾:我们的OTU获得了物种注释,并学习OTU表的各种操作————添加信息,格式转换,筛选信息.   接下来我们学习对OTU序列的 ...

  8. 扩增子分析解读5物种注释 OTU表操作

    本节课程,需要先完成<扩增子分析解读>系列之前的操作 1质控 实验设计 双端序列合并 2提取barcode 质控及样品拆分 切除扩增引物 3格式转换 去冗余 聚类 4去嵌合体 非细菌序列 ...

  9. 扩增子分析解读4去嵌合体 非细菌序列 生成代表性序列和OTU表

    本节课程,需要先完成 扩增子分析解读1质控 实验设计 双端序列合并 2提取barcode 质控及样品拆分 切除扩增引物 3格式转换 去冗余 聚类   先看一下扩增子分析的整体流程,从下向上逐层分析 分 ...

随机推荐

  1. Windows 注册表常用操作

    1 添加一个主键(比如在HKEY_LOCAL_MACHINE\SOFTWARE\中添加一个ABCEDFGHIJKLMN主键) Windows Registry Editor Version 5.00 ...

  2. 【转】在Oracle中查看各个表、表空间占用空间的大小

    查看当前用户每个表占用空间的大小:    select segment_name,sum(bytes)/1024/1024 from user_extents group by segment_nam ...

  3. 使用Vitamio插件显示花屏

    Vitamio是一款 Android 与 iOS 平台上的全能多媒体开发框架,全面支持硬件解码与 GPU 渲染. 使用vitamio进行播放器的开发非常便捷,使用vitamio的解码,自己编写播放器界 ...

  4. 利用mass storage class 做免驱动usb设备.

    当需要使用usb bulk传输,想让设备像串口通讯那样和PC主机通信, 通常需要自己做一个PC端的驱动,比较麻烦. 为避免在pc上编写usb设备驱动的麻烦,可以将设备做成mass storage 类的 ...

  5. CDHD驱动器——ServoStudio配置高创伺服速度模式不转

    1. 摘要 速度模式(LED灯显示为0)时,电机不转,但是在位置模式(LED灯显示为8)却可以正常运转. 2. 设置 设置commode=1,fbitprd=1,fbitidx=-3,modmode= ...

  6. 交换排序(2)——冒泡排序(bubble sort)

    冒泡排序算法的运作如下:(从后往前) 比较相邻的元素.如果第一个比第二个大,就交换他们两个. 对每一对相邻元素作同样的工作,从开始第一对到结尾的最后一对.在这一点,最后的元素应该会是最大的数. 针对所 ...

  7. 在IIS上搭建WebSocket服务器(三)

    编写客户端代码 1.新建一个*.html文件. ws = new WebSocket('ws://192.168.85.128:8086/Handler1.ashx?user=' + $(" ...

  8. Codeforces--597A--Divisibility(数学)

     DivisibilityCrawling in process... Crawling failed Time Limit:1000MS     Memory Limit:262144KB    ...

  9. 基于Hive的手机应用信息统计分析系统

    目录 项目概要 具体实现 HIVE查询 项目概要 需求 手机应用日志 定期离线分析手机应用新增用户.活跃用户.沉默用户.启动次数.版本分布和留存用户等业务指标. 工作流程 手机APP启动时,上报启动日 ...

  10. PCB SQL SERVER 发送邮件(异步改同步)

    采用SQL SERVER发送邮件是队列方式(异步)发送邮件,所以在我们执行发送邮件后,无法立即获取到邮件是否发送成功了,而在PCB行业实际应用中是需要立即获取发送邮件是否成功的状态来决定下一步逻辑该如 ...