在微生物分析中,经常使用稀释性曲线来评估测序量是否足够;可以使用mothur 这个软件来完成

rarefaction.single 命令用来做稀释性曲线,既可以对单个样本单独分析,也可以一次对多个样本进行分析

对多个样本进行分析:以shannon 指数为例

需要准备一个shared 文件,shared 文件格式可以参考mothur官方文档

https://www.mothur.org/wiki/Shared_file

示例shared 文件如下:

label   Group   numOtus OTU1    OTU2    OTU3    OTU4
usearch A0 792 10125 1572 23 4210
usearch A1 792 2949 1759 6268 2368
usearch A2 792 16895 3861 5576 326
usearch A3 792 1114 3895 2945 1180
usearch A4 792 770 1506 108 450
usearch A5 792 4420 4657 109 265
usearch A6 792 3538 3430 3898 643

mothur 运行的命令如下:

mothur "#rarefaction.single(shared = sample.shared,label = userach,calc = shannon, groupmode = f, processors = 20)"

运行完成之后,在sample.shared 所处的目录下,会生成一系列文件:

1)每个样本对应的 r_abund 文件

示例如下:

usearch 414     10125   4644    4217    4210    4110    3241

其实这个文件就是从sample.shared 中把每个样本单独抽出来

2) 每个样本对应的 r_shannon 文件

示例文件如下:

numsampled      usearch lci     hci
1 0.0000 -0.0000 -0.0000
100 3.4685 3.2035 3.6901
200 3.6593 3.4758 3.7967
300 3.7319 3.6156 3.8696
400 3.7684 3.6695 3.8807
500 3.8004 3.6914 3.8794
600 3.8228 3.7240 3.9017

第一列是抽样的次数,第二列数对应的shannon 指数的值,lci 和 hci 分别代表95%置信区间的左右边界;

基于抽样的次数和每次抽样计算得到的shannon 指数的值就可以画香浓曲线了:

mothur 计算稀释性曲线的更多相关文章

  1. R语言 vegan包计算物种累计曲线

    vegan 包是进行群落数据分析最常用的R包,其中的 specaccum 函数用来计算物种的累计曲线 首先看下官方示例: library(vegan) data(BCI) sp1 <- spec ...

  2. [opencv]计算多边形逼近曲线的长度

    //利用曲线逼近,计算逼近曲线的长度 //首先创建一个逼近曲线 vector<Point2f> approx; approxPolyDP(contours[i], approx, 2, t ...

  3. 16S 基础知识、分析工具和分析流程详解

    工作中有个真理:如果你连自己所做的工作的来龙去脉都讲不清楚,那你是绝对不可能把这份工作做好的. 这适用于任何行业.如果你支支吾吾,讲不清楚,那么说难听点,你在混日子,没有静下心来工作. 检验标准:随时 ...

  4. Deep Learning 学习随记(六)Linear Decoder 线性解码

    线性解码器(Linear Decoder) 前面第一章提到稀疏自编码器(http://www.cnblogs.com/bzjia-blog/p/SparseAutoencoder.html)的三层网络 ...

  5. 三层神经网络自编码算法推导和MATLAB实现 (转载)

    转载自:http://www.cnblogs.com/tornadomeet/archive/2013/03/20/2970724.html 前言: 现在来进入sparse autoencoder的一 ...

  6. Exercise:Sparse Autoencoder

    斯坦福deep learning教程中的自稀疏编码器的练习,主要是参考了   http://www.cnblogs.com/tornadomeet/archive/2013/03/20/2970724 ...

  7. Geatpy遗传算法在曲线寻优上的初步探究

    园子里关于遗传算法的教案不少,但基于geatpy框架的并未多见,故分享此文以作参考,还望广大园友多多指教! Geatpy出自三所名校联合团队之手,是遗传算法领域的权威框架(python),其效率之高. ...

  8. LC滤波电路分析,LC滤波电路原理及其时间常数的计算

    LC滤波器具有结构简单.设备投资少.运行可靠性较高.运行费用较低等优点,应用很广泛. LC滤波器又分为单调谐滤波器.高通滤波器.双调谐滤波器及三调谐滤波器等几种. LC滤波主要是电感的电阻小,直流损耗 ...

  9. 曲线参数化的Javascript实现(代码篇)

    在曲线参数化的Javascript实现(理论篇)中推出了曲线弧长积分的公式,以及用二分法通过弧长s来查找样条曲线上对应的u,再求Q(u)的值.弧长积分函数如下: ,其中-----公式1 Simpson ...

随机推荐

  1. 【delphi】ClientDataSet详细解读

    TClientDataSet的基本属性和方法 TClientDataSet控件继承自TDataSet,其数据存储文件格式扩展名为 .cds/.xml,是基于文件型数据存储和操作的控件. 该控件封装了对 ...

  2. mysql关联更新update

    https://blog.csdn.net/babyfish13/article/details/78082844 ****************************************** ...

  3. Python爬取爱奇艺【老子传奇】评论数据

    # -*- coding: utf-8 -*- import requests import os import csv import time import random base_url = 'h ...

  4. js实现上传图片本地预览功能以及限制图片的文件大小和尺寸大小

    方法一: js: /**     * 上传图片本地预览方法     * @param {Object} fileObj 上传文件file的id元素  fresh-fileToUpload      * ...

  5. 【论文笔记】CNN for NLP

    什么是Convolutional Neural Network(卷积神经网络)? 最早应该是LeCun(1998)年论文提出,其结果如下:运用于手写数字识别.详细就不介绍,可参考zouxy09的专栏, ...

  6. 【神经网络】BP算法解决XOR异或问题MATLAB版

    第一种 %% %用神经网络解决异或问题 clear clc close ms=4;%设置4个样本 a=[0 0;0 1;1 0;1 1];%设置输入向量 y=[0,1,1,0];%设置输出向量 n=2 ...

  7. TRUNC 截取日期或数字,返回指定的值。

    TRUNC(number,num_digits) Number 需要截尾取整的数字. Num_digits 用于指定取整精度的数字.Num_digits 的默认值为 0.   /*********** ...

  8. c语言二分法

    #include <stdio.h> #include <stdlib.h> int Search(int *a,int key) { ,mid; ; while(low< ...

  9. c++读取文件到vector

    读取一个pts文件到一个vector<Point2f>里面. 其中pts文件如下: version: n_points: { } #include <iostream> #in ...

  10. Kafka分区数与消费者个数

    Kafka的分区数是不是越多越好? 分区多的优点 kafka使用分区将topic的消息打散到多个分区分布保存在不同的broker上,实现了producer和consumer消息处理的高吞吐量.Kafk ...