在扩增子数据分析中,有时会发现多个OTU 注释到了同一个species ,  为什么会出现这种情况呢?

首先既然在OTU水平能分开,说明序列的相似度小于97%,  同一个物种的同一个基因的片段相似度会小于97%吗?

答案是肯定的;

对细菌,古菌,真菌来说,在species 水平下面,还有1个strain 水平,而同一个species的不同strain, 有可能会相似度小于97%;

以RDP 下载的 Fungi 数据来说,在原始数据中,会有很多类似下面这种的序列

>S000448483 Sparassis crispa; MBUH-PIRJO&ILKKA94-1587/ss5
>S000448484 Sparassis crispa; MBUH-ILKKA88-2036/ss6
>S000415306 Sparassis crispa; MAFF 238626
>S000448480 Sparassis crispa; YCD2470/ss2
>S000448481 Sparassis crispa; YCD2637/ss3
>S000448482 Sparassis crispa; MBUH-SAVOLAINEN/ss4
>S000448487 Sparassis crispa; zw-clarku003/ss9
>S000448488 Sparassis crispa; BMS2857/ss10
>S000448479 Sparassis crispa; YCD2145/ss1
>S000448492 Sparassis crispa; HKAS15728/ss19
>S000448493 Sparassis crispa; HKAS32363/ss20
>S000448491 Sparassis crispa; HMAS60590/ss17
>S000448496 Sparassis crispa; RB9/6/87/ss23
>S000448494 Sparassis crispa; HKAS17477/ss21
>S000448498 Sparassis crispa; MBUH-DORISLABER/ss25
>S000448506 Sparassis crispa; FFPRI-TSENGOKU/ss34
>S003841092 Sparassis crispa; JB10
>S000448501 Sparassis crispa; TENN44575/ss28
>S003827683 Sparassis crispa; HKAS43721; AFTOL-ID 703
>S003856778 Sparassis crispa

我截取了部分,前面的 "Sparassis crispa" 是1个物种,而;后面类似 "MBUH-PIRJO&ILKKA94-1587/ss5" 则是不同的strain,

"MBUH-PIRJO&ILKKA94-1587/ss5" 在NCBI 的Nuclteotide 数据库的链接如下

https://www.ncbi.nlm.nih.gov/nuccore/AY218534.1

通过上图,一目了然,species 和 strain 的关系,1个物种有很多的strain , 而在这些strain 之间,就会存在相似度小于 97% 的strain。

RDP 数据库简介的更多相关文章

  1. MongoDB数据库简介及安装

    一.MongoDB数据库简介 简介 MongoDB是一个高性能,开源,无模式的,基于分布式文件存储的文档型数据库,由C++语言编写,其名称来源取自"humongous",是一种开源 ...

  2. Oracle数据库简介

    Oracle数据库简介 一.介绍 Oracle数据库系统是美国Oracle(甲骨文)公司提供的以分布式数据库为核心的一组软件产品,是目前最流行的客户/服务器(Client/Server,C/S)或浏览 ...

  3. 数据库 简介 升级 SQLite 总结 MD

    Markdown版本笔记 我的GitHub首页 我的博客 我的微信 我的邮箱 MyAndroidBlogs baiqiantao baiqiantao bqt20094 baiqiantao@sina ...

  4. MongoDB,无模式文档型数据库简介

    MongoDB的名字源自一个形容词humongous(巨大无比的),在向上扩展和快速处理大数据量方面,它会损失一些精度,在旧金山举行的MondoDB大会上,Merriman说:“你不适宜用它来处理复杂 ...

  5. 全球第一开源ERP Odoo操作手册 数据库简介

    1.3 数据库简介 每一个独立核算的企业都有一套相互关联的账簿体系, 把这一套完整的账簿体系建立在计算机系统中就称为一个数据库. 一般一个企业只用一个数据库. 如果企业有几个下属的独立核算的实体,也可 ...

  6. rrnDB数据库简介-16S基因多拷贝数的证据

    16S基因作为mark gene在微生物群落结构的研究中发挥中重要作用, 但是候选的mark gene 肯定不止16S 一种,最新比较火热的功能基因,也可以作为mark gene.利用功能基因作为ma ...

  7. MySql数据库基础之数据库简介及安装

    MySql数据库简介: 众所周知,MySql数据库是一款开源的关系型数据库,在Web应用方面,MySql是最好的.最流行的RDBMS(Relational Database Management Sy ...

  8. Scopus数据库简介

    ScienceDirect数据库1. Elsevier简介荷兰Elsevier 是全球最大的科学文献出版发行商,已有180多年的历史.其产品涵盖科学.技术和医学等各个领域,包括1800多种学术期刊(大 ...

  9. 数据库----ORACLE和MYSQL数据库简介

    一.什么是数据库? 数据库(Database---DB)按照组织.储存和管理数据的仓库.(理解以下三个概念)   数据(Data)用来描述事物的记录都可称数据,如文字音乐图像.   数据库系统(Dat ...

随机推荐

  1. [CF1030E]Vasya and Good Sequences

    [CF1030E]Vasya and Good Sequences 题目大意: 给定一个长度为\(n(n\le3\times10^5)\)的数列\(a_i(1\le a_i\le10^{18})\). ...

  2. webstorm更改字体大小

    webstorm是一款不错的开发软件,一起来看看webstorm怎么更改字体大小. 1,打开该软件后,点击上面菜单栏的“文件”/File,找到其子菜单中的“设置”/Setting,点击打开. 2,在新 ...

  3. android:ProgressDialog控件

    ProgressDialog 和 AlertDialog 有点类似,都可以在界面上弹出一个对话框,都能够屏蔽 掉其他控件的交互能力.不同的是,ProgressDialog 会在对话框中显示一个进度条, ...

  4. Geek地生活,文艺地思考

    本文纯属整理自己零碎杂乱的思绪,和题目无关.           不知觉间,大学已经两年过去了,忙忙碌碌了两年,大一那年參加了学生会编 辑部和艺术团舞蹈队,课余时间的生活总是被舞蹈队排练.參演和编辑部 ...

  5. 序列化与反序列化的单例模式实现和readResolve()【转】

    如: public class SingleTest implements Serializable{private static final long serialVersionUID = -860 ...

  6. vscode 中使用php-cs-fixer和PHP Formatter 插件规范化PHP代码

    什么是PHP-CS-Fixer?    它是php-fig组织定义的PHP代码规范,良好的代码规范可以提高代码可读性,团队沟通维护成本    使用它可以按照指定的规范格式化您的PHP代码,此工具不仅可 ...

  7. he canvas has been tainted by cross-origin data and tainted canvases may not be exported

    来自: https://ourcodeworld.com/articles/read/182/the-canvas-has-been-tainted-by-cross-origin-data-and- ...

  8. 微软BI 之SSIS 系列 - 导出数据到 Excel 2013 的实现

    开篇介绍 碰到有几个朋友问到这个问题,比较共性,就特意写了这篇小文章说明一下如何实现在 SSIS 中导出数据到 Office Excel 2013 中.通常情况下 2013 以前的版本大多没有问题,但 ...

  9. Android数据库大批量数据插入优化

    对比在android中批量插入数据的3中方式对比(各插入1W条数据所花费的时间): 1. 一个一个插入 public static boolean insert(SQLiteOpenHelper op ...

  10. MySql之查询基础与进阶

     转载请注明原文地址:http://www.cnblogs.com/ygj0930/p/8283547.html 一:基本查询 SELECT [DISTINCT] 列1,列2,列3... FROM 表 ...