rrnDB数据库简介-16S基因多拷贝数的证据
16S基因作为mark gene在微生物群落结构的研究中发挥中重要作用, 但是候选的mark gene 肯定不止16S 一种,最新比较火热的功能基因,也可以作为mark gene。利用功能基因作为mark gene, 相比16S有什么优势呢?
在功能基因的文献中指出了两点:
1) 不同物种的16S基因序列可能完全相同,尤其是在二代测序中,我们通常指扩增16S的部分序列,这样不同物种扩增出来的序列完全相同的概率大大增加,这样不同有效的区分物种,所以说利用16S基因做的species 水平的注释,可信度一般;
2)16S基因在一个物种中会有多拷贝,这样PCR是会有多个扩增产物,这样导致在OTU 定量会引入错误,比如物种A只有1个16S基因,物种B有2个16S基因,在群落中,二者丰度相同,经过相同循环次数的PCR , 理论上最终测序得到的reads中,物种B的reads会是物种A的2倍; 在16S研究中,我们通常使用reads 表征某个OTU的分度,尽管在群落中物种A和B相同,但是由于拷贝数的差异,所以定量的结果,不能正确的反映在群落中二者的丰度比例;丰度定量不准确,对于后续的alpha 和 beta 多样性的分析都会有影响;
之前只是文章中这么一说,对于某个物种16S的拷贝数也没有认真去研究过,今天看到了rrnDB 这个数据库;
这个数据库中收录了16S基因为多拷贝的物种;可以直观的看到16S基因多拷贝的现象;
数据库网址如下:
https://rrndb.umms.med.umich.edu/
点击导航栏的 search 按钮,先看一下数据库中的具体记录

先用默认的关键字进行检索,看下检索出来的记录,点击下图的Search 按钮,

检索的结果如下:

第一列Data source record id 是物种基因组在NCBI中的版本号,Data source organism name 是物种名称,RDP taxa 是在RDP 数据库中的注释信息,最后一列16S copies 就是在该物种中16S基因的拷贝数;
从检索的结果可以直观的看出,还是有很多的物种存在16S基因多拷贝的现象;
最新更新的RDP Classifier 程序中,考虑了16S基因的多拷贝现象,对于16S基因的多拷贝数问题,通过这个数据库可以更加直观的了解。
rrnDB数据库简介-16S基因多拷贝数的证据的更多相关文章
- MongoDB数据库简介及安装
一.MongoDB数据库简介 简介 MongoDB是一个高性能,开源,无模式的,基于分布式文件存储的文档型数据库,由C++语言编写,其名称来源取自"humongous",是一种开源 ...
- Oracle数据库简介
Oracle数据库简介 一.介绍 Oracle数据库系统是美国Oracle(甲骨文)公司提供的以分布式数据库为核心的一组软件产品,是目前最流行的客户/服务器(Client/Server,C/S)或浏览 ...
- 数据库 简介 升级 SQLite 总结 MD
Markdown版本笔记 我的GitHub首页 我的博客 我的微信 我的邮箱 MyAndroidBlogs baiqiantao baiqiantao bqt20094 baiqiantao@sina ...
- MongoDB,无模式文档型数据库简介
MongoDB的名字源自一个形容词humongous(巨大无比的),在向上扩展和快速处理大数据量方面,它会损失一些精度,在旧金山举行的MondoDB大会上,Merriman说:“你不适宜用它来处理复杂 ...
- 全球第一开源ERP Odoo操作手册 数据库简介
1.3 数据库简介 每一个独立核算的企业都有一套相互关联的账簿体系, 把这一套完整的账簿体系建立在计算机系统中就称为一个数据库. 一般一个企业只用一个数据库. 如果企业有几个下属的独立核算的实体,也可 ...
- PHI 数据库简介
PHI是一个致病菌的数据库,截止到2017年8月1号为止,最新的版本是4.3,数据库中收录了实验验证过的致病菌的信息,其中有176个来自动物的致病菌,227个来自植物的致病菌,3个来自真菌的致病菌; ...
- KEGG orthology (KO) 数据库简介
KEGG, 简称京都基因组百科全书,包含了许多的数据库,对于研究基因功能来说,KEGG orthology 数据库是最基本的一个数据库: KEGG Orthology 简称KO, 对于每个功能已知的基 ...
- MySql数据库基础之数据库简介及安装
MySql数据库简介: 众所周知,MySql数据库是一款开源的关系型数据库,在Web应用方面,MySql是最好的.最流行的RDBMS(Relational Database Management Sy ...
- Scopus数据库简介
ScienceDirect数据库1. Elsevier简介荷兰Elsevier 是全球最大的科学文献出版发行商,已有180多年的历史.其产品涵盖科学.技术和医学等各个领域,包括1800多种学术期刊(大 ...
随机推荐
- git命令--git checkout 之 撤销提交到暂存区的更改
SYJ@WIN-95I6OG3AT1N /D/gitlab/ihr-kafka-produce (master) $ git status [由于工作区文件被修改了,所以显示为红色] On branc ...
- BI--SAP BI的权限管理
源地址 :http://silverw0396.iteye.com/blog/229274 一.sapBI的用户分类 There are different types of users in SAP ...
- 【转】一件有趣的事:我用 Python 爬了爬自己的微信朋友
偶然了解到 Python 里的 itchat 包,它已经完成了 wechat 的个人账号 API 接口,使爬取个人微信信息更加方便. 于是乎玩心一起,打算爬一下自己的微信. 步骤核心: 网页启动not ...
- ROW_NUMBER() OVER函数的基本用法,也可用于去除重复行
语法:ROW_NUMBER() OVER(PARTITION BY COLUMN ORDER BY COLUMN) 简单的说row_number()从1开始,为每一条分组记录返回一个数字,这里的ROW ...
- Python3求笛卡尔积的两种方法
[本文出自天外归云的博客园] 电影异次元杀阵三部曲中密室线索反复出现笛卡尔积的运用.百度百科: 笛卡尔乘积是指在数学中,两个集合X和Y的笛卡尓积(Cartesian product),又称直积,表示为 ...
- Pythonic版二分查找
[本文出自天外归云的博客园] 前提:升序数组,待查元素在数组中. 二分查找:就是一个递归函数c.待查元素a,当前数组中位数b,如果b=a则返回b的索引,b>a则在b左侧的子数组中调用函数c,否则 ...
- Cents os 7下如何安装bzip2
# Cents os 7下如何安装bzip2 ### 安装```yum search bzip2 //查询安装包 yum -y install bzip2.x86_64 ``` ### 原因---- ...
- webscan v0.01
ps:本人不是写代码的料.写出来的贼垃圾.大牛看了如果有可以优化的提出来哈. #by def import urllib res = {} website = raw_input() if " ...
- python parse xml using DOM
demo: import xml.dom.minidom dom=xml.dom.minidom.parse('sample.xml')root = dom.documentElementcc=dom ...
- Dell 服务器阵列扩容【经验分享(转)】
看到论坛有朋友发帖询问Dell服务器的扩容,索性整理下之前做的文档,发出来和大家做个分享. 做之前给大家提醒2个注意点:①请做好数据备份,相同于HP.IBM,该扩容过程是不可逆的.②本扩容方法支持同级 ...