Ensembl突变数据描述之(一)——突变物种数据库及预测工具
以下是对Ensembl突变数据库中储存的数据的描述,对于Ensembl数据库中不同的物种,我们从各种来源(例如,dbSNP数据库)导入突变数据(SNP、CNV、等位基因频率、基因型等),导入的突变数据和等位基因经过质量控制过程来标记可疑数据。
我们将突变分成几个不同的类,并计算突变的预测结果,并且我们还创建了突变集以帮助人们从特定数据集中检索特定突变体组。
我们计算了人类每个突变在种群中的连锁不平衡。
突变数据类型
Ensembl突变数据库储存了从外部导入的数据以及就算得来的数据。
外部导入的数据(dbSNP、Sanger、DGVa、…):
碱基突变(SNP、插入、缺失、…)
结构突变(拷贝数变异、串联重复、反转、…)
检测拷贝数的变化
碱基突变和结构突变的位置
等位基因
人群
基因型
表型(例如,人类中的青光眼。)
引文(摘自dbSNP数据库提交的信息,由EPMC和UCSC执行的文本挖掘)
计算数据(预测数据页面)
储存突变数据的物种
Ensembl仅储存了以下23个物种的突变数据,但是用户依然可以在没有突变数据库的物种上使用Variant Effect Predictor VEP。
Short variant | Long variant | Genotype | Association | Prediction | ||||||
---|---|---|---|---|---|---|---|---|---|---|
Species | Sequence variant | (e!91 → e!92) | Source(s) | Structural variant | Sample | Population | Phenotype | Citation | SIFT | PolyPhen |
![]() Cat
Felis catus
|
3.6 million+ | - | 1 source | - | - | - | - | - | - | |
![]() Chicken
Gallus gallus
|
24 million+ | - | 1 source | - | - | |||||
![]() Chimpanzee
Pan troglodytes
|
1.6 million+ | - | 1 source | - | - | - | - | - | ||
![]() Cow
Bos taurus
|
104 million+ | - | 1 source | - | ||||||
![]() Dog
Canis familiaris
|
5.9 million+ | (+148) | 1 source | - | ||||||
![]() Fruitfly
Drosophila melanogaster
|
6.7 million+ | - | 1 source | - | - | - | - | - | ||
![]() Gibbon
Nomascus leucogenys
|
1.1 million+ | - | 1 source | - | - | - | - | - | - | |
![]() Goat
Capra hircus
|
37 million+ | 1 source | - | - | - | - | ||||
![]() Horse
Equus caballus
|
21 million+ | (+16 million) | 1 source | - | ||||||
![]() Human
Homo sapiens
|
329 million+ | (+350,000) | 6 sources | |||||||
![]() Macaque
Macaca mulatta
|
53 million+ | - | 1 source | - | - | - | ||||
![]() Mouse
Mus musculus
|
84 million+ | - | 1 source | - | ||||||
![]() Opossum
Monodelphis domestica
|
1.1 million+ | - | 1 source | - | - | - | - | - | - | - |
![]() Orangutan
Pongo abelii
|
10 million+ | - | 1 source | - | - | - | - | - | - | |
![]() Pig
Sus scrofa
|
67 million+ | - | 3 sources | - | ||||||
![]() Platypus
Ornithorhynchus anatinus
|
1.3 million+ | - | 1 source | - | - | - | - | - | ||
![]() Rat
Rattus norvegicus
|
5 million+ | - | 1 source | - | - | |||||
![]() S. cerevisiae
Saccharomyces cerevisiae
|
263,000+ | - | 1 source | - | - | - | - | - | ||
![]() Sheep
Ovis aries
|
61 million+ | - | 1 source | - | ||||||
![]() Tetraodon
Tetraodon nigroviridis
|
902,000+ | - | 1 source | - | - | - | - | - | - | - |
![]() Turkey
Meleagris gallopavo
|
9,000+ | - | 1 source | - | - | - | - | - | ||
![]() Zebra Finch
Taeniopygia guttata
|
1.7 million+ | - | 1 source | - | - | - | - | - | ||
![]() Zebrafish
Danio rerio
|
17 million+ | - | 1 source | - |
列表中对应的Ensembl版本组装序列可以在这里找到。
大多数的突变信息是从NCBI dbSNP数据库中导入的,来自HapMap Project和1000 Genomes Project等项目的数据是在提交给dbSNP数据库后即被导入。
Ensembl还包含其它来源的数据,可在浏览器配置查看这些来源的数据(例如,人)。
# 突变信息展示
基因:突变表和突变图像。例如,KCNE2基因的所有突变
转录本:群体比较,比较突变图像(用于比较不同个体或菌株序列中转录本的突变)。例如,比较不同小鼠品系中的Tmco4
转录本:序列,蛋白质:蛋白质坐标中编码变体的列表。
物理位置:详细信息区域(可以使用左侧的“配置此页面”来绘制变体)菜单允许在Ensembl数据库中显示信息以及DAS格式的外部源,例如,DGV位点。)
表型:显示与某种表型相关的变体的核型视图,例如,青光眼
# 参考资料
Ensembl突变数据描述之(一)——突变物种数据库及预测工具的更多相关文章
- Python数据描述与分析
在进行数据分析之前,我们需要做的事情是对数据有初步的了解,比如对数据本身的敏感程度,通俗来说就是对数据的分布有大概的理解,此时我们需要工具进行数据的描述,观测数据的形状等:而后才是对数据进行建模分析, ...
- python - 数据描述符(class 内置 get/set/delete方法 )
数据描述符(class 内置 get/set/del方法 ): # 什么是描述符 # 官方的定义:描述符是一种具有“捆绑行为”的对象属性.访问(获取.设置和删除)它的属性时,实际是调用特殊的方法(_g ...
- python小知识-属性查询优先级(如果有同名类属性、数据描述符、实例属性存在的话,实例>类>数据描述符)
https://www.cnblogs.com/Jimmy1988/p/6808237.html https://segmentfault.com/a/1190000006660339 https:/ ...
- [py]数据描述符优先级
实例查找属性的顺序: 类属性 > 数据描述符 > 实例属性 > 非数据描述符 > __getattr__ 类属性>数据描述符>实例属性 class Str: def ...
- python数据描述符
Python的描述符是接触到Python核心编程中一个比较难以理解的内容,自己在学习的过程中也遇到过很多的疑惑,通过google和阅读源码,现将自己的理解和心得记录下来,也为正在为了该问题苦恼的朋友提 ...
- Object中defineProperty数据描述
Object.defineProperty是对对象中的属性进行数据描述的 使用语法: Object.defineProperty(obj,prop,descriptor) 使用示例: var data ...
- (原创)大数据时代:基于微软案例数据库数据挖掘知识点总结(Microsoft 决策树分析算法)
随着大数据时代的到来,数据挖掘的重要性就变得显而易见,几种作为最低层的简单的数据挖掘算法,现在利用微软数据案例库做一个简要总结. 应用场景介绍 其实数据挖掘应用的场景无处不在,很多的环境都会应用到数据 ...
- 如果数据为null,则转成数据库可识别的DBNULL.Value
// <summary> /// 如果数据为null,则转成数据库可识别的DBNULL.Value /// </summary> /// <param name=&quo ...
- paip.将数据导入到在英语语音数据库mysql道路解决空原则问题
paip.将数据导入到在英语语音数据库mysql道路解决空原则问题 #---原因:mysql 导入工具bug #---解决:不要使用双引号括注音. 笔者 老哇爪 Attilax 艾龙. EMAIL: ...
随机推荐
- Linux删除文件后空间不释放
最近线上 elasticsearch 由于磁盘空间不足报错,于是乎对磁盘进行了分析,删除了一些 Tomcat 日志文件,但是删除后发现并没有磁盘空间释放.于是 google 了一下. 原来在Linux ...
- 正确认识 DIV+CSS 概念
今天看到神采飞扬发表于前端观察的<DIV+CSS 请不要再忽悠人了>,讲的挺有深意的,尤其对于新手如何正确认识div,学习web标准,使用web标准建站应该有很大帮助.转载过来,共同分享. ...
- 解决COMODO Internet Security更新慢或失败的问题
方法一: COMODO 默认更新服务器只有一个:http://download.comodo.com/ 我电信网络更新速度非常慢: 实在没有办法了,找到了几个更新服务器: http://eu1.dow ...
- 侠客群控引擎二次开发SDK可用方法大全(持续更新)
如这篇文章所示 http://www.xiake.net/blog/archives/1 侠客的插件SDK能提供很强大的功能(所有官方使用的方法都有提供) 这篇文章是详细介绍所有SDK可调用的方法 首 ...
- Nginx Rewrite语法详解
重写中用到的指令 if (条件) {} 设定条件,再进行重写 set #设置变量 return #返回状态码 return 403; break #跳出rewrite rewrite #重写 I ...
- castle windsor学习-----XML Inline Parameters 内联参数
当使用XML配置的时候,可能要给组件指定各种各样的依赖 1.简单的参数 参数名称不区分大小写 <component id="ping" type="Acme.Crm ...
- codevs1279 Guard 的无聊
题目描述 Description 在那楼梯那边数实里面,有一只 guard,他活泼又聪明,他卖萌又霸气.他每天刷题虐 场 D 人考上了 PKU,如果无聊就去数一数质数~~ 有一天 guard 在纸上写 ...
- 介绍几款Web服务器性能压力测试工具
一.http_load 程序非常小,解压后也不到100K http_load以并行复用的方式运行,用以测试web服务器的吞吐量与负载. 但是它不同于大多数压力测试工具,它可以以一个单一的进程运行,一般 ...
- python3 字符串属性(三)
maketrans 和 translate的用法(配合使用) 下面是python的英文用法解释 maketrans(x, y=None, z=None, /) Return a translation ...
- Linux_服务器_08_网卡eth1修改为eth0
一.现象 二.解决步骤 1.修改 70-persistent-net.rules 执行命令: vim /etc/udev/rules.d/-persistent-net.rules 找到与ifconf ...