生物信息大数据&数据库(NCBI、EBI、UCSC、TCGA)
想系统的学习生信数据库可以先看一下北大的公开课,有一章专门讲的数据库与软件:
1-生物信息学:导论与方法 北大\10 生物信息数据库及软件资源
一个优秀的生信开发者能够解决如下问题:
- 如何鉴定一个重要的且没有被解决的生物学问题?
- 如何将该问题转化为一个可计算的问题?
- 如何提出一个解决此问题的算法?
- 如何实现该算法?
- 如何评估算法?
生信工具使用者需要解决如下问题:
- 每个方法解决的是哪个生物学问题?
- 该方法有哪些基本的假设?
- 每个参数是什么意思,都是用来干什么的?
- 准确度评估,sensitivity and specificity,tradeoff,应该追求哪一个?
- 生物学问题和方法的局限性?
生信资源的分类:
- 集中资源&独立资源
- 数据库&软件工具
- 原始数据库&二级数据库
- 命令行工具&网页服务器工具
UCSC Genome Browser:基因组浏览器,表达调控、变异数据,track,ENCODE 非编码元件(计划)
集中资源
NCBI |
EBI |
UCSC |
|
链接 |
|||
Tools |
BLAST |
BLAST、Exonerate、ClustalW2 |
BLAT、In-Silico PCR |
Data Repository |
GenBank、GEO、SRA |
ArrayExpress、ENA、PDBe |
ENCODE |
DNA/Genome |
Genome |
Ensembl、Genomes |
Ideogram、Recombination Rate、GC Content |
DNA/Gene |
Gene |
Ensembl |
UCSC Genes、GENCODE、RefSeq Genes |
RNA |
RefSeq |
Ensembl |
mRNAs、ESTs、UniGene |
Proteins |
Protein, RefSeq、Conserved Domain |
UniProt、InterPro、PRIDE |
|
Expression |
UniGene |
Expression、Atlas |
Affy Exon Array、Caltech RNA-seq、Allen Brain |
Regulation |
Transcription、TFBS、Epigenetics、DNaseI HS |
||
Literature |
PubMed |
||
Ontology |
Gene Ontology |
||
Comparative Genomics |
Taxonomy、HomoloGene |
*Ensembl |
Conservation、Neandertal |
Variation |
dbSNP、dbVar |
*Ensembl |
SNPs、DGV、RepeatMasker |
Disease |
OMIM、MeSH、dbGaP、ClinVar |
GAD、COSMIC、ClinVar、GWAS Catalog、QTLs |
独立资源
癌症
DNAnexus Reanalyzes Cancer Genome Atlas Data
DNAnexus完成世界上最大的泛癌症数据的重分析(附数据下载) - 基因慧
DNANexus:DNANexus专注于建立一个云计算服务器中的DNA数据库,然后以服务方式将该数据库提供给研究者和科学家。DNAnexus和谷歌开展技术合作,提供最为全面的DNA数据库,它可通过美国国家生物技术信息中心(NCBI)下SRA的网站访问到这些DNA数据(2011年2月,NCBI曾宣布由于联邦政府削减经费支持逐步淘汰SRA)。
Cancer Genome Atlas:泛癌症基因组
The Cancer Genome Atlas:就是 TCGA 的全称,Atlas 古希腊的一个神
生物信息大数据&数据库(NCBI、EBI、UCSC、TCGA)的更多相关文章
- 大数据数据库HBase(一)——架构原理
一.HBase简介 1.1.Hadoop生态系统 1.2.非关系型数据库知识面扩展 Cassandra hbase mongodb Couchdb,文件存储数据库 Neo4j非关系型图数据库 1.3 ...
- 大数据数据库HBase(二)——搭建与JavaAPI
一.搭建 1.选择一台没有ZK的机器(HBase自带ZK,可能会导致冲突) 2.选择版本2.0.5的HBase 3.解压HBase2.0.5 4.配置HBase的HBASE_HOME和path 5.修 ...
- 大数据时代数据库-云HBase架构&生态&实践
业务的挑战 存储量量/并发计算增大 现如今大量的中小型公司并没有大规模的数据,如果一家公司的数据量超过100T,且能通过数据产生新的价值,基本可以说是大数据公司了 .起初,一个创业公司的基本思路就是首 ...
- 图解大数据 | 海量数据库查询-Hive与HBase详解
作者:韩信子@ShowMeAI 教程地址:http://www.showmeai.tech/tutorials/84 本文地址:http://www.showmeai.tech/article-det ...
- [Hadoop 周边] Hadoop和大数据:60款顶级大数据开源工具(2015-10-27)【转】
说到处理大数据的工具,普通的开源解决方案(尤其是Apache Hadoop)堪称中流砥柱.弗雷斯特调研公司的分析师Mike Gualtieri最近预测,在接下来几年,“100%的大公司”会采用Hado ...
- Hadoop和大数据:60款顶级大数据开源工具
一.Hadoop相关工具 1. Hadoop Apache的Hadoop项目已几乎与大数据划上了等号.它不断壮大起来,已成为一个完整的生态系统,众多开源工具面向高度扩展的分布式计算. 支持的操作系统: ...
- 【转载】Hadoop和大数据:60款顶级大数据开源工具
一.Hadoop相关工具 1. Hadoop Apache的Hadoop项目已几乎与大数据划上了等号.它不断壮大起来,已成为一个完整的生态系统,众多开源工具面向高度扩展的分布式计算. 支持的操作系统: ...
- 阿里云HBase全新发布X-Pack 赋能轻量级大数据平台
一.八年双十一,造就国内最大最专业HBase技术团队 阿里巴巴集团早在2010开始研究并把HBase投入生产环境使用,从最初的淘宝历史交易记录,到蚂蚁安全风控数据存储.持续8年的投入,历经8年双十一锻 ...
- Hadoop和大数据:60款顶级开源工具(山东数漫江湖)
说到处理大数据的工具,普通的开源解决方案(尤其是Apache Hadoop)堪称中流砥柱.弗雷斯特调研公司的分析师Mike Gualtieri最近预测,在接下来几年,“100%的大公司”会采用Hado ...
随机推荐
- Python开发【第六章】:Python面向对象
编程范式 编程是程序员用特定的语法+数据结构+算法组成的代码来告诉计算机如何执行任务的过程,一个程序是程序员为了得到一个任务结果而编写的一组指令的集合,正所谓条条大路通罗马,实现一个任务的方式有很多种 ...
- Android You need to use a Theme.AppCompat theme (or descendant) with this activity.
错误描述为:java.lang.IllegalStateException: You need to use a Theme.AppCompat theme (or descendant) with ...
- 分类指标准确率(Precision)和正确率(Accuracy)的区别
http://www.cnblogs.com/fengfenggirl/p/classification_evaluate.html 一.引言 分类算法有很多,不同分类算法又用很多不同的变种.不同的分 ...
- kafka 生产者java编码
public class KafkaProducerDemo { public static void main(String[] args) throws InterruptedException ...
- $.each()
以下内容非原创 通过它,你可以遍历对象.数组的属性值并进行处理. 使用说明 each函数根据参数的类型实现的效果不完全一致: 1.遍历对象(有附加参数) $.each(Object, function ...
- datatable动态添加,及填充数据
DataTable tblDatas = new DataTable("Datas"); tblDatas.Columns.Add("ID", Type.Get ...
- ASCII编码表
最初的编码:ASCII 补充: ASCII表是适用于美国的,共128位:ISO-8859-1是适用于欧洲的,共256位 :GB2312是适用于中文系统的:UTF-8是万国码,适用于绝大部分语言:ANS ...
- JS逗号运算符的用法详解
逗号运算符的用法详解 注意: 一.由于目前正在功读JavaScript技术,所以这里拿JavaScript为例.你可以自己在PHP中试试. 二.JavaScript语法比较复杂,因此拿JavaScri ...
- html5 Web Storage(localStorage(),sessionStorage())
Web Storage包括了两种存储方式:sessionStorage和localStorage sessionStorage 是会话级别的存储,这些数据只有在同一个会话中的页面才能访问并且当会话结束 ...
- 初识Python第二天(1)
在Python中,一切事物都是对象,对象是基于类创建的,对象继承了类的属性,方法等. 一.传递参数 1.1新建python文件,名为twoday_args.py,输出以下代码 import sys p ...