官网说明书:http://genome.ucsc.edu/goldenpath/help/hgTracksHelp.html 1.genome brower的作用 a,展示任何尺度的基因组片段.比如,想看某条染色体的某个区域的序列. b,展示某些位置的annotation tracks.比如,你得到一些区域的深度,你想查看下这些区域的深度在染色体上怎么分布的,他们是否有一致性. annotation tracks展示在基因组坐标的下方. ucsc自身带有一些annotaton tracks,一半…
打开UCSC Genome Browser官网.网址:http://genome.ucsc.edu/ 点击导航栏的Genome Data 在新的页面中,点击human,可快速定位至页面中人类基因组数据所在位置. 点击Genome sequence files and select annotations (2bit, GTF, GC-content, etc)后继续点击Standard genome sequence files and select annotations (2bit, GTF…
处理基因组数据,很多时候我们会觉得直接看序列文件不够直观,如果绘图的话,把n多G把数据用画图出来不仅费劲,就算操作也不方便.因此我们可以用UCSC开发出的genome browser,可以直接把数据信息写成track,连上genome browser 上查看,它还支持安装到本地服务器上(genome browser in box ,简称GBIB),genome browser 支持的格式有bedGraph, GTF, PSL, BED, bigBed, WIG, bigGenePred, big…
想系统的学习生信数据库可以先看一下北大的公开课,有一章专门讲的数据库与软件: -生物信息学:导论与方法 北大\ 生物信息数据库及软件资源 一个优秀的生信开发者能够解决如下问题: 如何鉴定一个重要的且没有被解决的生物学问题? 如何将该问题转化为一个可计算的问题? 如何提出一个解决此问题的算法? 如何实现该算法? 如何评估算法? 生信工具使用者需要解决如下问题: 每个方法解决的是哪个生物学问题? 该方法有哪些基本的假设? 每个参数是什么意思,都是用来干什么的? 准确度评估,sensitivity a…
UCSC Genome Browser是由University of California Santa Cruz (UCSC) 创立和维护的,该站点包含有人类.小鼠和大鼠等多个物种的基因组草图和注释信息,并提供一系列的网页分析工具. 1.MySQL安装 本人使用的是Centos6.8系统,推荐使用yum安装. $ yum install -y mysql mysql-devel mysql-server 2.MySQLdb安装 MySQLdb是MySQL的一个线程兼容接口,提供了python数据…
First step, installation: download from UCSC genome browser chmod + x Second, very important: to download the "Chain File". What is "chain file"?  --- to transfer the gene data from one build to another . for example, from hg19 to hg18…
ChIP-seq数据分析整理 1.Alignment 2.Peak detection 3.Peak annotation 1. GO analysis 2. Pathway analysis 4.Differential analysis 5.Peak gene 6.Pathway analysis 7.Data visualization 1.Alignment base calling——Off-Line Basecaller software (OLB V1.8.0). Solexa C…
http://icb.med.cornell.edu/wiki/index.php/Elementolab/ChIPseeqer_Tutorial [怪毛匠子 整理] ChIP-seq[核心分析 下游分析] Core Analysis : Peak detection: Split raw data then run ChIPseeqer Core Analysis : Quality Control: QC analysis for the raw reads (after Split raw…
现在GWAS已经属于比较古老的技术了,主要是碰到严重的瓶颈了,单纯的snp与表现的关联已经不够,需要具体的生物学解释,这些snp是如何具体导致疾病的发生的. 而且,大多数病找到的都不是个别显著的snp,大多数都找到了很多的snp,而且snp都落在非编码区了,这就导致对这些snp的解读非常的困难. 目前,已经有非常傻瓜式的GWAS pipeline了,比如:A tutorial on conducting genome‐wide association studies: Quality contr…
1)BED文件 BED 文件(Browser Extensible Data)格式是ucsc 的genome browser的一个格式 ,提供了一种灵活的方式来定义的数据行,以用来描述注释信息.BED行有3个必须的列和9个额外可选的列.每行的数据格式要求一致(见下图). 每条线的字段数目必须是任意单条数据的在注释上一致. BED文件结构:-------------------------------------------------------------必须有以下3列------------…