使用GEO数据库来筛选差异表达基因,KOBAS进行KEGG注释分析
前言
本文主要演示GEO数据库的一些工具,使用的数据是2015年在Nature Communications上发表的文章Regulation of autophagy and the ubiquitin-proteasome system by the FoxO transcriptional network during muscle atrophy.[pubmed:25858807]
作者通过将FoxO1-3-4-floxed小鼠(FoxO1,3,4 f / f)与表达Cre重组酶的转基因系在MLC1f启动子的控制下交叉,在肌肉中特异性地产生敲除的FoxO 1,3,4以产生肌肉特异性FoxO1,3,4三重敲除小鼠。这些小鼠要么自由进食,要么饥饿,随后分别提取4种情况小鼠的RNA,使用Affymetrix提供的试剂盒并根据标准Affymetrix方案制备,标记并与Affymetrix Mouse Genome 430 2.0 Arrays杂交cRNA,分析腓肠肌的基因表达。
GEO数据库筛选差异基因
首先,打开NCBI(https://www.ncbi.nlm.nih.gov/),如下图所示选择GEO Datasets,输入GDS5656,点击Search。
点击搜索到的结果
点击样品分类号,我们可以看到该研究的详情,包括文章研究内容、实验方案设计、样本详情等。
点击Analyze with GEO2R,利用在线工具进行数据分析。将4个样本分成了两组,分组完毕后,点击save all results,获取两组之间的差异表达基因。
得到如下所示的文本内容,将其粘贴到记事本(例如,保存为result.txt),然后导入到excel中(数据→自文本,选择result.txt文件导入),准备进行筛选。
下一步,我们需要对差异表达基因的数据进行进一步的筛选。在这里,我们将p.value(p值,象征着差异的显著性)和logFC(log2处理过的fold change值,象征着差异的倍数)设定为: p.value<0.01, logFC<-2 or logFC>2。即差异表达非常显著,并且差异表达在4倍或-4倍以上(原文使用的是1.5倍阈值)。具体做法参见下图。
最后我们可以在EXCEL左下角的状态栏看到,一共筛选出来738个条目。
使用BioDBnet将geneSybol转换为Ensembl Gene ID
biodbnet(https://biodbnet-abcc.ncifcrf.gov/db/) db2db工具支持多个数据库gene id之间转换
使用BioDBnet将geneSybol转换为Ensembl Gene ID,下载转换完的结果
使用KOBAS进行KEGG注释分析
1. 输入类型选择:Ensembl Gene ID
2. 物种选择:Mus musculus(mouse)
3. 粘贴Ensembl Gene ID列表
4. 数据库 Clear All取消Pathway、Disease、GO全部选项,只选择KEGG Patway
点击RUN
分析结果链接:http://kobas.cbi.pku.edu.cn/result_kobas.php?taskid=181104291408457
下载
使用GEO数据库来筛选差异表达基因,KOBAS进行KEGG注释分析的更多相关文章
- 用GEOquery从GEO数据库下载数据--转载
https://www.plob.org/article/9969.html Gene Expression Omnibus database (GEO)是由NCBI负责维护的一个数据库,设计初衷是为 ...
- cuffdiff 和 edgeR 对差异表达基因的描述
ASE又走到了关键的一步 要生成能决定是否有差异表达的table. 准备借鉴一下cuffdiff和edgeR 的结果 cuffdiff对差异表达基因的描述: 一共十四列: 第一列, test_id ...
- RNA-seq差异表达基因分析之TopHat篇
RNA-seq差异表达基因分析之TopHat篇 发表于2012 年 10 月 23 日 TopHat是基于Bowtie的将RNA-Seq数据mapping到参考基因组上,从而鉴定可变剪切(exon-e ...
- tile38 一款开源的geo 数据库
tile38 是基于golang 编写的geo 数据库,支持地理空间索引.实时地理围栏,同时也支持leader-flower 的部署模型 备注: 下边测试一个简单的地理围栏功能 环境准备 docker ...
- 上传RNA-seq数据到NCBI GEO数据库
SRA - NCBI example - NCBI 要发文章了,审稿时编辑肯定会要求你上传NGS测序数据. 一般数据都是放在集群,不可能放在个人电脑上,因为有的数据大的吓人(几个T). 所以我们就建一 ...
- C#保留2位小数几种场景总结 游标遍历所有数据库循环执行修改数据库的sql命令 原生js轮盘抽奖实例分析(幸运大转盘抽奖) javascript中的typeof和类型判断
C#保留2位小数几种场景总结 场景1: C#保留2位小数,.ToString("f2")确实可以,但是如果这个数字本来就小数点后面三位比如1.253,那么转化之后就会变成1.2 ...
- SQL Server数据库性能优化(三)之 硬件瓶颈分析
参考文献 http://isky000.com/database/mysql-performance-tuning-hardware 由于对DBA 工作了解不多 所以只从网上简单的看了下 硬件 ...
- MySQL数据库InnoDB存储引擎多版本控制(MVCC)实现原理分析
文/何登成 导读: 来自网易研究院的MySQL内核技术研究人何登成,把MySQL数据库InnoDB存储引擎的多版本控制(简称:MVCC)实现原理,做了深入的研究与详细的文字图表分析,方便大家理解I ...
- 数据库字段出现科学计数法e+的情况分析
问题: 有时候,我们在将excel表格中数据导入数据库中时,对于表格中的数字会默认为float的数据类型,这个时候导入到数据库中的这个表的值是正常显示的: 然而如果你要把导入到数据库中的表,再插入到另 ...
随机推荐
- 动态顺序表(C++实现)
顺序表是在计算机内存中以数组的形式保存的线性表,是指用一组地址连续的存储单元依次存储数据元素的线性结构. 这样的存储方式使得线性表逻辑上相邻的元素,其在物理存储单元中也是相邻的.只要知道了第一个元素的 ...
- vim 的配置文件(.vimrc)
linux 下面的root的主目录中新建.vimrc配置文件,配置文件注析方式为“,不是#: 如: "显示行号 set number set ruler
- 《python基础教程(第二版)》学习笔记 基础部分(第1章)
<python基础教程(第二版)>学习笔记 基础部分(第1章)python常用的IDE:Windows: IDLE(gui), Eclipse+PyDev; Python(command ...
- LINQ 学习路程 -- 查询操作 let into关键字
IList<Student> studentList = new List<Student>() { , StudentName = } , , StudentName = } ...
- Win7.窗口自动滚动回到屏幕
PS:笔记本 ThinkPad E440 1.前提:窗口 的一部分位于在屏幕的外面,此窗口处于激活的状态 操作:鼠标放置在窗口内部,鼠标继续往屏幕外部移动,鼠标没有任何其他事件(只有 MouseMov ...
- yield生成器的经典案例
如何生成斐波那契數列 斐波那契(Fibonacci)數列是一个非常简单的递归数列,除第一个和第二个数外,任意一个数都可由前两个数相加得到.用计算机程序输出斐波那契數列的前 N 个数是一个非常简单的问题 ...
- uva 111 History Grading(lcs)
题目描述 在信息科学中有一些是关于在某些条件限制下,找出一些计算的最大值. 以历史考试来说好了,学生被要求对一些历史事件根据其发生的年代顺序来排列.所有事件顺序都正确的学生无疑的可以得满分.但是那些没 ...
- JSTL前台报错
报错信息: jsp页面报错 Can not find the tag library descriptor for "http://java.sun.com/jsp/jstl/core&qu ...
- PS 滤镜——漩涡 vortex
%%% Vortex %%% 漩涡效果 clc; clear all; close all; addpath('E:\PhotoShop Algortihm\Image Processing\PS A ...
- 【leetcode刷题笔记】Pow(x, n)
Implement pow(x, n). 题解:注意两点: 普通的递归把n降为n-1会超时,要用二分的方法,每次把xn = x[n/2] * x[n/2] * xn-[n/2]*2, [n/2]表示n ...