GO的主要用途之一是对基因组进行富集分析。例如,给定一组在特定条件下上调的基因,富集分析将使用该基因组的注释发现哪些GO术语被过度表示(或未充分表示)。

  富集分析工具

     用户可以直接从GOC网站的主页进行浓缩分析。此服务连接到PANTHER分类系统的分析工具,该分类系统使用GO注释进行最新维护。PANTHER分类系统在Mi H等人,PMID:23868073中有详细说明。支持基因ID的列表可以从PANTHER网站获得。

   使用GO富集分析工具

   1.粘贴或键入要分析的基因的名称,每行一个或用逗号分隔。该工具可以处理MOD特异性基因名称和UniProt ID(例如,Rad54或P38086)。

   2.选择GO方面(分子功能,生物过程,细胞成分)进行分析(生物过程是默认的)。

   3.选择你的基因来自的物种(默认为智人)。

   4.按提交按钮。注意,在后面的步骤中,您将能够上传REFERENCE(又称“背景”)列表。

   5.您将被重定向到PANTHER网站上的结果。这些结果是根据你在步骤3中选择的基因组中所有蛋白质编码基因的集合的富集度得出的。

  6.(可选但强烈推荐)添加自定义引用列表并重新运行分析。在结果页面顶部的PANTHER分析摘要的“引用列表”行上按“更改”按钮,上传引用列表文件,然后按“启动分析”按钮重新运行分析。参考列表应该是选择较小分析列表的所有基因的列表。例如,在差异表达基因的列表中,参考列表应该只包含在实验中完全

  解释结果表
  结果页面显示一个表,该表列出了重要的共享GO术语(或GO术语的父母),用于描述用户在前一页上输入的一组基因、背景频率、样本频率、预期p值、每个术语过度/低表示的指示以及p值。此外,结果页面显示分析中使用的所有条件。任何未解决的基因名称都将列在表格的顶部。

  背景频率和采样频率
  背景频率是在整个背景集中注释到GO术语的基因数量,而样本频率是在输入列表中注释到GO术语的基因数量。例如,如果输入列表包含10个基因,并且富集了背景集包含6442个基因的酿酒酵母的生物过程,那么如果10个输入基因中有5个被注释为GO术语:DNA修复,那么DNA修复的样本频率将是5/10。然而,如果在所有的酿酒酵母基因组中有100个基因被注释为DNA修复,那么背景频率将是100/6442。
  被高估或被低估
符号+和-表示一个术语的过度或低度表示。
  P值
  P值是指在注释到特定GO术语的列表中的总n个基因中,考虑到注释到该GO术语的基因在整个基因组中的比例,至少看到x个基因的概率或机会。也就是说,将用户列表中的基因共享的GO术语与注释的背景分布进行比较。p值越接近零,与基因组相关联的特定GO术语就越显著(即,观察到的特定GO术语对一组基因的注释偶然发生的可能性越小)。
  换言之,当搜索过程本体时,如果一个组中的所有基因都与“DNA修复”相关,这个术语将是有意义的。然而,由于基因组中的所有基因(带有GO注释)都间接地与顶级术语“bio._process”相关联,所以如果一个组中的所有基因都与这个非常高水平的术语相关联,那么这并不显著。

  外部工具

   有许多不同的工具可以提供丰富功能。其中一些是基于网络的,另一些可能需要用户下载应用程序或安装本地环境。工具使用的算法不同,执行的统计测试也不同。

浓缩工具的一些其他示例包括:

  富集分析小软件---BiNGO。它是Cytoscape软件中很出色的一个插件。它提供的结果中除了文本格式的富集分析结果外,还会将结果以网络图的形式展现,非常美观。

  

  4.1 GO富集分析的结果为“.bgo”结尾的文件,可在设置的输出结果文件夹内用txt打开查看。

  x:所分析的基因富集到该GO term中的数量;

  n:基因组中富集到该GO term中的数量;

  X:所分析基因的总数

  N:基因组中基因的总数

  4.2 GO富集分析的层级网络图。每一个圈代表了一个GOterm;颜色是根据富集度即”corrp-value”进行着色的,颜色越深表示富集度越显著;箭头的方向则表示层级关系。

  http://fhqdddddd.blog.163.com/blog/static/186991542010824111830376/

GO富集分析的更多相关文章

  1. 基因探针富集分析(GSEA)& GO & pathway

    http://blog.sina.com.cn/s/blog_4c1f21000100utyx.html GO是Gene Ontology的简称,是生物学家为了衡量基因的功能而而发起的一个项目,从分子 ...

  2. 利用GSEA对基因表达数据做富集分析

      image Gene Set Enrichment Analysis (GSEA) is a computational method that determines whether an a p ...

  3. R: 修改镜像、bioconductor安装及go基因富集分析

    1.安装bioconductor及go分析涉及的相关包 source("http://bioconductor.org/biocLite.R") options(BioC_mirr ...

  4. OS Tools-GO富集分析工具的使用与解读详细教程

    我们的云平台上的GO富集分析工具,需要输入的文件表格和参数很简单,但很多同学都不明白其中的原理与结果解读,这个帖子就跟大家详细解释~ 一.GO富集介绍:       Gene Ontology(简称G ...

  5. GO富集分析示例【华为云技术分享】

    版权声明:本文为博主原创文章,遵循CC 4.0 BY-SA版权协议,转载请附上原文出处链接和本声明. 本文链接:https://blog.csdn.net/devcloud/article/detai ...

  6. DAVID 进行 GO/KEGG 功能富集分析

    何为功能富集分析? 功能富集分析是将基因或者蛋白列表分成多个部分,即将一堆基因进行分类,而这里的分类标准往往是按照基因的功能来限定的.换句话说,就是把一个基因列表中,具有相似功能的基因放到一起,并和生 ...

  7. webgestalt 通路富集分析

    http://www.webgestalt.org/ 通路富集分析 参考 http://www.sci666.com.cn/9596.html

  8. GSEA 基因集富集分析

    http://software.broadinstitute.org/gsea/index.jsp GSEA(Gene Set Enrichment Analysis)是一种生物信息学的计算方法,用于 ...

  9. SNPsnap | 筛选最佳匹配的SNP | 富集分析 | CP loci

    一个矛盾: GWAS得到的SNP做富集分析的话,通常都会有强的偏向性. co-localization of GWAS signals to gene-dense and high linkage d ...

随机推荐

  1. 关于jquery中on绑定click事件在苹果手机失效的问题

    用一个div当做了一个按钮来使用. <div class="button"> <div class=" next_button button_left ...

  2. mysql 设置 innodb_print_all_deadlocks=ON, 保存死锁日志

    Introduced 5.6.2 Command-Line Format --innodb-print-all-deadlocks=# System Variable Name innodb_prin ...

  3. cd 命令

    [root@localhost ~]# cd # 进入当前用户的家目录 [root@localhost ~]# cd ~ # 进入当前用户的家目录 [root@localhost ~]# cd /da ...

  4. 记录关于vs2008 和vs2015 的报错问题

    出现了 VS2008无法创建项目,无法打开项目的情况,提示这个注册表键值有问题 HKEY_LOCAL_MACHINE \ SOFTWARE \ Microsoft \ MSBuild \ ToolsV ...

  5. Redis入门到高可用(一)——初识Redis

    一.Redis是什么 * 开源 * 基于键值的存储服务系统 * 支持多种数据结构 * 高性能,功能丰富 二.Redis特性 ♦️ 概述 * 速度快 * 支持持久化 * 支持多种数据结构 * 支持多种编 ...

  6. poi 生成excel,最简单代码

    import org.apache.poi.hssf.usermodel.HSSFWorkbook; import org.apache.poi.hssf.usermodel.HSSFSheet; i ...

  7. AxMIMS系统开发环境搭建

    系统环境:Windows10, VS2013, Qt5.6.2 64bit 1.CloudCompare2.8.1编译 (shapefilelib1.3,geos3.6.1) 2.PCL-1.8.0- ...

  8. python连接redis

    一.首先,要下载redis pip3 install redis 二.连接redis import redis #拿到一个redis的链接 conn=redis.Redis('127.0.0.1',6 ...

  9. 查看npm仓库版本号

    http://repo.inspur.com:8081/artifactory/webapp/#/artifacts/browse/simple/General/thirdparty iop 找到现在 ...

  10. ELK(下)

    ELK架构图: 架构图一: 这是最简单的一种ELK架构方式.优点是搭建简单,易于上手.缺点是Logstash耗资源较大,运行占用CPU和内存高.另外没有消息队列缓存,存在数据丢失隐患. 此架构由Log ...