GO富集分析
GO的主要用途之一是对基因组进行富集分析。例如,给定一组在特定条件下上调的基因,富集分析将使用该基因组的注释发现哪些GO术语被过度表示(或未充分表示)。
富集分析工具
用户可以直接从GOC网站的主页进行浓缩分析。此服务连接到PANTHER分类系统的分析工具,该分类系统使用GO注释进行最新维护。PANTHER分类系统在Mi H等人,PMID:23868073中有详细说明。支持基因ID的列表可以从PANTHER网站获得。
使用GO富集分析工具
1.粘贴或键入要分析的基因的名称,每行一个或用逗号分隔。该工具可以处理MOD特异性基因名称和UniProt ID(例如,Rad54或P38086)。
2.选择GO方面(分子功能,生物过程,细胞成分)进行分析(生物过程是默认的)。
3.选择你的基因来自的物种(默认为智人)。
4.按提交按钮。注意,在后面的步骤中,您将能够上传REFERENCE(又称“背景”)列表。
5.您将被重定向到PANTHER网站上的结果。这些结果是根据你在步骤3中选择的基因组中所有蛋白质编码基因的集合的富集度得出的。
6.(可选但强烈推荐)添加自定义引用列表并重新运行分析。在结果页面顶部的PANTHER分析摘要的“引用列表”行上按“更改”按钮,上传引用列表文件,然后按“启动分析”按钮重新运行分析。参考列表应该是选择较小分析列表的所有基因的列表。例如,在差异表达基因的列表中,参考列表应该只包含在实验中完全
解释结果表
结果页面显示一个表,该表列出了重要的共享GO术语(或GO术语的父母),用于描述用户在前一页上输入的一组基因、背景频率、样本频率、预期p值、每个术语过度/低表示的指示以及p值。此外,结果页面显示分析中使用的所有条件。任何未解决的基因名称都将列在表格的顶部。
背景频率和采样频率
背景频率是在整个背景集中注释到GO术语的基因数量,而样本频率是在输入列表中注释到GO术语的基因数量。例如,如果输入列表包含10个基因,并且富集了背景集包含6442个基因的酿酒酵母的生物过程,那么如果10个输入基因中有5个被注释为GO术语:DNA修复,那么DNA修复的样本频率将是5/10。然而,如果在所有的酿酒酵母基因组中有100个基因被注释为DNA修复,那么背景频率将是100/6442。
被高估或被低估
符号+和-表示一个术语的过度或低度表示。
P值
P值是指在注释到特定GO术语的列表中的总n个基因中,考虑到注释到该GO术语的基因在整个基因组中的比例,至少看到x个基因的概率或机会。也就是说,将用户列表中的基因共享的GO术语与注释的背景分布进行比较。p值越接近零,与基因组相关联的特定GO术语就越显著(即,观察到的特定GO术语对一组基因的注释偶然发生的可能性越小)。
换言之,当搜索过程本体时,如果一个组中的所有基因都与“DNA修复”相关,这个术语将是有意义的。然而,由于基因组中的所有基因(带有GO注释)都间接地与顶级术语“bio._process”相关联,所以如果一个组中的所有基因都与这个非常高水平的术语相关联,那么这并不显著。
外部工具
有许多不同的工具可以提供丰富功能。其中一些是基于网络的,另一些可能需要用户下载应用程序或安装本地环境。工具使用的算法不同,执行的统计测试也不同。
浓缩工具的一些其他示例包括:
富集分析小软件---BiNGO。它是Cytoscape软件中很出色的一个插件。它提供的结果中除了文本格式的富集分析结果外,还会将结果以网络图的形式展现,非常美观。
4.1 GO富集分析的结果为“.bgo”结尾的文件,可在设置的输出结果文件夹内用txt打开查看。
x:所分析的基因富集到该GO term中的数量;
n:基因组中富集到该GO term中的数量;
X:所分析基因的总数
N:基因组中基因的总数
4.2 GO富集分析的层级网络图。每一个圈代表了一个GOterm;颜色是根据富集度即”corrp-value”进行着色的,颜色越深表示富集度越显著;箭头的方向则表示层级关系。
http://fhqdddddd.blog.163.com/blog/static/186991542010824111830376/
GO富集分析的更多相关文章
- 基因探针富集分析(GSEA)& GO & pathway
http://blog.sina.com.cn/s/blog_4c1f21000100utyx.html GO是Gene Ontology的简称,是生物学家为了衡量基因的功能而而发起的一个项目,从分子 ...
- 利用GSEA对基因表达数据做富集分析
image Gene Set Enrichment Analysis (GSEA) is a computational method that determines whether an a p ...
- R: 修改镜像、bioconductor安装及go基因富集分析
1.安装bioconductor及go分析涉及的相关包 source("http://bioconductor.org/biocLite.R") options(BioC_mirr ...
- OS Tools-GO富集分析工具的使用与解读详细教程
我们的云平台上的GO富集分析工具,需要输入的文件表格和参数很简单,但很多同学都不明白其中的原理与结果解读,这个帖子就跟大家详细解释~ 一.GO富集介绍: Gene Ontology(简称G ...
- GO富集分析示例【华为云技术分享】
版权声明:本文为博主原创文章,遵循CC 4.0 BY-SA版权协议,转载请附上原文出处链接和本声明. 本文链接:https://blog.csdn.net/devcloud/article/detai ...
- DAVID 进行 GO/KEGG 功能富集分析
何为功能富集分析? 功能富集分析是将基因或者蛋白列表分成多个部分,即将一堆基因进行分类,而这里的分类标准往往是按照基因的功能来限定的.换句话说,就是把一个基因列表中,具有相似功能的基因放到一起,并和生 ...
- webgestalt 通路富集分析
http://www.webgestalt.org/ 通路富集分析 参考 http://www.sci666.com.cn/9596.html
- GSEA 基因集富集分析
http://software.broadinstitute.org/gsea/index.jsp GSEA(Gene Set Enrichment Analysis)是一种生物信息学的计算方法,用于 ...
- SNPsnap | 筛选最佳匹配的SNP | 富集分析 | CP loci
一个矛盾: GWAS得到的SNP做富集分析的话,通常都会有强的偏向性. co-localization of GWAS signals to gene-dense and high linkage d ...
随机推荐
- tomcat去掉项目名称
进入tomcat的conf目录,查看server.xml,找到<Host></Host>,在里面添加<Context path="" docBase= ...
- WCF访问超时:HTTP 请求已超过xx:yy分配的超时。为此操作分配的时间可能是较长超时的一部分。
在服务端设置时间长些 <client> <endpoint address="http://43.98.49.189:5700/UPJWCFServcie.svc" ...
- 跨域的问题(nginx解决才是王道)
跨域分为两类:一时get跨域,而是post跨域.常见的是三种: 一种是jsonp, $.ajax({ url: "http://127.0.0.1/~chenjiebin/mycode/ph ...
- linux 替换 sed命令 转载
转载自这里,感谢原作者 sed 's/test/mytest/g' example.txt 表示将example.txt中的test文本全部替换为mytest 请注意这个命令sed 's/test/m ...
- metasploit的安装
//直接安装 apt-get update apt-get install metasploit-framework //连接和安装postgresql apt-get install postgre ...
- Got timeout reading communication packets解决方法
Got timeout reading communication packets解决方法 http://www.th7.cn/db/mysql/201702/225243.shtml [Note] ...
- 经典的js返回(退个页面)
<a href="javascript:history.back()">返回</a> <a href="javascript:window. ...
- vue-filter
- Git的安装和配置用户名和密码
在Windows中进行安装.访问https://git-scm.com/,点击Downloads for Windows,我下载的是Git-2.16.2-64-bit.exe.都按照默认选项即可,其中 ...
- 【Java】-NO.13.Algorithm.1.Java Algorithm.1.001-【Java 常用算法手册 】-
1.0.0 Summary Tittle:[Java]-NO.13.Algorithm.1.Java Algorithm.1.001-[Java 常用算法手册 ]- Style:Java Series ...