cuffdiff 和 edgeR 对差异表达基因的描述
ASE又走到了关键的一步 要生成能决定是否有差异表达的table.
准备借鉴一下cuffdiff和edgeR 的结果
cuffdiff对差异表达基因的描述:
一共十四列:
第一列, test_id
a unique identifer describing the transcript, gene, primary transcript, or CDS being tested.
eg XLOC_000003
第二列,gene_id
eg XLOC_000003
第三列, gene
第四列, locus
genomic coordinates for easy browsing to the genes or transcripts being tested.
eg contig_23646:3511-3922
第五列, sample1
label (or number if no labels provided) of the first sample being tested
eg Sample_E
第六列, sample2
label (or number if no labels provided) of the second sample being tested
eg Sample_FHM
第七列, status
can be one of OK(test successful), NOTEST(not enough alignments for testing), LOWDATA(too many fragments in locus), or FAIL, when an ill-conditioned covariance matrix or other numerical exception prevents testing
eg OK
第八列 value_1
FPKM of the gene in sample 1
eg 339.567
第九列 value_2
FPKM of the gene in sample 2
eg 465.939
第十列 log2(fold change)
the (base 2 ) log of the fold change 1/2
eg 0.456447
第十一列 test stat
the value of the test statistic used to compute significance of the observed change in FPKM
不懂什么意思 估计要去翻统计书的节奏了
eg 0.361712
第十二列 p_value
the uncorrected p-value of the test statistic
eg 0.4849
第十三列 q_value
the FDR-adjusted p-value of the test statistic
eg 0.756741
第十四列 significant
can be either 'yes' or 'no' , depending on whether p is greater than the FDR after Benjamini-Hochberg correction for multiple-testing
eg no
The FPKM value represents the concentration of a transcript in your samples, normalized for observed read counts and gene length. Thus fields 7,8 represent measurements for your samples and field 9 is simply a ratio of the two. You might look up FPKM or RPKM values if you're unsure what they represent. Fields 11 and 12 are p-value and q-value. These are values associated with the measured variation or uncertainty when you make repeated measurements of something. You should look up what a p-value and an "adjusted p-value" are (the adjusted one is important for you to understand if you're going to do any genomic data analysis). The 13th field is simply a flag based on whether the value in field 11 or 12 is less than 0.05 (I forget which one, but you could figure it out by exploring your data).
edge R 结果对差异表达基因的描述:
Differential expression analysis of RNA-seq and digital gene expression profiles with biological replication. Uses empirical Bayes estimation and exact tests based on the negative binomial distribution. Also useful for differential signal analysis with other types of genome-scale count data.(貌似两者采用的分布模型是不一样的哦~~)
by freemao
FAFU
free_mao@qq.com
cuffdiff 和 edgeR 对差异表达基因的描述的更多相关文章
- RNA-seq差异表达基因分析之TopHat篇
RNA-seq差异表达基因分析之TopHat篇 发表于2012 年 10 月 23 日 TopHat是基于Bowtie的将RNA-Seq数据mapping到参考基因组上,从而鉴定可变剪切(exon-e ...
- 使用GEO数据库来筛选差异表达基因,KOBAS进行KEGG注释分析
前言 本文主要演示GEO数据库的一些工具,使用的数据是2015年在Nature Communications上发表的文章Regulation of autophagy and the ubiquiti ...
- 使用Trinity拼接以及分析差异表达一个小例子
使用Trinity拼接以及分析差异表达一个小例子 2017-06-12 09:42:47 293 0 0 Trinity 将测序数据分为许多独立的de Brujin grap ...
- 使用limma、Glimma和edgeR,RNA-seq数据分析易如反掌
使用limma.Glimma和edgeR,RNA-seq数据分析易如反掌 Charity Law1, Monther Alhamdoosh2, Shian Su3, Xueyi Dong3, Luyi ...
- Differential expression analysis for paired RNA-seq data 成对RNA-seq数据的差异表达分析
Differential expression analysis for paired RNA-seq data 抽象背景:RNA-Seq技术通过产生序列读数并在不同生物条件下计数其频率来测量转录本丰 ...
- RNA-Seq differential expression analysis: An extended review and a software tool RNA-Seq差异表达分析: 扩展评论和软件工具
RNA-Seq differential expression analysis: An extended review and a software tool RNA-Seq差异表达分析: 扩展 ...
- 差异基因分析:fold change(差异倍数), P-value(差异的显著性)
在做基因表达分析时必然会要做差异分析(DE) DE的方法主要有两种: Fold change t-test fold change的意思是样本质检表达量的差异倍数,log2 fold change的意 ...
- edgeR使用学习【转载】
转自:http://yangl.net/2016/09/27/edger_usage/ 1.Quick start 2. 利用edgeR分析RNA-seq鉴别差异表达基因: #加载软件包 librar ...
- Sensitivity, specificity, and reproducibility of RNA-Seq differential expression calls RNA-Seq差异表达调用的灵敏度 特异性 重复性
Sensitivity, specificity, and reproducibility of RNA-Seq differential expression calls RNA-Seq差异表达调用 ...
随机推荐
- 如何解决linQ“序列不包含任何元素”的问题?
描述:该问题出现在校对BT种子数据的时候遇到的bug,原因是使用linq查找元素的时候 B是A的一个子集, B在A中一定存在,这种情况下就不会抛出异常情况,反之B的一部分不属于A就会异常应为B中的一个 ...
- JS解析json数据并将json字符串转化为数组的实现方法
json数据在ajax实现异步交互时起到了很重要的作用,他可以返回请求的数据,然后利用客户端的js进行解析,这一点体现出js的强大,本文介绍JS解析json数据并将json字符串转化为数组的实现方法, ...
- 经典SQL语句大全.doc
1.说明:创建数据库CREATE DATABASE database-name 2.说明:删除数据库drop database dbname3.说明:备份sql server--- 创建 备份数据的 ...
- C#拉姆达(=>)表达式
前言: 之前小猪曾经分享过自己对C#委托的一点理解 其实在使用委托的过程中我们会大量的使用拉姆达(=>)表达式 介绍: "Lambda表达式"是一个匿名函数,是一种高效的类似 ...
- 在 Ubuntu 14.04/15.04 上配置 Node JS v4.0.0
大家好,Node.JS 4.0 发布了,这个流行的服务器端 JS 平台合并了 Node.js 和 io.js 的代码,4.0 版就是这两个项目结合的产物——现在合并为一个代码库.这次最主要的变化是 N ...
- 利用Nginx+Mono+Fastcgi代替IIS对Asp.Net进行反向代理
Nginx的好处相信我不必多说了,它作为一个相当轻量级的开源Web 服务器以及反向代理服务器而深受欢迎.越来越多的公司已经对它产生兴趣,包括我们公司的许多部门,利用它进行负载均衡和资源管理,之前写过一 ...
- ncs安装及初次运行
Tail-f NCS 作为网络配置程序和基础设备之间的接口,能够展现各种服务,修改各开发商不相同的设备配置,同时能及时同步网络设备状态到cdb(configuration database,配置数据库 ...
- 常州培训 day1 解题报告
第一题:(骗分容易,AC难.) 题目大意: 给出一个字符串,找出满足条件A的区间的个数.A:字符A,B,C的出现次数相同. 都出现0次也算,区间的长度可以是0(就是只有一个数).30% |S| ≤ 1 ...
- ros科大讯飞语音识别环境配置
以在线命令词识别为例: 链接:http://www.xfyun.cn/sdk/dispatcher 1.下载SDK,解压: 2.在ROS工作空间下创建一个Package: catkin_create_ ...
- bitmap格式分析
位图(Bitmap)当然是最简单的,它Windows显示图片的基本格式,其文件扩展名为*.BMP.在Windows下,任何各式的图片文件(包括视频播放)都要转化为位图个时候才能显示出来,各种格式的图片 ...