这篇文章更多的是对于混乱的中文资源的梳理,并补充了一些没有提到的重要参数,希望大家不会踩坑. 1. 简介 1.1 背景 WGCNA(weighted gene co-expression network analysis,权重基因共表达网络分析)是一种分析多个样本基因表达模式的分析方法,可将表达模式相似的基因进行聚类,并分析模块与特定性状或表型之间的关联关系,因此在基因组研究中被广泛应用. 相比于只关注差异表达的基因,WGCNA利用数千或近万个变化最大的基因或全部基因的信息识别感兴趣的基因集,并…
第三章 RNA测序   RNA测序(RNA Sequencing,简称RNA-Seq,也被称为全转录物组鸟枪法测序Whole Transcriptome Shotgun Sequencing,简称WTSS),是基于二代测序技术研究转录组学的方法,可以快速获取给定时刻的一个基因组中RNA的种类和数量. RNA-Seq有助于查看基因的不同转录本.转录后修饰.基因融合.突变/SNP和基因表达随时间的变化,或在不同组中基因表达的差异. RNA-Seq除了可以查看mRNA转录本,还可以查看总RNA.小RN…
kmeans聚类和WGCNA 文章目录 kmeans聚类和WGCNA 论文1 论文2 论文3 总结 总结了3篇论文中kmeans聚类和WGCNA的运用. 论文1 Comprehensive dissection of transcript and metabolite shifts during seed germination and post-germination stages in poplar[Qu et al. BMC Plant Biology, 2019] 前言: 介绍了种子萌发…
网络图(Network)看似复杂,其实构成非常简单,网络图是一种图解模型,形状如同网络,故称网络图,由节点(node)和连线(edge)两个因素组成的.其中 node 又分为 source node(源节点)和 target node(目标节点)两个因素组成的.这里的 node 就是我们的基因,edge 就是基因间的相互作用关系.任何网络图都不外乎这些构成成分.知道了网络图的构成之后,再做图分析就很简单了. 节点(node) 所谓的节点,就是我们要分析的基因.在一个网络图当中往往有数十个乃至上百…
目录 2010年1月:大豆基因组首次发表(Nature) 2010年12月:31个大豆基因组重测序(Nature Genetics) 2014年10月:野生大豆泛基因组(Nature Biotechnology) 2015年2月:大豆在驯化和改良过程中遗传多态性明显降低(Nature Biotechnology) 2017年8月:GWAS解析大豆重要性状网络(Genome Biology) 2018年8月:中国国审大豆品种中黄13的基因组完成(Science China Life Science…
文章目录 wgcna入门-雌性小鼠肝脏表达数据的网络分析:寻找与体重有关的模块 1 数据输入和清洗 1.1 加载基因表达数据 1.2 数据清洗 1.3 加载临床特征数据 2 建设表达网络与模块检测 2.1 自动一步构建网络与模块检测 2.1.1 软阈值的选择:网络拓扑分析 2.1.2 一步构建网络与模块检测 2.2 其他检测算法 3 筛选与表型相关的模块 3.1 量化模块-特质关联 3.2 基因与性状和重要模块的关系:基因重要性和模块成员 3.3 模内分析:鉴定具有高GS和MM的基因 3.4 网…
转自:http://www.gogoqq.com/ASPX/8390905/JournalContent/1303140588.aspx 研究了近半年的算法,记录下来给自己一个交代,也应该是考G前地最后一篇日志了. Weighted Gene Co-Expression Network Analysis中文名有翻译成加权关联网络分析的,感觉不是很恰当,英文来得比较直接.本来是佟昊从老汪那拿的一个课题,因为看起来比较有意思就把文章找来慢慢啃,到现在算是捣鼓出点名堂了.方法是UCLA的一个教授提出来…
RNA-seq中的基因表达量计算和表达差异分析 差异分析的步骤:1)比对:2) read count计算:3) read count的归一化:4)差异表达分析: 背景知识:1)比对:普通比对: BWA,SOAP开大GAP比对:Tophat(Bowtie2):2) Read count(多重比对的问题):丢弃平均分配利用Unique region估计并重新分配表达量计算的本质目标基因表达量相对参照系表达量的数值.参照的本质:( 1)假设样本间参照的信号值应该是相同的:( 2)将样本间参照的观测值校…
RNA-seq是利器,大部分做实验的老板手下都有大量转录组数据,所以RNA-seq的分析需求应该是很大的(大部分的生信从业人员应该都差不多要沾边吧). 普通的转录组套路并不多,差异表达基因.富集分析.WGCNA network以及一些没卵用的花式分析.DEG分析是基础,up and down,做个富集,了解一下处理后到底是什么通路被改变了:WGCNA主要就是根据相关性来找出一些co-express的gene module. 单细胞的转录组的玩法就比较多了,可以理解为超多样本的普通转录组,普通转录…
如果你获得了一个肿瘤差异表达基因,想研究其是否可作为某种肿瘤的潜在标志物和靶点,又怕做实验会得到阴性结果,浪费时间和金钱,这时候你就应该想到Oncomine数据库了(www.oncomine.org). Oncomine整合了GEO.TCGA和已发表的文献等来源的RNA和DNA-seq数据,只要你用非营利机构邮箱注册了就可以免费使用了.下面就以ERBB2基因为例跟着小诺一步一步搞定Oncomine吧. 第一步:ERBB2在肿瘤中的表达 在搜索框中输入ERBB2并设定P值.差异表达倍数和差异的排序…