kmeans聚类和WGCNA

总结了3篇论文中kmeans聚类和WGCNA的运用。

论文1

Comprehensive dissection of transcript and metabolite shifts during seed germination and post-germination stages in poplar[Qu et al. BMC Plant Biology, 2019]

前言: 介绍了种子萌发过程,以及杨树作为模式植物,通过转录组和代谢组分析来研究种子萌发过程基因和代谢物变化的重要性。
内容: 通过kmeans将全部差异基因分为了24类,这24个类别对应了种子萌发的6个时期。根据24个类别的表达特征的相关性又细分为9个类别。再 对9个类别的基因做了富集分析。

下一步对全部的差异表达基因进行了WGCNA。然后对所有颜色模块采用了FISHER检验,查看模块的富集途径。

对绿色和棕色模块进行了富集图分析以及对比。然后对这两个模块进行了网络图分析。

选取的4个初级代谢途径中相关的代谢产物进行了分析以及对代谢产物相关的表达基因进行了热图分析。最后将转录组数据和代谢组数据进行了联合分析。

论文2

Comparative Transcriptome Analysis of Different
Dendrobium Species Reveals Active Ingredients-Related Genes and Pathways [Yuan et al., International Journal of Molecular Sciences, 2019]

前言: 介绍了石斛的营养成分,转录组技术以及共表达网络分析和数据来源。
结果: 测定了数据的根茎叶的生物碱以及多糖的含量。分析了石斛根茎叶中差异表达的基因。做了火山图和韦恩图。通过K-means 聚类了所有的差异表达基因。

然后进行了GO与KEGG 富集分析以及WGCNA。

论文3

A Predictive Coexpression Network Identifies Novel Genes Controlling the Seed-to-Seedling Phase Transition in Arabidopsis thaliana1 [Anderson Tadeu Silva et al., Plant Physiology, 2016]

介绍: 了解种子发芽过程的重要性,介绍了转录组的作用和论文目的。
结果:

  1. 种子到幼苗过渡期间转录组变化(PCA分析)介绍7个不同发育时期(DS,6H,TR,RP,RH,GC,OC)差异表达基因的数目。

  2. 将19,130个转录组映射到种子萌发6个阶段。结果表明,不同组基因在不同的位置显示出表达高峰发展阶段,这表明它们与特定阶段的开发功能具有较高相关性。

  3. 通过K-means分成10个簇(DP1-10)进行了GO富集分析。得知K-mean 10个簇富集种子不同萌发阶段的主要参与基因的变化。

  4. 作者的主要目的是研究种子从自养到异养的光合作用过渡时期是哪些基因在起作用。基因集与过渡区域(DP1、DP2 DP6, DP7,和DP10)明显丰富细胞分化,增殖,光合作用。 DP2、DP6 DP10可能进行细胞分裂与后续细胞化过程但没有光合作用。 然而,光合作用和叶绿素绑定在DP1和DP7丰富。 光合作用相关基因表达可能已经在TR阶段开始。观察了DP1,DP2,DP6,DP7和DP10变化相关的基因相互作用区域。 DP2和DP10显示基因表达模式从DS增加到6H,而DP1和DP6显示基因表达从6H增加到TR。这表明这四个DP与种子发芽的早期相关,与幼苗的生长无关。因此,在这五个DP(DP1,DP2,DP6,DP7和DP10)中,预计DP7中的基因是调控发芽和幼苗期的主要基因。因此,DP7是与从发芽(6H)到早期幼苗建立(OC)的过渡相关的最具代表性的基因集。 DP7的独特之处在于RP后转录本丰度增加,此后一直保持较高水平。 DP7的表达模式表明,所有的转录本一致地上调表达直到幼苗发育。这可能表明RP的调节过程会影响1600多个转录本,这些转录本将控制幼苗的生长。

  5. 最后对DP7的基因进一步确定和分析功能。

总结

第一、二篇论文将K-means和WGCNA分开分析,而第三篇将这两个分析合并起来,文章整体性和逻辑性更强。

[论文总结] kmeans聚类和WGCNA的更多相关文章

  1. 第十三篇:K-Means 聚类算法原理分析与代码实现

    前言 在前面的文章中,涉及到的机器学习算法均为监督学习算法. 所谓监督学习,就是有训练过程的学习.再确切点,就是有 "分类标签集" 的学习. 现在开始,将进入到非监督学习领域.从经 ...

  2. Hadoop平台K-Means聚类算法分布式实现+MapReduce通俗讲解

        Hadoop平台K-Means聚类算法分布式实现+MapReduce通俗讲解 在Hadoop分布式环境下实现K-Means聚类算法的伪代码如下: 输入:参数0--存储样本数据的文本文件inpu ...

  3. 浅谈K-means聚类算法

    K-means算法的起源 1967年,James MacQueen在他的论文<用于多变量观测分类和分析的一些方法>中首次提出 “K-means”这一术语.1957年,贝尔实验室也将标准算法 ...

  4. K-Means 聚类算法

    K-Means 概念定义: K-Means 是一种基于距离的排他的聚类划分方法. 上面的 K-Means 描述中包含了几个概念: 聚类(Clustering):K-Means 是一种聚类分析(Clus ...

  5. 用scikit-learn学习K-Means聚类

    在K-Means聚类算法原理中,我们对K-Means的原理做了总结,本文我们就来讨论用scikit-learn来学习K-Means聚类.重点讲述如何选择合适的k值. 1. K-Means类概述 在sc ...

  6. K-Means聚类算法原理

    K-Means算法是无监督的聚类算法,它实现起来比较简单,聚类效果也不错,因此应用很广泛.K-Means算法有大量的变体,本文就从最传统的K-Means算法讲起,在其基础上讲述K-Means的优化变体 ...

  7. K-means聚类算法

    聚类分析(英语:Cluster analysis,亦称为群集分析) K-means也是聚类算法中最简单的一种了,但是里面包含的思想却是不一般.最早我使用并实现这个算法是在学习韩爷爷那本数据挖掘的书中, ...

  8. k-means聚类算法python实现

    K-means聚类算法 算法优缺点: 优点:容易实现缺点:可能收敛到局部最小值,在大规模数据集上收敛较慢使用数据类型:数值型数据 算法思想 k-means算法实际上就是通过计算不同样本间的距离来判断他 ...

  9. K-Means 聚类算法原理分析与代码实现

    前言 在前面的文章中,涉及到的机器学习算法均为监督学习算法. 所谓监督学习,就是有训练过程的学习.再确切点,就是有 "分类标签集" 的学习. 现在开始,将进入到非监督学习领域.从经 ...

随机推荐

  1. 从源码分析 MGR 的流控机制

    Group Replication 是一种 Shared-Nothing 的架构,每个节点都会保留一份数据. 虽然支持多点写入,但实际上系统的吞吐量是由处理能力最弱的那个节点决定的. 如果各个节点的处 ...

  2. 开源WindivertDotnet

    0 前言 Hi,好久没有写博客,因为近段时间没有新的开源项目给大家.现在终于又写了一篇,是关于网络方向的内容,希望对部分读者有帮助. 1 WinDivert介绍 WinDivert是windows下为 ...

  3. Linux基础_7_文本显示

    注:实质是针对标准输出文本的各种骚操作! 简单查看 注:初略加工后进行显示. cat -n 文件名 #查看文件内容并显示行号 tac 文件名 #逆序查看 more 文件名 less 文件名 #按?搜索 ...

  4. C语言------数据类型与输入输出

    仅供借鉴.仅供借鉴.仅供借鉴(整理了一下大一C语言每个章节的练习题.没得题目.只有程序了) 文章目录 1 .实训名称 2 .实训目的及要求 3 .源代码及运行截图 4 .小结 1 .实训名称 实训2: ...

  5. 在Centos7上安装JDK1.8和tomcat8.5的步骤和过程(亲测可用)

    文章目录 1.在阿里云(Linux)Centos7上安装JDK1.8步骤过程 2.阿里云(Linux)centos7上安装Tomcat8.5步骤过程记录: 卸载JDK Centos7一般都会带有自己的 ...

  6. 重新整理 .net core 实践篇 ———— linux上排查问题 [外篇]

    前言 简单介绍一下在排查问题.献给初学者. 该文的前置篇: https://www.cnblogs.com/aoximin/p/16838657.html 正文 什么是linux系统 linux 是基 ...

  7. fake_useragent—Error occurred during loading data报错问题

    问题如下 解决方法: 在自己的临时文件下新建一个fake_useragent_0.1.11.json 把下面的文字复制进去 临时文件 直接输入cmd %temp% 即可进去 { "rando ...

  8. 谣言检测()《Rumor Detection with Self-supervised Learning on Texts and Social Graph》

    论文信息 论文标题:Rumor Detection with Self-supervised Learning on Texts and Social Graph论文作者:Yuan Gao, Xian ...

  9. 如何在CentOS7上搭建自己的GitLab仓库

    序言 各位好啊,我是会编程的蜗牛,作为java开发者,在团队开发中,一般都是需要使用git及git仓库来管理我们的代码的,这非常方便.我以前在小公司的时候,基本都是一个人开发一个项目,所以也没有怎么接 ...

  10. JS数据结构与算法-概述

    JS数据结构与算法概述 数据结构: 计算机存储, 组织数据的方式, 就像锅碗瓢盆 算法: 一系列解决问题的清晰指令, 就像食谱 两者关系: 程序 = 数据结构 + 算法 邂逅数据结构与算法 什么是数据 ...