kmeans聚类和WGCNA

总结了3篇论文中kmeans聚类和WGCNA的运用。

论文1

Comprehensive dissection of transcript and metabolite shifts during seed germination and post-germination stages in poplar[Qu et al. BMC Plant Biology, 2019]

前言: 介绍了种子萌发过程,以及杨树作为模式植物,通过转录组和代谢组分析来研究种子萌发过程基因和代谢物变化的重要性。
内容: 通过kmeans将全部差异基因分为了24类,这24个类别对应了种子萌发的6个时期。根据24个类别的表达特征的相关性又细分为9个类别。再 对9个类别的基因做了富集分析。

下一步对全部的差异表达基因进行了WGCNA。然后对所有颜色模块采用了FISHER检验,查看模块的富集途径。

对绿色和棕色模块进行了富集图分析以及对比。然后对这两个模块进行了网络图分析。

选取的4个初级代谢途径中相关的代谢产物进行了分析以及对代谢产物相关的表达基因进行了热图分析。最后将转录组数据和代谢组数据进行了联合分析。

论文2

Comparative Transcriptome Analysis of Different
Dendrobium Species Reveals Active Ingredients-Related Genes and Pathways [Yuan et al., International Journal of Molecular Sciences, 2019]

前言: 介绍了石斛的营养成分,转录组技术以及共表达网络分析和数据来源。
结果: 测定了数据的根茎叶的生物碱以及多糖的含量。分析了石斛根茎叶中差异表达的基因。做了火山图和韦恩图。通过K-means 聚类了所有的差异表达基因。

然后进行了GO与KEGG 富集分析以及WGCNA。

论文3

A Predictive Coexpression Network Identifies Novel Genes Controlling the Seed-to-Seedling Phase Transition in Arabidopsis thaliana1 [Anderson Tadeu Silva et al., Plant Physiology, 2016]

介绍: 了解种子发芽过程的重要性,介绍了转录组的作用和论文目的。
结果:

  1. 种子到幼苗过渡期间转录组变化(PCA分析)介绍7个不同发育时期(DS,6H,TR,RP,RH,GC,OC)差异表达基因的数目。

  2. 将19,130个转录组映射到种子萌发6个阶段。结果表明,不同组基因在不同的位置显示出表达高峰发展阶段,这表明它们与特定阶段的开发功能具有较高相关性。

  3. 通过K-means分成10个簇(DP1-10)进行了GO富集分析。得知K-mean 10个簇富集种子不同萌发阶段的主要参与基因的变化。

  4. 作者的主要目的是研究种子从自养到异养的光合作用过渡时期是哪些基因在起作用。基因集与过渡区域(DP1、DP2 DP6, DP7,和DP10)明显丰富细胞分化,增殖,光合作用。 DP2、DP6 DP10可能进行细胞分裂与后续细胞化过程但没有光合作用。 然而,光合作用和叶绿素绑定在DP1和DP7丰富。 光合作用相关基因表达可能已经在TR阶段开始。观察了DP1,DP2,DP6,DP7和DP10变化相关的基因相互作用区域。 DP2和DP10显示基因表达模式从DS增加到6H,而DP1和DP6显示基因表达从6H增加到TR。这表明这四个DP与种子发芽的早期相关,与幼苗的生长无关。因此,在这五个DP(DP1,DP2,DP6,DP7和DP10)中,预计DP7中的基因是调控发芽和幼苗期的主要基因。因此,DP7是与从发芽(6H)到早期幼苗建立(OC)的过渡相关的最具代表性的基因集。 DP7的独特之处在于RP后转录本丰度增加,此后一直保持较高水平。 DP7的表达模式表明,所有的转录本一致地上调表达直到幼苗发育。这可能表明RP的调节过程会影响1600多个转录本,这些转录本将控制幼苗的生长。

  5. 最后对DP7的基因进一步确定和分析功能。

总结

第一、二篇论文将K-means和WGCNA分开分析,而第三篇将这两个分析合并起来,文章整体性和逻辑性更强。

[论文总结] kmeans聚类和WGCNA的更多相关文章

  1. 第十三篇:K-Means 聚类算法原理分析与代码实现

    前言 在前面的文章中,涉及到的机器学习算法均为监督学习算法. 所谓监督学习,就是有训练过程的学习.再确切点,就是有 "分类标签集" 的学习. 现在开始,将进入到非监督学习领域.从经 ...

  2. Hadoop平台K-Means聚类算法分布式实现+MapReduce通俗讲解

        Hadoop平台K-Means聚类算法分布式实现+MapReduce通俗讲解 在Hadoop分布式环境下实现K-Means聚类算法的伪代码如下: 输入:参数0--存储样本数据的文本文件inpu ...

  3. 浅谈K-means聚类算法

    K-means算法的起源 1967年,James MacQueen在他的论文<用于多变量观测分类和分析的一些方法>中首次提出 “K-means”这一术语.1957年,贝尔实验室也将标准算法 ...

  4. K-Means 聚类算法

    K-Means 概念定义: K-Means 是一种基于距离的排他的聚类划分方法. 上面的 K-Means 描述中包含了几个概念: 聚类(Clustering):K-Means 是一种聚类分析(Clus ...

  5. 用scikit-learn学习K-Means聚类

    在K-Means聚类算法原理中,我们对K-Means的原理做了总结,本文我们就来讨论用scikit-learn来学习K-Means聚类.重点讲述如何选择合适的k值. 1. K-Means类概述 在sc ...

  6. K-Means聚类算法原理

    K-Means算法是无监督的聚类算法,它实现起来比较简单,聚类效果也不错,因此应用很广泛.K-Means算法有大量的变体,本文就从最传统的K-Means算法讲起,在其基础上讲述K-Means的优化变体 ...

  7. K-means聚类算法

    聚类分析(英语:Cluster analysis,亦称为群集分析) K-means也是聚类算法中最简单的一种了,但是里面包含的思想却是不一般.最早我使用并实现这个算法是在学习韩爷爷那本数据挖掘的书中, ...

  8. k-means聚类算法python实现

    K-means聚类算法 算法优缺点: 优点:容易实现缺点:可能收敛到局部最小值,在大规模数据集上收敛较慢使用数据类型:数值型数据 算法思想 k-means算法实际上就是通过计算不同样本间的距离来判断他 ...

  9. K-Means 聚类算法原理分析与代码实现

    前言 在前面的文章中,涉及到的机器学习算法均为监督学习算法. 所谓监督学习,就是有训练过程的学习.再确切点,就是有 "分类标签集" 的学习. 现在开始,将进入到非监督学习领域.从经 ...

随机推荐

  1. 超强的纯 CSS 鼠标点击拖拽效果

    背景 鼠标拖拽元素移动,算是一个稍微有点点复杂的交互. 而在本文,我们就将打破常规,向大家介绍一种超强的仅仅使用纯 CSS 就能够实现的鼠标点击拖拽效果. 在之前的这篇文章中 -- 不可思议的纯 CS ...

  2. 华为路由器NAT基本配置命令

    NAT地址转换 静态 [R1]int g0/0/0 [R1-GigabitEthernet0/0/0]nat static global 202.169.10.5 inside 172.16.1.1 ...

  3. 2021东华杯misc project

    ​ project 题目附件发现是工程文件,按日期排序只有一个新的exe文件,那考点肯定就在这了 ​编辑 运行exe生成了一个zip ​编辑 打开解压缩的文件发现有三部分编码 base64 quote ...

  4. 网络安全(一):信息收集之玩转nmap(理论篇)

    更新时间 2022年09月06日16:20:10 完成nmap介绍,目标选择,主机发现部分 2022年10月28日21:19:20 完成最基本的内容,端口扫描,版本和系统探测,安全其他等 打算的更新计 ...

  5. python渗透测试入门——取代netcat

    1.代码及代码讲解. 实验环境:windows10下的linux子系统+kali虚拟机 import argparse import socket import shlex import subpro ...

  6. 云数据库时代,DBA将走向何方?

    摘要:伴随云计算的迅猛发展,数据库也进入了云时代.云数据库不断涌现,产品越来越成熟和智能,作为数据库管理员的DBA将面临哪些机遇和挑战?又应该具备什么能力,才能应对未来的不确定性? 本文分享自华为云社 ...

  7. Redis系列9:Geo 类型赋能亿级地图位置计算

    Redis系列1:深刻理解高性能Redis的本质 Redis系列2:数据持久化提高可用性 Redis系列3:高可用之主从架构 Redis系列4:高可用之Sentinel(哨兵模式) Redis系列5: ...

  8. v-for中key的作用与原理

    一.虚拟DOM中key的作用 key是虚拟DOM对象的标识,当数据发生变化时,Vue会根据新数据生成新的虚拟DOM,随后Vue会对新虚拟DOM与旧虚拟DOM的差异进行比较. 二.如何选择key 最好使 ...

  9. JIRA操作之JQL

    搜索功能 Jira的搜索功能非常强大,有专用的搜索语言JQL(Jira Query Language).Jira的Python库是基于JQL语法搜索的,返回的是搜索到的问题列表. jira.searc ...

  10. Dockerfile 使用 SSH docker build

    如果在书写 Dockerfile 时,有些命令需要使用到 SSH 连接,比如从私有仓库下载文件等,那么我们应该怎么做呢? Dockerfile 文件配置 为了使得 Dockerfile 文件中的命令可 ...