今天是2015年的最后一天,决定尽量乘着这三天休息把毕设主题的博客给更完,今天写smmc的算法,接下来三天会对前面的三个算法kmeans、SC以及smmc应用在今年的研究生建模提供的数据中进行matlab实现从而进行效果对比,还有一件高兴的事情是进入沪江三年多了,第一次被cctalk里面的老师抱上麦进行真正意义上的英文对话,搞得都想转行去魔都发展英文了。哈哈,言归正传,进入学术世界吧~

  注意:这里的文字很多摘抄于发表在IEEE上的英文论文《Spectral Clustering on Multiple Manifolds》,觉得人家总结的很好,拿过来拜读一下(部分图片来自于该论文,侵删)~


  在前面的文章谱聚类算法的描述中,我们举出了谱聚类算法的各种貌似靠谱的切割方式。然而,这里的谱聚类的良好聚类结果强烈的依赖于邻接矩阵W,也就是说,当来自不同类的点之间的权重(关系)很小时该算法才能成功发挥效用!这么说可能难以理解,请看以下图片:

  上图中,a、b、c来自于良好分离的两个类的数据聚类结果演示,d、e、f来自有明显相交的数据聚类演示。从图a的数据可视化结果,我们能轻易的了解到两个"S"型的数据簇良好分离,可以被轻易的分割为两个类。通过仔细调整最近邻参数K或者数值参数轻易获得邻接矩阵W的特征。最理想的情况就是来自不同簇的点之间的权重为w=0;这时,谱方法就会将同一个簇内的点映射到空间的一个独立的点,依次类推,在这样的一个k维空间中就存在k个互相正交的点(如图b所示)。最后将这些点返回映射到原始数据中,聚类结果就如图c所示。

  然而,当遇到图d所示的数据时,我们可以看到上图d中的数据之间存在明显的相交处,此时邻接矩阵将会因为成对点之间的不靠谱的相似度而不能很好的反映数据之间的关系。比如说,一般情况下,不同簇内的点之间的相似度很低(接近0)但是在上图中数据的交汇处的点之间的相似度将会因为它们的欧式距离很小变得很高。简而言之,我们试图将上图d中的数据聚为两类,但是因为这两个类彼此之间关系相当紧密导致无法将其分为两个子集。

  实际上,广义特征问题(D-W)*u=lambda*D*u(lambda为特征值,u为特征向量,这里我不明白作者为啥在等式右边多写一个D)类似于LEM(拉普拉斯特征映射)的最优化问题,该问题是一个经典的流形学习问题。我们很容易本例中的前两个特征向量是由拥有相同值的标量组成,该标量最优的保留了原始数据的局部领域信息。导致两个不同簇的相交结构被保留到了映射空间中(如图e所示),后面的kmeans算法也就无法将这个结构分离开来。

  现在,我们知道了谱聚类的弱点,俗话说:学无止境。因此,我们借助了亲爱的多流形学习方法引入了谱多流形聚类(smmc)。

  先挖个坑,先去老哥那里过完元旦第二天继续补~

谱多流形聚类SMMC的更多相关文章

  1. 大数据下多流形聚类分析之谱聚类SC

    大数据,人人都说大数据:类似于人人都知道黄晓明跟AB结婚一样,那么什么是大数据?对不起,作为一个本科还没毕业的小白实在是无法回答这个问题.我只知道目前研究的是高维,分布在n远远大于2的欧式空间的数据如 ...

  2. 解读人:刘佳维,Spectral Clustering Improves Label-Free Quantification of Low-Abundant Proteins(谱图聚类改善了低丰度蛋白的无标记定量)

    发表时间:(2019年4月) IF:3.95 单位: 维也纳医科大学: 欧洲生物信息研究所(EMBL-EBI): 分子病理学研究所: 奥地利科学院分子生物技术研究所: Gregor Mendel分子植 ...

  3. 图论基础之Dijkstra算法的初探

         图论,顾名思义就是有图有论.        图:由点"Vertex"和边"Edge "组成,且图分为有向图和无向图(本文讨论有向图),之前做毕业设计的 ...

  4. CAD&CG GDC 2018大会论文录用名单

    Section 1 增强现实与图形学: 报告时间:2018-8-25 14:00-15:30 报告地点:会议室1 P000009 基于增强现实的产品质量信息传递方法 P000104 重彩画的风格转移 ...

  5. 用scikit-learn学习谱聚类

    在谱聚类(spectral clustering)原理总结中,我们对谱聚类的原理做了总结.这里我们就对scikit-learn中谱聚类的使用做一个总结. 1. scikit-learn谱聚类概述 在s ...

  6. 谱聚类(spectral clustering)原理总结

    谱聚类(spectral clustering)是广泛使用的聚类算法,比起传统的K-Means算法,谱聚类对数据分布的适应性更强,聚类效果也很优秀,同时聚类的计算量也小很多,更加难能可贵的是实现起来也 ...

  7. [zz]谱聚类

    了凡春秋USTC 谱聚类 http://chunqiu.blog.ustc.edu.cn/?p=505 最近忙着写文章,好久不写博客了.最近看到一个聚类方法--谱聚类,号称现代聚类方法,看到它简洁的公 ...

  8. Laplacian matrix 从拉普拉斯矩阵到谱聚类

    谱聚类步骤 第一步:数据准备,生成图的邻接矩阵: 第二步:归一化普拉斯矩阵: 第三步:生成最小的k个特征值和对应的特征向量: 第四步:将特征向量kmeans聚类(少量的特征向量):

  9. 谱聚类Ng算法的Matlab简单实现

    请编写一个谱聚类算法,实现"Normalized Spectral Clustering-Algorithm 3 (Ng 算法)" 结果如下 谱聚类算法核心步骤都是相同的: •利用 ...

随机推荐

  1. WPF学习之路(十)实例:用户注册

    通过一个注册用户的实例了解页面间数据的传递 首先构建一个User类  User.cs public class User { private string name; public string Na ...

  2. BIEE11G常用函数及使用说明

    BIEE常用函数使用手册 1.AGGREGATE AT 此函数根据指定的级别聚合列.使用AGGREGATE AT 可确保始终在关键字AT 之后指定的级别执行度量聚合,而无论WHERE 子句如何. 语法 ...

  3. javascript-建造者模式

    建造者模式笔记 1.工厂模式主要是为了创建对象实例或者类簇(抽象工厂),关心的是最终产出(创建)的是什么,不关心你创建的整个过程,仅仅需要知道你最终创建的结果 2.建造者模式目的也是为了创建对象,但是 ...

  4. 解决"is marked as crashed and should be repaired"方法

    初次遇到这个问题是在服务器上放置mysql的磁盘空间满了(数据库目录和网站目录一定要做一定的分离,不要放在一个磁盘空间了) 当请求写入数据库时,php会提示 **** is marked as cra ...

  5. linux 中/proc 详解

    proc 文件系统 在Linux中有额外的机制可以为内核和内核模块将信息发送给进程-- /proc 文件系统.最初设计的目的是允许更方便的对进程信息进行访问(因此得名),现在它被每一个有有趣的东西报告 ...

  6. Android Paint类方法说明

    * Paint类介绍 * * Paint即画笔,在绘图过程中起到了极其重要的作用,画笔主要保存了颜色, * 样式等绘制信息,指定了如何绘制文本和图形,画笔对象有很多设置方法, * 大体上可以分为两类, ...

  7. python 缩进语法,优缺点

    Python的语法比较简单——采用缩进方式 缩进有利有弊: 好处之一是强迫你写出格式化的代码,但没有规定缩进是几个空格还是Tab.按照约定俗成的管理,应该始终坚持使用4个空格的缩进. 其二是强迫你写出 ...

  8. 一:Go编程语言规范--块、声明、作用域

    1.块 块为一对大括号括住的声明和语句.块 = "{" { 语句 ";" } "}" . 除显式源码块外,还有隐式块: 全域块 包含所有的G ...

  9. CSS3魔法堂:CSS3滤镜及Canvas、SVG和IE滤镜替代方案详解[转]

    一.前言    IE特有的滤镜常常作为CSS3各种新特性的降级处理补充,而Adobe转向HTML5后与Chrome合作推出CSS3的Filter特性,因此当前仅Webkit内核的浏览器支持CSS3 F ...

  10. Interlocked系列函数线程同步的缺陷

    1. Code int Work() { while (m_lInterlockedData < 10) { InterlockedIncrement(&m_lInterlockedDa ...