1 介绍

　　拉普拉斯特征映射（Laplacian Eigenmaps）是一种不太常见的降维算法，它看问题的角度和常见的降维算法不太相同，是从局部的角度去构建数据之间的关系。也许这样讲有些抽象，具体来讲，拉普拉斯特征映射是一种基于图的降维算法，它希望相互间有关系的点（在图中相连的点）在降维后的空间中尽可能的靠近，从而在降维后仍能保持原有的数据结构。

2 推导

　　拉普拉斯特征映射通过构建邻接矩阵为 $W$ (邻接矩阵定义见这里) 的图来重构数据流形的局部结构特征。其主要思想是，如果两个数据实例 $i$ 和 $j$ 很相似，那么 $i$ 和 $j$ 在降维后目标子空间中应该尽量接近。设数据实例的数目为 $n$ ，目标子空间即最终的降维目标的维度为 $m$ 。定义 $ n \times m$ 大小的矩阵 $Y$ ，其中每一个行向量 $y_{i}^{T}$ 是数据实例 $i$ 在目标 $m$ 维子空间中的向量表示（即降维后的数据实例 $i$ ）。我们的目的是让相似的数据样例 $i$ 和 $j$ 在降维后的目标子空间里仍旧尽量接近，故拉普拉斯特征映射优化的目标函数如下:

　　　　$\min \sum\limits _{i, j}\left\|y_{i}-y_{j}\right\|^{2} W_{i j}$

　　下面开始推导：

　　　　$ \begin{array}{l} \sum\limits_{i=1}^{n} \sum\limits_{j=1}^{n}&\left\|y_{i}-y_{j}\right\|^{2} W_{i j} \\ &=\sum\limits_{i=1}^{n} \sum\limits_{j=1}^{n}\left(y_{i}^{T} y_{i}-2 y_{i}^{T} y_{j}+y_{j}^{T} y_{j}\right) W_{i j} \\ &=\sum\limits_{i=1}^{n}\left(\sum\limits_{j=1}^{n} W_{i j}\right) y_{i}^{T} y_{i}+\sum\limits_{j=1}^{n}\left(\sum\limits_{i=1}^{n} W_{i j}\right) y_{j}^{T} y_{j}-2 \sum\limits_{i=1}^{n} \sum\limits_{j=1}^{n} y_{i}^{T} y_{j} W_{i j} \\ &=2 \sum\limits_{i=1}^{n} D_{i i} y_{i}^{T} y_{i}-2 \sum\limits_{i=1}^{n} \sum\limits_{j=1}^{n} y_{i}^{T} y_{j} W_{i j} \\ &=2 \sum\limits_{i=1}^{n}\left(\sqrt{D_{i i}} y_{i}\right)^{T}\left(\sqrt{D_{i i}} y_{i}\right)-2 \sum\limits_{i=1}^{n} y_{i}^{T}\left(\sum\limits_{j=1}^{n} y_{j} W i j\right) \\ &=2 \operatorname{trace}\left(Y^{T} D Y\right)-2 \sum\limits_{i=1}^{n} y_{i}^{T}(Y W)_{i} \\ &=2 \operatorname{trace}\left(Y^{T} D Y\right)-2 \operatorname{trace}\left(Y^{T} W Y\right) \\ &=2 \operatorname{trace}\left[Y^{T}(D-W) Y\right] \\ &=2 \operatorname{trace}\left(Y^{T} L Y\right) \end{array} $

　　其中 $W $ 是图的邻接矩阵，对角矩阵 $D$ 是图的度矩阵 $\left(D_{i i}=\sum\limits_{j=1}^{n} W_{i j}\right)$ ，$ L=D-W$ 成为图的拉普拉斯矩阵。

　　变换后的拉普拉斯特征映射优化的目标函数如下:

　　　　$\begin{array}{l}\min \operatorname{trace}\left(Y^{T} L Y\right)\\ \text { s.t. } Y^{T} D Y=I \end{array}$

　　其中限制条件 $s . t . Y^{T} D Y=I$ 保证优化问题有解，下面用拉格朗日乘子法对目标函数求解:

　　　　$f(Y)=\operatorname{tr}\left(Y^{T} L Y\right)+\operatorname{tr}\left[\Lambda\left(Y^{T} D Y-I\right)\right]$

　　　　$\begin{array}{l} \frac{\partial f(Y)}{\partial Y}&=L Y+L^{T} Y+D^{T} Y \Lambda^{T}+D Y \Lambda \\ &=2 L Y+2 D Y \Lambda=0 \end{array}$

　　　　$\therefore L Y=-D Y \Lambda$

　　其中用到了矩阵的迹的求导，具体方法见迹求导。 $\Lambda$ 为一个对角矩阵，另外 $L$ 、 $D$ 均为实对称矩阵，其转置与自身相等。对于单独的 $y$ 向量，上式可写为: $L y=\lambda D y$，这是一个广义特征值问题。通过求得 $m$ 个最小非零特征值所对应的特征向量，即可达到降维的目的。

　　关于这里为什么要选择 $m$ 个最小非零特征值所对应的特征向量。将 $L Y=-D Y \Lambda $ 带回到 $\min \operatorname{trace}\left(Y^{T} L Y\right)$ 中，由于有着约束条件 $Y^{T} D Y=I$ 的限制，可以得到 $ \min \quad \operatorname{trace}\left(Y^{T} L Y\right)=\min \quad t r a c e(-\Lambda)$ 。即为特征值之和。我们为了目标函数最小化，要选择最小的 $m$ 个特征值所对应的特征向量。

3 步骤

　　使用时算法具体步骤为:

　　步骤1：构建图

　　　　使用某一种方法来将所有的点构建成一个图，例如使用KNN算法，将每个点最近的K个点连上边。K是一个预先设定的值。

　　步骤2：确定权重

　　　　确定点与点之间的权重大小，例如选用热核函数来确定，如果点 i 和点 j 相连，那么它们关系的权重设定为：

　　　　$W_{i j}=e^{-\frac{\left\|x_{i}-x_{j}\right\|^{2}}{t}}$

　　　　另外一种可选的简化设定是 $W_{i j}=1$ 如果点 $i$ ，$ j$ 相连，否则 $W_{i j}=0 $ 。

　　步骤3：特征映射

　　　　计算拉普拉斯矩阵 $L$ 的特征向量与特征值: $L y=\lambda D y $

　　　　使用最小的 $m$ 个非零特征值对应的特征向量作为降维后的结果输出。

拉普拉斯特征映射（Laplacian Eigenmaps）的更多相关文章

Laplacian eigenmap 拉普拉斯特征映射
下面是实验室大牛师兄自己写的一段总结,主要内容是Laplacian Eigenmap中的核心推导过程. 有空还是多点向这位师兄请教,每次都会捡到不少金子. Reference : <Laplac ...
四大机器学习降维算法：PCA、LDA、LLE、Laplacian Eigenmaps
四大机器学习降维算法:PCA.LDA.LLE.Laplacian Eigenmaps 机器学习领域中所谓的降维就是指采用某种映射方法,将原高维空间中的数据点映射到低维度的空间中.降维的本质是学习一个映 ...
【转】四大机器学习降维算法：PCA、LDA、LLE、Laplacian Eigenmaps
最近在找降维的解决方案中,发现了下面的思路,后面可以按照这思路进行尝试下: 链接:http://www.36dsj.com/archives/26723 引言机器学习领域中所谓的降维就是指采用某种映 ...
降维（二）----Laplacian Eigenmaps
降维(二)----Laplacian Eigenmaps 降维系列: 降维(一)----说说主成分分析(PCA)的源头降维(二)----Laplacian Eigenmaps ----------- ...
自组织神经网络介绍：自组织特征映射SOM(Self-organizing feature Map)，第三部分
前面两篇介绍了SOM的基本概念和算法,第一部分,第二部分,本篇具体展开一下应用中的一些trick设定. SOM设计细节输出层设计输出层神经元数量设定和训练集样本的类别数相关,但是实际中我们往往不能 ...
自组织特征映射神经网络（SOFM）
1981年芬兰 Helsink 大学的 T·Kohonen 教授提出一种自组织特征映射网 (Self-Organizing Feature Map , SOFM ), 又称 Kohonen 网 . K ...
图像融合之拉普拉斯融合（laplacian blending）
一.拉普拉斯融合基本步骤 1. 两幅图像L,R,以及二值掩模mask,给定金字塔层数level. 2. 分别根据L,R构建其对应的拉普拉斯残差金字塔(层数为level),并保留高斯金字塔下采样最顶端的 ...
拉普拉斯矩阵（Laplacian matrix）
原文地址:https://www.jianshu.com/p/f864bac6cb7a 拉普拉斯矩阵是图论中用到的一种重要矩阵,给定一个有n个顶点的图 G=(V,E),其拉普拉斯矩阵被定义为 L = ...
拉普拉斯平滑（Laplacian smoothing）
概念零概率问题:在计算事件的概率时,如果某个事件在观察样本库(训练集)中没有出现过,会导致该事件的概率结果是 $0$ .这是不合理的,不能因为一个事件没有观察到,就被认为该事件一定不可能发生(即该 ...

随机推荐

UITextFIeld的输入格式问题 ----W.P
---恢复内容开始--- 1.银行卡的输入格式,四个数字,一个空格. 2.金额的输入格式限制,不能以"."开头,"."后精确两位. 注意:第三方输入软件(百度, ...
简单仿京东"筛选"界面双导航栏控制器共存 by Nicky.Tsui
大概就是这么一个效果如图.大概可以看到,"筛选"视图后面有一层视图盖住了后面原来的视图那么我们可以通过加一个view到导航栏控制器的view里面来实现 //该view作为全局变 ...
Linux常用命令整理：文件目录管理
据说,你要对Linux文件做的事情,98%都记录在这篇文章里了. 1.ls命令最常见的命令,相信刚进入linux命令行界面的时候,都要用这个命令看看当前目录下都有哪些文件吧. 名称:List 含义: ...
jquery.form 兼容IE89文件上传
导入部分 <script type="text/javascript" src="js/jquery-1.8.3.min.js" charset=&quo ...
浅谈.net core如何使用EFCore为一个上下文注类型注入多个实例用于连接主从数据库
在很多一主多从数据库的场景下,很多开发同学为了复用DbContext往往采用创建一个包含所有DbSet<Model>父类通过继承派生出Write和ReadOnly类型来实现,其实可以通过命 ...
使用污点分析检查log4j问题
摘要:log4j问题的余波还在继续,为什么这个问题潜伏了这么长时间,大家一直没有发现?这里从静态分析的角度谈下log4j问题的发现. 本文分享自华为云社区<使用污点分析检查log4j问题> ...
如何删除远端已经推送的Commit记录???（Git版本回退）
如何删除远端已经推送的Commit记录???(Git版本回退) 简单描述突然事件:刚刚,就在刚刚,发生误了操作. 操作描述:我把修改的文件保存错分支了,已经commit了.并且还push上去了.对, ...
nginx拒绝国外IP访问
nginx拒绝国外IP访问方法很多,比如iptables,geoip模块,域名解析等等.这些方法不会相互冲突,可以结合起来一起使用. 今天来教大家利用两个小方法解决域名解析禁止掉海外IP访问网站. ...
MySQL是怎么保证redo log和binlog是完整的？
摘要:WAL机制保证只要redo log和binlog保证持久化到磁盘,就能确保MySQL异常重启后,数据可以恢复. 本文分享自华为云社区<MySQL会丢数据吗?>,作者: JavaEdg ...
[自动化]基于kolla-ansible部署的openstack自动化巡检生成xlsx报告
自动化巡检介绍此巡检项目在kolla-ansible部署的openstack环境上开发,利用ansible-playbook编排的功能,对巡检的任务进行编排和数据处理.主要巡检的对象有IaaS平台和 ...

拉普拉斯特征映射（Laplacian Eigenmaps）

1 介绍

2 推导

3 步骤

拉普拉斯特征映射（Laplacian Eigenmaps）的更多相关文章

随机推荐

热门专题