转载:https://blog.csdn.net/victoriaw/article/details/78500894

多维缩放(Multidimensional Scaling, MDS)是一组对象之间的距离的可视化表示,也可以当做一种无监督降维算法使用。

为了直观了解MDS,给一个简单例子。假设现在给定一组城市之间的距离信息如下:

现在要求绘制一幅地图,在地图中标出所有城市,并且城市之间的距离等于上表中给出的距离。显然,这种图不是唯一的,因为平移、旋转操作并不改变距离。其中一种绘制方法如下图:

MDS应用在数据降维时,基本思想和上面的例子相同:保证所有数据点对在低维空间中的距离等于在高维空间中的距离

假设给定N个实例,可以计算出原始空间中的距离矩阵D∈RN×ND∈RN×N,其中第ii行第jj列的元素dijdij表示第ii个实例和第jj个实例之间的距离。现在希望把数据降维到d′d′维空间中去,得到所有样本点在d′d′中的表示Z∈RN×d′Z∈RN×d′,其中zTi,:∈Rd′zi,:T∈Rd′表示第ii个实例,并且任意两个实例在d′d′维空间中的距离等于原始空间中的距离。事实上,可以推导出满足此条件ZZ的解析解。

由保持距离原则可知

 
d2ij=||zi−zj||2=||zi||2+||zj||2−2zTizj.(1)(1)dij2=||zi−zj||2=||zi||2+||zj||2−2ziTzj.

不失一般性,我们假设低维空间中的实例点是中心化的,即

 
∑i=1Nzi=0,∑i=1Nzi=0,

那么对公式(1)的左右两边求和,有

 
∑i=1Nd2ij=∑i=1N||zi||2+N||zj||2,(2)(2)∑i=1Ndij2=∑i=1N||zi||2+N||zj||2,
 
∑j=1Nd2ij=N||zi||2+∑j=1N||zj||2,(3)(3)∑j=1Ndij2=N||zi||2+∑j=1N||zj||2,
 
∑i=1N∑j=1Nd2ij=2N∑i=1N||zi||2,(4)(4)∑i=1N∑j=1Ndij2=2N∑i=1N||zi||2,

由(2)(3)(4)可知:

 
1N∑i=1Nd2ij=1N∑i=1N||zi||2+||zj||2,(5)(5)1N∑i=1Ndij2=1N∑i=1N||zi||2+||zj||2,
 
1N∑j=1Nd2ij=||zi||2+1N∑j=1N||zj||2,(6)(6)1N∑j=1Ndij2=||zi||2+1N∑j=1N||zj||2,
 
1N2∑i=1N∑j=1Nd2ij=21N∑i=1N||zi||2,(7)(7)1N2∑i=1N∑j=1Ndij2=21N∑i=1N||zi||2,

定义内积矩阵B=ZZT∈RN×NB=ZZT∈RN×N,即bij=zTizjbij=ziTzj。则

 
bij=−12(1N2∑i=1N∑j=1Nd2ij−1N∑i=1Nd2ij−1N∑j=1Nd2ij+d2ij).(8)(8)bij=−12(1N2∑i=1N∑j=1Ndij2−1N∑i=1Ndij2−1N∑j=1Ndij2+dij2).

对矩阵BB做特征分解,得到

 
B=VΛVT,(9)(9)B=VΛVT,

其中,ΛΛ是由B的特征值生成的对角矩阵,VV是特征向量作为列的矩阵。

我们希望降到d′d′维空间中,那么选择前d′d′个最大特征值及对应的特征向量,得到Λd′Λd′和Vd′Vd′,则降维后的特征表示为

 
Z=Vd′Λ12d′.(10)(10)Z=Vd′Λd′12.

参考

[1] Multidimensional Scaling: Definition, Overview, Examples
[2] 数据降维之多维缩放MDS(Multiple Dimensional Scaling)

---------------------

本文来自 CodeTutor 的CSDN 博客 ,全文地址请点击:https://blog.csdn.net/victoriaw/article/details/78500894?utm_source=copy

MDS的更多相关文章

  1. 为 MDS 修改 SharePoint 2013组件

    了解如何修改 SharePoint 项目中的组件以在 SharePoint 2013 中利用最少下载策略(MDS).   本文内容 为何修改 SharePoint 组件? 母版页 ASP.NET 页面 ...

  2. sharepoint2013的最少下载策略概述(MDS)

    该策略是 SharePoint 2013 中的一种新功能,通过在用户导航到新页面时仅发送差异内容来减少页面加载时间. 最少下载策略 (MDS) 是 SharePoint 2013 中的一种新技术,可减 ...

  3. OAF_MDS系列2_OAF页面的通过MDS多语言开发国际化(案例)

    2014-06-06 Created By BaoXinjian

  4. OAF_MDS系列1_OAF页面元数据结构MDS的解析(概念)

    2014-06-06 Created By BaoXinjian

  5. Machine Learning for hackers读书笔记(九)MDS:可视化地研究参议员相似性

    library('foreign') library('ggplot2') data.dir <- file.path('G:\\dataguru\\ML_for_Hackers\\ML_for ...

  6. 3.21 采购订单导入MDS

    3.21.1   业务方案描述 同一企业集团内部的不同法人之间,双方间内部往来业务频繁.受集团财务各自独立核算的要求,买方和卖方间采用买卖方式进行业务运作和财务结算. 对于买方,按照内部商定的协议价格 ...

  7. 1.9 需求订单导入MDS

    1.9          需求订单导入MDS 1.9.1   业务方案描述 将”需求订单维护表”中完成调整维护的需求订单导入系统标准MDS中,使之驱动对应的物料需求计划(MRP)的运行. 1.9.2  ...

  8. Ceph更多Mon 更多mds

    1.当前状态 watermark/2/text/aHR0cDovL2Jsb2cuY3Nkbi5uZXQvdWpfbW9zcXVpdG8=/font/5a6L5L2T/fontsize/400/fill ...

  9. MS MDS系列之初始MS Master Data Service(微软主数据服务)

    背景介绍: 主数据服务(Master Data Services)是微软平台支持的主数据管理(MDM)平台.类似MDS这样的系统,如果后续维护得当,会给企业提供一个强大的中心数据库系统,来防止企业数据 ...

  10. MS MDS系列之MDS层次结构(Hierarchy)

    在Master Data Services中,Hierarchy的作用主要用于: 对同属性成员进行分组 聚合成员用于分析和报告输出 写在开始:显示层次结构(Explicit Hierarchy)即将在 ...

随机推荐

  1. 【Java】留下没有基础眼泪的面试题

    前言 只有光头才能变强 本文力求简单讲清每个知识点,希望大家看完能有所收获 一.如何减少线程上下文切换 使用多线程时,不是多线程能提升程序的执行速度,使用多线程是为了更好地利用CPU资源! 程序在执行 ...

  2. Flask的session使用

    由于http是无状态保存的协议,session可以看作不同请求之间保存数据的一种机制.flask的session是基于cookie的会话保持. 流程 当客户端进行第一次请求的时候,客户端的HTTP r ...

  3. vue element-ui 文件上传

    <el-upload class="upload-demo" action="" :before-remove="beforeRemove&qu ...

  4. WebGL或OpenGL关于模型视图投影变换的设置技巧

    目录 1. 具体实例 2. 解决方案 1) Cube.html 2) Cube.js 3) 运行结果 3. 详细讲解 1) 模型变换 2) 视图变换 3) 投影变换 4) 模型视图投影矩阵 4. 存在 ...

  5. 都 9012了,该选择 Angular、React,还是Vue?

    转载请注明出处:葡萄城官网,葡萄城为开发者提供专业的开发工具.解决方案和服务,赋能开发者. 尽管 Web开发的典型应用场景除了将服务器用作平台.浏览器用作客户端之外,几乎很少活跃于其他业务领域,但不可 ...

  6. 好代码是管出来的——C#的代码规范

    代码是软件开发过程的产物,代码的作用是通过编译器编译后运行,达到预期的效果(功能.稳定性.安全性等等),而另外一个重要作用是给人阅读.对于机器来说只要代码正确就能够正确的运行程序,但是人不同,如果代码 ...

  7. python-对requests请求简单的封装

    # coding:utf-8 import requests class send_request: def __init__(self,url,method,data=None): self.res ...

  8. Linux通过NFS实现文件共享

    在项目生产环境我们经常需要实现文件共享,传统的常见方案是通过NFS,实现服务器之间共享某一块磁盘,通过网络传输将分散的文件集中存储在一块指定的共享磁盘,实现基本的文件共享.实现这种方案,分服务端和客户 ...

  9. LeetCode算法题-1-bit and 2-bit Characters(Java实现)

    这是悦乐书的第302次更新,第321篇原创 01 看题和准备 今天介绍的是LeetCode算法题中Easy级别的第170题(顺位题号是717).有两个特殊字符,第一个字符可以用一个比特0表示,第二个字 ...

  10. Navicat Premium 12.1.16.0安装与激活

    声明:本文所提供的所有软件均来自于互联网,仅供个人研究和学习使用,请勿用于商业用途,下载后请于24小时内删除,请支持正版! 本文介绍Navicat Premium 12的安装.激活与基本使用.已于20 ...