多维标度法（MDS）的Python实现

多维标度法(multidimensional scaling，MDS)是一种在低维空间展示“距离”数据结构的多元数据分析技术,是一种将多维空间的研究对象( 样本或变量 ) 简化到低维空间进行定位、分析和归类，同时又保留对象间原始关系的数据分析方法。

多维标度法与主成分分析(Principle Component Analysis，PCA)、线性判别分析(Linear Discriminent Analysis，LDA)类似，都可以用来降维.(注：在PCA中，我们降维所用的方法依次寻找正交的并且variance最大的方向，因为variance能够最大程度的保存原特征空间中的信息。在LDA中，因为数据有label，通过一个线性变换，把每个类的中心点 M_k映射到一个新的空间，使得在这个新的空间上，一方面各个中心点之间的距离（这里可称之为类间距离）尽量保持足够大，另一方面每个类里面的点到其中心点的距离（这里可称之为类内距离）尽量小。更多细节略)

多维标度法的目标：当n 个对象中各对对象之间的相似性（或距离）给定时，确定这些对象在低维(欧式) 空间中的表示（称为感知图, Perceptual Mapping），并使其尽可能与原先的相似性（或距离）“大体匹配”，使得由降维所引起的任何变形达到最小。

低维(欧式) 空间中排列的每一个点代表一个对象，因此点间的距离与对象间的相似性高度相关。也就是说，两个相似的对象由低维(欧式) 空间中两个距离相近的点表示，而两个不相似的对象则由低维(欧式) 空间两个距离较远的点表示。低维空间通常为二维或三维的欧氏空间，但也可以是非欧氏三维以上空间.

Classical MDS:

• 原始空间下的距离阵和低维空间下的距离阵都采用欧式距离阵
• 距离阵D 为欧式的, 即存在某个正整数p 以及R^p 空间的n个点x₁, . . . , x_n, 使得

目标在于: 寻找D 的(拟合) 构图x₁, . . . , x_n, 其想法为
– 将平方的欧式距离阵D = (d²_ij) 变换为一个非负定矩阵B
– 由B 的特征根和特征向量得到构图X, X 的每一行表示低维空间的点.
• 为此, 记原始的p 维对象(观测点) 为x₁, . . . , x_n(一般是未知的), 两两之间的距离平方为

B = −1/2*HDH,H = In − 1/n 11′

其中, r 的确定: 事先确定r = 1, 2 或3; 或者通过计算前面特征根占全体特征根的比例确定.

import numpy as np

D=np.array([[0,411,213,219,296,397],

            [411,0,204,203,120,152],

            [213,204,0,73,136,245],

            [219,203,73,0,90,191],

            [296,120,136,90,0,109],

            [ 397,152,245,191,109,0]])

N = D.shape[0]

T = np.zeros((N,N))

#solution 1

#ss = 1.0/N**2*np.sum(D**2)

#for i in range(N):

#    for j in range(i,N):

#        T[i,j] = T[j,i] = -0.5*(D[i,j]**2 -1.0/N*np.dot(D[i,:],D[i,:]) -1.0/N*np.dot(D[:,j],D[:,j])+ss)

#solution 2

#K = np.dot(D,np.transpose(D))

D2 = D**2

H = np.eye(N) - 1/N

T = -0.5*np.dot(np.dot(H,D2),H)

eigVal,eigVec = np.linalg.eig(T)

X = np.dot(eigVec[:,:2],np.diag(np.sqrt(eigVal[:2]))) 

print('original distance','\tnew distance')

for i in range(N):

    for j in range(i+1,N):

        print(np.str(D[i,j]),'\t\t',np.str("%.4f"%np.linalg.norm(X[i]-X[j])))

运行结果：

参考文档：典型相关分析和多维标度法-张伟平的讲义

多维标度法（MDS）的Python实现的更多相关文章

吴裕雄 python 机器学习——多维缩放降维MDS模型
# -*- coding: utf-8 -*- import numpy as np import matplotlib.pyplot as plt from sklearn import datas ...
运维DBA要不要学python
运维DBA要不要学python 我个人认为是:要现在python在运维数据库的工作中主要用在 1.编写一些运维脚本 2.编写运维管理平台 3.研究互联网大厂的运维脚本/工具并应有特别是运维开源数据 ...
c/c++ 图相关的函数(二维数组法）
c/c++ 图相关的函数(二维数组法) 遍历图插入顶点添加顶点间的线删除顶点删除顶点间的线摧毁图取得与v顶点有连线的第一个顶点取得与v1顶点,v1顶点之后的v2顶点的之后的有连线的第一个 ...
c/c++ 图的创建(二维数组法）
c/c++ 图的创建(二维数组法) 图的概念图由点和线组成知道了图中有多少个点,和哪些点之间有线,就可以把一张图描绘出来点之间的线,分有方向和无方向创建图创建图,实际就是创建出节点,和节点之 ...
多维尺度变换MDS(Multidimensional Scaling)
流形学习(Manifold Learning)是机器学习中一大类算法的统称,流形学习是非线性的降维方法(an approach to non-linear dimensionality reducti ...
（数据科学学习手札15）DBSCAN密度聚类法原理简介&Python与R的实现
DBSCAN算法是一种很典型的密度聚类法,它与K-means等只能对凸样本集进行聚类的算法不同,它也可以处理非凸集. 关于DBSCAN算法的原理,笔者觉得下面这篇写的甚是清楚练达,推荐大家阅读: ht ...
算法：时间复杂度+二分查找法(Java/Go/Python)实现
导读曾几何时学好数据结构与算法是我们从事计算机相关工作的基本前提,然而现在很多程序员从事的工作都是在用高级程序设计语言(如Java)开发业务代码,久而久之,对于数据结构和算法就变得有些陌生了,由于长 ...
Python自动化运维开发实战三、python文件类型
导语: python常用的有3种文件类型 1. 源代码 py 2. 字节代码 pyc 3. 优化代码 pyo 源代码: python源代码的文件以”py"为扩展名,由python程序解释,不 ...
Python自动化运维开发实战二、Python基本用法
导语: Python编程博大精深,知识点众多,需要先整体上了解python的一些基本用法之后再去对每一个知识点细细研究,这样学习的速度会快很多.所以下面就先看一些python事先需要知道的基本知识. ...

随机推荐

c#中关于变量声明那么点事
class MyVar { /* * 基于安全的考虑,c#变量的初始化有一定的要求 * 1.所有的局部变量在被显示的初始化之前,都会被编译器当作未初始化,然后抛出编译期出错; * 2.所有的字段级变量 ...
百度地图（icon，zIndex）
百度地图v2.0参考http://lbsyun.baidu.com/cms/jsapi/reference/jsapi_reference.html#a3b2 覆盖物(Marker) Icon: va ...
VS2010编译错误：是否忘记了向源中添加“#include "stdafx.h
VS2010编译错误:是否忘记了向源中添加“#include "stdafx.h 编译提示:fatal error C1010: 在查找预编译头时遇到意外的文件结尾.是否忘记了向源中添加“# ...
shell 脚本计算 1加到100 的和
#!/bin/bash # i=0 n=1 //定义循环变量 while [ $n -lt 101 ];do //定义循环条件 n < 101 i=$(( $i + $n )) //累加 n=$ ...
发展科技到底有什么用，转NASA专家给一位修女的一封信
问题补充:我们难道不应该把这些资金用于更深入的医疗保障和减少贫穷吗? 我们为何要仰望星空,花大量的金钱和精力探索那不可预知的宇宙呢?NASA科学家写给非洲修女的一封信回答得特别好,也特别震撼人心.—— ...
delphi TStringList 用法详解
转自: http://blog.163.com/you888@188/blog/static/67239619201472365642633/ delphi TStringList 用法详解 2014 ...
全自动baidu云盘下载脚本
20141231<吃元宵>孔云龙_6平米.MP3 20141231<家庭论>李云杰_6平米.MP3 20141231<劫皇杠>李昊洋_6平米.MP3 2014123 ...
Create Index语句的Include作用
在 SQL Server 2005 中,可以通过将非键列添加到非聚集索引的叶级别来扩展非聚集索引的功能.通过包含非键列,可以创建覆盖更多查询的非聚集索引.这是因为非键列具有下列优点: 它们可以是不允许 ...
.net推送微信消息模板
1.获取access_token public string GetAccess_Token() { string appid = WxPayConfig.APPID; string appsecre ...
JWT+ASP.NET MVC 时间戳防止重放攻击
时间戳作用客户端在向服务端接口进行请求,如果请求信息进行了加密处理,被第三方截取到请求包,可以使用该请求包进行重复请求操作.如果服务端不进行防重放攻击,就会服务器压力增大,而使用时间戳的方式可以解 ...

多维标度法（MDS）的Python实现

多维标度法（MDS）的Python实现的更多相关文章

随机推荐

热门专题