PCA原理解释

上图讲述的两组数据，可以看到左图的数据离散度比较大，相关性比较弱，右图数据的相关性比较强；我们在使用PCA的时候，就是要将相关性强的数据进行降维，以减少处理的数据量。

那么怎么描述数据的相关性呢？使用期望，协方差以及相关系数：下面分别是左图和右图的数字特征：

其实其关键性做得是R，R说明了点间的相关性，但是想要知道R你必须要知道Sigma(X)，想要知道Sigma(X)你有必须要知道期望，所以获取点间的关系，必须要求得期望和协方差。

协方差的价值有量个：

1.协方差大于零说明两套数据变化趋势是一致的；

2. 协方差=0，说明数据没有相关性

注意，这里说的是协方差，对于方差而言，方差值大小代表数据离散程度。

协方差矩阵的作用：

1. 对角线上面的是数据的方差；

2. 无关数据的形式除了对角线上的数据，其他都是0.

那么我们现在目标是找到一个新的坐标系，将xy坐标系中相关数据进行映射，保证了在新的坐标体系下面，数据是不相关的，即：他们的协方差矩阵除了对角线之外全为0。

假设存在这个平面，之前的数据为x，新的映射平面y，有

y = Gx，G为常量矩阵，实现了x数据的伸缩和旋转，这里应该主要是旋转；

于是，这个新的坐标系下面的y可以推导为：

sigma(y) = E{[y - E(y)][y - E(y)].T}

sigma(y) = E{[Gx - E(Gx)][Gx - E(Gx].T}

sigma(y) = GE{[x - E(x)][x - E(x)].T}G.T

sigma(y) = Gsigma(x)G.T

因为目标是sigma(y)中，除了对角线，其他点都是0，为了满足这一点，首先G应该是sigma(x)的特征矢量的转置，而且是一个正交矩阵，这样就满足了最终的结果是：

对角线的值就是各个维度的方差值。同时按照从大到小的排列，这里采用的是K-L变换（霍特林变换）。所谓的主成分，就是排在前面的几个λ对应的特征，取决于你打算要几个主成分。

然后，用x去乘以所选取的特征向量组（所选的几个λ对应的特征向量），这个操作本质完成的数据的旋转，将数据旋转到一个维度减少"平面"，这个平面能够包含主成分的数据（非主成分的数据飞出平面也无所谓了，所谓主成分就是大多数的数据）；所谓包含即使指投影，将原来空间的数据项旋转后的平面做投影。

PCA的的协方差部分解释完了，下面就是在上面最后提到了特征矢量（特征向量），什么是特征向量？对于方阵矩阵A：

Ax = λx

λ称之为方阵A的特殊值，x就是方阵A对应λ的特征向量，由定义的公式可以变型为：

(A - λE)x = 0

其中|A - λE|称之为特征多项式。求λ的思路就是首先求行列式|A - λE| = 0来获得特征值；然后再将将特征值带入到(A - λE)x = 0中可以求得基础解系pi，k*pi都是A的特征向量。

紧接着，我们看一下什么是基础解系呢？

基础解系首先是向量组线性相关的概念，在介绍基础解系之前要明白什么是解向量：

上式可以简化写成向量方程：Ax = 0；

那么向量[x1,x2,x3...,xn)就是方程(1)的解向量，是Ax=0的解。

解向量有如下的性质：

1) A(x1 + x2) = Ax1 + Ax2 = 0

2) A(kx1) = kA(x1) = 0

由上可得：x = k1x1 + k2x2 + ... + knxn，这个就叫做方程Ax = 0的通解；

齐次线性方程组的最大无关组，称之为该齐次线性方程组的基础解系，所以求通解，只要把基础解系（即x1,x2,...,xn)求出来，既可以求得通解。

在求解过程上，首先将矩阵A进行最简行变化，选择转化为方程式，然后从中选取n - r个变量作为非自有解，指定具体的值，从而推算出r个自由变量的值，这个r个自由变量的值就是在配上之前的非自由解，就确定了一组基础解析。在求解基础解系的过程中，用到了一个定理：

设m * n矩阵，R(A) = r，则n元齐次线性方程组Ax = 0的解集S的秩Rs = n - r。

说明：设R(A) = n的时候，没有基础解析，只有零向量；R(A) < n的时候，方程式的基础解系中包含有n - r个解。根据最大无关性质，方程组（1）中任意n - r个解都可以组成一个基础解系，所以，方程组的基础解系并不唯一 => 通解形式也不唯一。

一个一个的来捋，首先思考一下为什么R(A) = n只有零向量呢？首先要建立一个概念，就是矩阵方程的理念是用别的变量来表示变量，例如下面的情况：

x1 = -x2 +2 * x3 - x4 - 4 * x5

x2 = x3 - x4

x4 = 3 * x5

x1, x2, x4叫做非自由变量，因为他们是需要其他变量来进行表示；设想一下，如果R(A) = n将会发生什么情况：xn = 0！满秩代表着x[n-1]是由xn表示，那么=>x[n-1]是0以此类推，所有的x都是0，所以，如果R(A) = n，那么只有零解。

第二个，里面提到了"最大无关性质"，什么是最大无关？上面我们提到了非自由变量有自由变量线性来表示；这个其实就是"线性表示"，只有向量组（矩阵）是线性相关的时候才时候，才能够实现线性表示。那么什么是线性表示？除了公式中给出的表示之外，在二维空间里面，线性相关代表共线，在三维空间中，代表共面。

最大无关组：

1）向量组A0：a1, a2, a3, ..., ar线性无关；

2）向量组A中任何r+1个向量都是线性相关的，那么

称A0为最大无关向量组，简称最大无关组。最大无关组所包含向量的数量，称之为秩。

好了，这次就先挖到这里吧。

参考：

中心化（又叫零均值化）和标准化（又叫归一化）

https://blog.csdn.net/GoodShot/article/details/80373372

图像处理中的数学原理详解20——主成分变换（PCA）

https://blog.csdn.net/baimafujinji/article/details/50372906

图像处理中的数学原理详解21——PCA实例与图像编码

https://blog.csdn.net/baimafujinji/article/details/50373143

PCA原理解释的更多相关文章

PCA原理解释（二）
PCA在做数据处理,一般会有一个数据预处理,其中一个目标就是将取数据特征向相关性. 为什么要去特征的相关性? 因为数据如果有相关性,在学习的时候是冗余的,徒增学习成本:所以对于数据处理(也称之为白化, ...
PCA原理与实践
在对数据进行预处理时,我们经常会遇到数据的维数非常之大,如果不进行相应的特征处理,那么算法的资源开销会很大,这在很多场景下是我们不能接受的.而对于数据的若干维度之间往往会存在较大的相关性,如果能将数据 ...
Kernel PCA 原理和演示
Kernel PCA 原理和演示主成份(Principal Component Analysis)分析是降维(Dimension Reduction)的重要手段.每一个主成分都是数据在某一个方向上的 ...
主成分分析(PCA)原理与实现
主成分分析原理与实现主成分分析是一种矩阵的压缩算法,在减少矩阵维数的同时尽可能的保留原矩阵的信息,简单来说就是将 \(n×m\)的矩阵转换成\(n×k\)的矩阵,仅保留矩阵中所存在的主要特性,从 ...
降维算法----PCA原理推导
1.从几何的角度去理解PCA降维以平面坐标系为例,点的坐标是怎么来的? 图1 ...
UDP 打洞原理解释
终于找到了一份满意的UDP打洞原理解释,附上正文,自己整理了一下源码 3.3. UDP hole punching UDP打洞技术 The third technique, and the one o ...
[分享]Host文件的原理解释及应用说明
Host文件的原理解释及应用说明 Host文件位置及打开方式: Window系统中有个Hosts文件(没有后缀名), Windows 98系统下该文件在Windows目录,在Windows 2 ...
用EM4305/T5557模拟EM4100的ID卡,原理解释
用EM4305/T5557模拟EM4100,原理解释来源: https://www.cnblogs.com/osnosn/p/10593297.html 来自osnosn的博客写于: 2019-0 ...
PLSQL连接ORACLE配置字符串简介 oracle网络配置三个配置文件 listener.ora、sqlnet.ora、tnsnames.ora原理解释
PLSQL连接ORACLE配置字符串简介 oracle网络配置三个配置文件 listener.ora.sqlnet.ora.tnsnames.ora原理解释 oracle网络配置三个配置文件 lis ...

随机推荐

JavaWeb:c3p0配置问题-----java.sql.SQLException: Connections could not be acquired from the underlying database!
错误原因 c3p0的配置错误错误显示 -classpath "D:\Program\Software\IntelliJIDEA\IntelliJ IDEA 2018.2.5\lib\ide ...
ueditor 设置高度height. ue.setHeight(400); 设置宽度 width
1.引入的文件: <script type="text/javascript" src="../../dist/ueditor1_4_3-utf8-php/uedi ...
vue简章
什么是vue? 可以独立完成前后端分离式web项目的javaScript框架为什么使用vue? 三大主流框架之一:Angular React Vue 先进的前端设计模式:MVVM 可以完全脱离服务 ...
线程简述（Thread)
线程: 进程是一个正在运行的程序,例如电脑上现在在运行的qq,浏览器,电脑管家,这些都是进程线程就是每一个进程中的一个执行单元,每一个进程至少一个线程,可以有多个线程,例如浏览器上每一个打开的网页都 ...
[工作日志] 2018-12-06 重点: 解决安全测试bug
安全测试bug 业务端提出, 在修改是否给联系人发送短信接口,如果操作人和被操作的联系人不在同一个企业的情况下, 也是可以修改的. 解决办法: 加校验.
实现在当前的日期上加N天
function getNewDay(dateTemp, days) { var dateTemp = dateTemp.split("-"); var nDate = new D ...
运行和管理Rabbit
节点描述的是一个Erlang节点运行着一个Erlang应用程序.Erlang虚拟机的每个实例我们称之为节点.多个Erlang应用程序可以运行在同一个节点之上.节点之间可以进行本地通信.在RabbitM ...
如何利用Power BI 制作动态搜索界面
最近Power BI有了最新更新,想着利用 Power BI 工具制造一个动态的搜索界面,比如动态切换搜索引擎,分别从百度.360.搜狗等搜索苹果最新新闻.通过一番测试,最终实现了相关功能. 数据加载 ...
web(二)html
html编写规范在输入开始标签时同时输入结束标签,以防丢失标签保证缩紧格式(一个tab键) 主动添加注释(快捷键选中后 Ctrl+Shift+/) Html的调试开发者工具(快捷键F12)是前 ...
高级数据结构及应用 —— 使用 bitmap 进行字符串去重
bitmap 即为由单个元素为 boolean(0/1, 0 表示未出现,1 表示已经出现过)的数组. 如果C/C++ 没有原生的 boolean 类型,可以用 int 或 char 来作为 bitm ...

PCA原理解释

PCA原理解释的更多相关文章

随机推荐

热门专题