MATLAB自带工具箱实现PCA降维代码

悦悦的小屋 2024-10-28 19:45:22 原文

PCA基本流程：

1、训练集矩阵算协方差矩阵A;

2、算协方差矩阵特征值与特征向量;

3、按特征值的大小排列特征矩阵，得B，对应的特征值（按从大到小排列）组成向量a;

4、A*B得到去关联的新矩阵C，A与C的对应位置物理意义相同（指样本维度和样本数），但是去掉了关联，并且按特征贡献度大小排列;

5、选贡献度百分比或降维后的维度。例如百分之90，则是取满足sum（a(1:n)）/sum(a)>90%的最小的n；如果直接定降维后的维度，则直接设置个n;

6、任一样本的降维公式相同，对于样本x：x*B(1:n,:)。

原理说明：

步骤3,4本质上是基变换原理。4可以去关联的原理与马氏距离相仿。贡献度的原理与协方差矩阵的数学意义相关。转换矩阵相关的计算必须在训练集上完成是因为协方差矩阵的计算需要一个样本集，如将测试集样本加入这个样本集，则训练集中已经包含了测试集信息（例如某一维特征的均值）。

matlab函数说明：

[coeff,score,latent,tsquare] = pca(feature);%我们这里需要他的pc和latent值做分析

feature是被降维的特征,每一行是一个特征,列数代表总的特征个数,比如一个图片的HOG特征是96维,总共有8000个HOG特征,那么feature的维度是8000×96,我们的目标就是将其降维(假设将96维降到50维,)那么我们期望的降维后feature就变成了我们需要的feature_after_PCA:8000×50

coeff：步骤3算出来的矩阵B，本质上是一个基变换矩阵。数学意义是协方差矩阵按特征值的大小排列的特征矩阵。

score：步骤4算出来的矩阵C，与A同维同物理意义。

latent：步骤3算出来的向量a，存储了贡献度，数学意义是协方差矩阵特征值从大到小排列。　

用途：

根据latent计算满足某贡献度所需的样本维度，或直接定一个样本维度，然后feature*coeff(1:n,:)降维。把训练集中所有样本计算feature*coeff就是score，当然，feature*coeff(1:n,:)这个式子更大的用途是计算测试集中的样本。

重点！！！

pca内建函数在算协方差的时候先减了个样本均值，所以这里feature*coeff不是score,需要先算:

x0 = bsxfun(@minus,feature,mean(feature,1));

然后x0*coeff才是score。

参考原文：matlab_PCA，训练集与测试集分开，原理和用法

MATLAB自带工具箱实现PCA降维代码的更多相关文章

PCA 降维算法详解以及代码示例
转载地址:http://blog.csdn.net/watkinsong/article/details/38536463 1. 前言 PCA : principal component analys ...
MATLAB实例：PCA降维
MATLAB实例:PCA降维作者:凯鲁嘎吉 - 博客园 http://www.cnblogs.com/kailugaji/ 1. iris数据 5.1,3.5,1.4,0.2,1 4.9,3.0,1 ...
[综] PCA降维
http://blog.json.tw/using-matlab-implementing-pca-dimension-reduction 設有m筆資料, 每筆資料皆為n維, 如此可將他們視為一個mx ...
Matlab计算机视觉/图像处理工具箱推荐
Matlab计算机视觉/图像处理工具箱推荐转载http://cvnote.info/matlab-cv-ip-toolbox/ 计算机视觉/图像处理研究中经常要用到Matlab,虽然其自带了图像处理 ...
PCA降维—降维后样本维度大小
之前对PCA的原理挺熟悉,但一直没有真正使用过.最近在做降维,实际用到了PCA方法对样本特征进行降维,但在实践过程中遇到了降维后样本维数大小限制问题. MATLAB自带PCA函数:[coeff, sc ...
matlab 小波工具箱
wavemenu --- >wavelet ---->wavelet packet1-D Matlab小波工具箱的使用1 转载▼ http://blog.sina.com.cn/s/blo ...
PCA降维2
前言本文为模式识别系列第一篇,主要介绍主成分分析算法(Principal Component Analysis,PCA)的理论,并附上相关代码.全文主要分六个部分展开: 1)简单示例.通过简单的例子 ...
相机标定简介与MatLab相机标定工具箱的使用（未涉及原理公式推导）
相机标定一.相机标定的目的确定空间物体表面某点的三维几何位置与其在图像中对应点之间的相互关系,建立摄像机成像的几何模型,这些几何模型参数就是摄像机参数. 二.通用摄像机模型世界坐标系.摄像机坐标 ...
机器学习公开课笔记(8)：k-means聚类和PCA降维
K-Means算法非监督式学习对一组无标签的数据试图发现其内在的结构,主要用途包括: 市场划分(Market Segmentation) 社交网络分析(Social Network Analysis ...

随机推荐

简明 Nginx Location Url 配置笔记
基本配置为了探究nginx的url配置规则,当然需要安装nginx.我使用了vagrant创建了一个虚拟环境的ubuntu,通过apt-get安装nginx.这样就不会污染mac的软件环境.通过vr ...
nginx模块记录
1. ngx_http_ssl_module 让Nginx可以支持HTTPS的模块 (1)ssl on | off; #是否开启ssl功能 (2)ssl_certificate file; #当前虚拟 ...
Winform 导航菜单的方法
http://blog.163.com/kunkun0921@126/blog/static/169204332201171610619611/ 第一种:使用OutlookBar第三方控件第二种:使 ...
【javascript基础】函数前面的一元操作符
在函数前面加:+ ; ~ ! - 等等一元操作符,javascript 引擎都会将后面的statement转换成表达式(expression),这样就可以调用了.
C# POST请求 json格式
/* * url:POST请求地址,例如:url = "http://localhost:35229/ddn/GetPostData"; * postData:json格式的请求报 ...
C++11_新语法
版权声明:本文为博主原创文章,未经博主允许不得转载. 本节主要介绍C++的新特性,对于C++的基础语法不再讲解.由于编译器的不同.在某些地方可能有些差异,但是无太大影响. 讲解本节知识之前先确认你的C ...
L146 Space Station Hole Cause Will Be Determined
The head of the U.S. space agency said Tuesday he's sure that investigators will determine the cause ...
Linux:Aircrack-ng
Aircrack-ng 工具主要有 airmon-ng 处理网卡工作模式 airodump-ng 抓包 aircrack-ng 破解 aireplay-ng 发包,干扰另外还要用到以下 linux ...
概念：GNU构建系统和Autotool
经常使用Linux的开发人员或者运维人员,可能对configure->make->make install相当熟悉.事实上,这叫GNU构建系统,利用脚本和make程序在特定平台上构建软件. ...
gradle-wrapper.properties中各属性的含义
gradle-wrapper.properties中各属性的含义 1. gradle-wrapper.properties 每一个用gradle编译的工程,都会有一个gradle\wrapper目录. ...