统计知识选讲(二)——主成分分析(PCA)的推导和应用
1、数学推导
根据上讲的思想,我们可以用下图来进行数学上的推导.

2、PCA的步骤
1)对原始数据进行标准化处理:对该指标变量进行标准化,
2)计算相关系数矩阵(协方差矩阵)
3)计算相关系数矩阵的特征值和特征向量,得到新的指标标量。
4)计算特征值的信息贡献率和累积贡献率,按一定规则选择主成分
5)以主成分的贡献率为权重,构建主成分综合评价模型,计算综合评价值和排名
3、应用实例——我国各地区普通高等教育发展综合评价
案例背景不再详述,在此我们选取10个指标来评价30个省市他们的普通高等教育发展。
数据:

1)将上述数据标准化,计算协方差矩阵
2)计算协方差矩阵的特征值和特征值贡献率

3)根据特征值贡献率选取前四个特征根对应的特征向量
由此可得四个主成分分别为:

4)分别以四个主成分的贡献率为权重,计算主成分综合得分:


计算的matlab程序:
gj=[
5.96 44.36 2.2 ;
3.39 35.02 0.9 ;
2.35 38.4 0.86 ;
1.35 30.45 1.22 ;
1.5 34.3 0.54 ;
1.67 33.53 0.76 ;
1.17 35.22 0.58 ;
1.05 32.89 0.66 ;
0.95 31.54 0.39 ;
0.69 34.5 0.37 ;
0.56 32.62 0.55 ;
0.57 32.95 0.28 ;
0.71 28.13 0.73 ;
0.74 33.06 0.47 ;
0.86 29.94 0.25 ;
1.29 25.93 0.37 ;
1.04 29.01 0.29 ;
0.85 25.63 0.43 ;
0.81 29.82 0.31 ;
0.59 32.83 0.33 ;
0.66 28.55 0.48 ;
0.77 28.81 0.34 ;
0.7 27.34 0.28 ;
0.84 27.65 0.32 ;
1.69 12.1 ;
0.55 28.41 0.3 ;
0.6 31.93 0.24 ;
1.39 22.7 0.42 ;
0.64 28.12 0.34 ;
1.48 17.87 0.38 ;
];%原始数据
gj=zscore(gj); %数据标准化
r=corrcoef(gj); %计算相关系数矩阵
[e,lamda]=eig(r); %求相关系数矩阵的特征值和特征向量
lamda=sort(sum(lamda),'descend');%将特征值降序排列
attribute=lamda./sum(lamda); %各特征值的贡献率
cum_attribute=cumsum(attribute); %累计的贡献率
num=; %选取的主成分的个数
df=gj*e(:,:-:-num) %新指标下的样本值
score=attribute(:num)*df'; %计算综合得分
[stf,ind]=sort(score,'descend'); %把得分按照从高到低的次序排列
stf=stf', ind=ind'
统计知识选讲(二)——主成分分析(PCA)的推导和应用的更多相关文章
- 线性判别分析(LDA), 主成分分析(PCA)及其推导【转】
前言: 如果学习分类算法,最好从线性的入手,线性分类器最简单的就是LDA,它可以看做是简化版的SVM,如果想理解SVM这种分类器,那理解LDA就是很有必要的了. 谈到LDA,就不得不谈谈PCA,PCA ...
- 统计知识选讲(一)——主成分分析(PCA)的思想
主成分分析的主要目的是希望用较少的变量去解释原来资料中的大部分变异,将我们手中许多相关性很高的变量转化成彼此相互独立或不相关的变量,从而达到降维的目的.在原始数据“预处理”阶段通常要先对它们采用PCA ...
- 主成分分析(PCA)原理及推导
原文:http://blog.csdn.net/zhongkejingwang/article/details/42264479 什么是PCA? 在数据挖掘或者图像处理等领域经常会用到主成分分析,这样 ...
- 机器学习 —— 基础整理(四)特征提取之线性方法:主成分分析PCA、独立成分分析ICA、线性判别分析LDA
本文简单整理了以下内容: (一)维数灾难 (二)特征提取--线性方法 1. 主成分分析PCA 2. 独立成分分析ICA 3. 线性判别分析LDA (一)维数灾难(Curse of dimensiona ...
- 主成分分析PCA详解
转载请声明出处:http://blog.csdn.net/zhongkelee/article/details/44064401 一.PCA简介 1. 相关背景 上完陈恩红老师的<机器学习与知识 ...
- 05-03 主成分分析(PCA)
目录 主成分分析(PCA) 一.维数灾难和降维 二.主成分分析学习目标 三.主成分分析详解 3.1 主成分分析两个条件 3.2 基于最近重构性推导PCA 3.2.1 主成分分析目标函数 3.2.2 主 ...
- 机器学习之主成分分析PCA原理笔记
1. 相关背景 在许多领域的研究与应用中,通常需要对含有多个变量的数据进行观测,收集大量数据后进行分析寻找规律.多变量大数据集无疑会为研究和应用提供丰富的信息,但是也在一定程度上增加了数据采集的 ...
- 主成分分析(PCA)原理详解_转载
一.PCA简介 1. 相关背景 在许多领域的研究与应用中,往往需要对反映事物的多个变量进行大量的观测,收集大量数据以便进行分析寻找规律.多变量大样本无疑会为研究和应用提供了丰富的信息,但也在一定程度上 ...
- 用scikit-learn学习主成分分析(PCA)
在主成分分析(PCA)原理总结中,我们对主成分分析(以下简称PCA)的原理做了总结,下面我们就总结下如何使用scikit-learn工具来进行PCA降维. 1. scikit-learn PCA类介绍 ...
随机推荐
- springMVC 获取本地项目路径 及后整理上传文件的方法
String path=request.getSession().getServletContext().getRealPath("upload/img/product"); // ...
- 移植MonkeyRunner的图片对比和获取子图功能的实现-Appium篇
如果你的目标测试app有很多imageview组成的话,这个时候monkeyrunner的截图比较功能就体现出来了.而其他几个流行的框架如Robotium,UIAutomator以及Appium都提供 ...
- POJ 1284 Primitive Roots 原根
题目来源:POJ 1284 Primitive Roots 题意:求奇素数的原根数 思路:一个数n是奇素数才有原根 原根数是n-1的欧拉函数 #include <cstdio> const ...
- AngularJS学习笔记(一)——一些基本知识
(一)Hello Angular index.html <!DOCTYPE html> <html ng-app> <head> <title>Test ...
- php学习之路:php在iconv功能 详细解释
iconv函数库可以完毕各种字符集间的转换,是php编程中必不可少的基础函数库. 使用方法例如以下: $string = "亲爱的朋友欢迎訪问胡文芳的博客.希望给您带来一点点的帮助!&quo ...
- .Net中批量更新或添加数据
方法一:使用SqlBulkCopy实现批量更新或添加数据. SqlBulkCopy类一般只能用来将数据批量插入打数据库中,如果数据表中设置了主键,出现重复数据的话会报错,如果没有设置主键,那么将会添加 ...
- 一般处理程序装配数据到html页的原理
相应html页面并保存状态输出原理:(有状态请求)请求页面提交给后台,获取值进行处理之后再根据name标记读取原html文件文字将值替换再一并返回给页面:(在response时替换)比如原模板< ...
- 关于WCF的一些知识点
首先,WCF和WebService一些区别1,WCF支持多中通信协议,http/https tcp/udp/msmq.命名管道,对等网,消息可达性,事物流等.2,WCF可以与ASP.NET集成,共享同 ...
- 关于如何惟一地标识一台Android设备的综合性讨论
想必大家在开发Android项目的时候,多多少少会遇到“如何惟一地标识一台Android设备”等类似的问题.不只是以前,即使是现在乃至可以预见的将来,这个问题都将一直存在. 如果大家使用搜索工具搜索的 ...
- Kraken.js!
Hello Kraken.js! 前言 kraken.js 由paypal 公司开源的一个用于快速开发基于Express.js框架应用的快速开发工具, 因为kraken 并没有在Express.js基 ...