统计知识选讲(二)——主成分分析(PCA)的推导和应用
1、数学推导
根据上讲的思想,我们可以用下图来进行数学上的推导.
2、PCA的步骤
1)对原始数据进行标准化处理:对该指标变量进行标准化,
2)计算相关系数矩阵(协方差矩阵)
3)计算相关系数矩阵的特征值和特征向量,得到新的指标标量。
4)计算特征值的信息贡献率和累积贡献率,按一定规则选择主成分
5)以主成分的贡献率为权重,构建主成分综合评价模型,计算综合评价值和排名
3、应用实例——我国各地区普通高等教育发展综合评价
案例背景不再详述,在此我们选取10个指标来评价30个省市他们的普通高等教育发展。
数据:
1)将上述数据标准化,计算协方差矩阵
2)计算协方差矩阵的特征值和特征值贡献率
3)根据特征值贡献率选取前四个特征根对应的特征向量
由此可得四个主成分分别为:
4)分别以四个主成分的贡献率为权重,计算主成分综合得分:
计算的matlab程序:
gj=[
5.96 44.36 2.2 ;
3.39 35.02 0.9 ;
2.35 38.4 0.86 ;
1.35 30.45 1.22 ;
1.5 34.3 0.54 ;
1.67 33.53 0.76 ;
1.17 35.22 0.58 ;
1.05 32.89 0.66 ;
0.95 31.54 0.39 ;
0.69 34.5 0.37 ;
0.56 32.62 0.55 ;
0.57 32.95 0.28 ;
0.71 28.13 0.73 ;
0.74 33.06 0.47 ;
0.86 29.94 0.25 ;
1.29 25.93 0.37 ;
1.04 29.01 0.29 ;
0.85 25.63 0.43 ;
0.81 29.82 0.31 ;
0.59 32.83 0.33 ;
0.66 28.55 0.48 ;
0.77 28.81 0.34 ;
0.7 27.34 0.28 ;
0.84 27.65 0.32 ;
1.69 12.1 ;
0.55 28.41 0.3 ;
0.6 31.93 0.24 ;
1.39 22.7 0.42 ;
0.64 28.12 0.34 ;
1.48 17.87 0.38 ;
];%原始数据
gj=zscore(gj); %数据标准化
r=corrcoef(gj); %计算相关系数矩阵
[e,lamda]=eig(r); %求相关系数矩阵的特征值和特征向量
lamda=sort(sum(lamda),'descend');%将特征值降序排列
attribute=lamda./sum(lamda); %各特征值的贡献率
cum_attribute=cumsum(attribute); %累计的贡献率
num=; %选取的主成分的个数
df=gj*e(:,:-:-num) %新指标下的样本值
score=attribute(:num)*df'; %计算综合得分
[stf,ind]=sort(score,'descend'); %把得分按照从高到低的次序排列
stf=stf', ind=ind'
统计知识选讲(二)——主成分分析(PCA)的推导和应用的更多相关文章
- 线性判别分析(LDA), 主成分分析(PCA)及其推导【转】
前言: 如果学习分类算法,最好从线性的入手,线性分类器最简单的就是LDA,它可以看做是简化版的SVM,如果想理解SVM这种分类器,那理解LDA就是很有必要的了. 谈到LDA,就不得不谈谈PCA,PCA ...
- 统计知识选讲(一)——主成分分析(PCA)的思想
主成分分析的主要目的是希望用较少的变量去解释原来资料中的大部分变异,将我们手中许多相关性很高的变量转化成彼此相互独立或不相关的变量,从而达到降维的目的.在原始数据“预处理”阶段通常要先对它们采用PCA ...
- 主成分分析(PCA)原理及推导
原文:http://blog.csdn.net/zhongkejingwang/article/details/42264479 什么是PCA? 在数据挖掘或者图像处理等领域经常会用到主成分分析,这样 ...
- 机器学习 —— 基础整理(四)特征提取之线性方法:主成分分析PCA、独立成分分析ICA、线性判别分析LDA
本文简单整理了以下内容: (一)维数灾难 (二)特征提取--线性方法 1. 主成分分析PCA 2. 独立成分分析ICA 3. 线性判别分析LDA (一)维数灾难(Curse of dimensiona ...
- 主成分分析PCA详解
转载请声明出处:http://blog.csdn.net/zhongkelee/article/details/44064401 一.PCA简介 1. 相关背景 上完陈恩红老师的<机器学习与知识 ...
- 05-03 主成分分析(PCA)
目录 主成分分析(PCA) 一.维数灾难和降维 二.主成分分析学习目标 三.主成分分析详解 3.1 主成分分析两个条件 3.2 基于最近重构性推导PCA 3.2.1 主成分分析目标函数 3.2.2 主 ...
- 机器学习之主成分分析PCA原理笔记
1. 相关背景 在许多领域的研究与应用中,通常需要对含有多个变量的数据进行观测,收集大量数据后进行分析寻找规律.多变量大数据集无疑会为研究和应用提供丰富的信息,但是也在一定程度上增加了数据采集的 ...
- 主成分分析(PCA)原理详解_转载
一.PCA简介 1. 相关背景 在许多领域的研究与应用中,往往需要对反映事物的多个变量进行大量的观测,收集大量数据以便进行分析寻找规律.多变量大样本无疑会为研究和应用提供了丰富的信息,但也在一定程度上 ...
- 用scikit-learn学习主成分分析(PCA)
在主成分分析(PCA)原理总结中,我们对主成分分析(以下简称PCA)的原理做了总结,下面我们就总结下如何使用scikit-learn工具来进行PCA降维. 1. scikit-learn PCA类介绍 ...
随机推荐
- C语言练手自己编写学生成绩管理系统
#include<stdio.h> #include<stdlib.h> /*定义学生结构体*/ struct Student { ]; ]; float Mark1; flo ...
- asp.net 获得客户端 mac 地址
using System; using System.Collections.Generic; using System.Linq; using System.Web; using System.We ...
- The Swift Programming Language-官方教程精译Swift(3)基本运算符
运算符是检查, 改变, 合并值的特殊符号或短语. 例如, 加号 + 把计算两个数的和(如 let i = 1 + 2). 复杂些的运行算包括逻辑与&&(如 if enteredDoor ...
- [强烈推荐]ORACLE PL/SQL编程详解之七:程序包的创建与应用(聪明在于学习,天才在于积累!)
原文:[强烈推荐]ORACLE PL/SQL编程详解之七:程序包的创建与应用(聪明在于学习,天才在于积累!) [强烈推荐]ORACLE PL/SQL编程详解之七: 程序包的创建与应用(聪明在于学习,天 ...
- 使用sqlldr向Oracle导入大的文本(txt)文件
我们有多种方法可以向Oracle数据库里导入文本文件,但如果导入的文本文件过大,例如5G,10G的文本文件,有些方法就不尽如意了,例如PLSQL Developer中的导入文本功能,如果文本文件过大, ...
- 我的Android 4 学习系列之文件、保存状态和首选项
目录 使用Shared Preference 保留简单的应用程序数据 保存回话间的Activity实例数据 管理应用程序首选项和创建Preference Screen 保存并加载文件以及管理本地文件系 ...
- ASP.NET MVC IOC 之AutoFac
ASP.NET MVC IOC 之AutoFac攻略 一.为什么使用AutoFac? 之前介绍了Unity和Ninject两个IOC容器,但是发现园子里用AutoFac的貌似更为普遍,于是捯饬了两天, ...
- .NET MVC4 实训记录之六(利用ModelMetadata实现资源的自主访问)
上一篇我们已经实现自定义资源文件的访问,该篇我们使用它配合ModelMetadata实现资源文件的自主访问.这样做是为了我们能更简单的用MVC原生的方式使用资源文件.由于我的文章旨在记录MVC项目的实 ...
- 使用response实现文件下载功能
response.setContentType("text/html;charset=utf-8"); response.setCharacterEncoding("u ...
- ant svn
<!-- 检出代码 这里使用 export 不是checkout 二者区别 checkout会svn相关信息文件检出,export只是检出最新的文件--> <target name= ...