[Scikit-learn] 2.5 Dimensionality reduction - Probabilistic PCA & Factor Analysis

2.5.4. Factor Analysis

PPCA的基本性质以及人肉推导：

以上假设z是标准正态分布的情况。以下是对z的分布的扩展，为general normal distribution。

From: http://cs.brown.edu/courses/cs195-5/spring2012/lectures/2012-04-24_factorEM.pdf

PPCA可以选择input data，保持不变性；FA不能这么搞。

但它俩都可以选择latent variables。

From: https://www.cs.ubc.ca/~schmidtm/Courses/540-W16/L12.pdf

此处可见对x的分布的估计。

主成分分析和因子分析十大不同

一般情况下主成分用于探索性分析，很少单独使用，用主成分来分析数据，可以让我们对数据有一个大致的了解。

几个常用组合：

主成分分析+判别分析，适用于变量多而记录数不多的情况；
主成分分析+多元回归分析，主成分分析可以帮助判断是否存在共线性，并用于处理共线性问题；
主成分分析+聚类分析，不过这种组合因子分析可以更好的发挥优势。

因子分析：

首先，因子分析+多元回归分析，可以利用因子分析解决共线性问题；
其次，可以利用因子分析，寻找变量之间的潜在结构；
再次，因子分析+聚类分析，可以通过因子分析寻找聚类变量，从而简化聚类变量；
此外，因子分析还可以用于内在结构证实

Model selection with Probabilistic PCA and Factor Analysis (FA)

http://scikit-learn.org/stable/auto_examples/decomposition/plot_pca_vs_fa_model_selection.html

[Scikit-learn] 2.5 Dimensionality reduction - Probabilistic PCA & Factor Analysis的更多相关文章

机器学习课程-第8周-降维(Dimensionality Reduction)—主成分分析(PCA)
1. 动机一:数据压缩第二种类型的无监督学习问题,称为降维.有几个不同的的原因使你可能想要做降维.一是数据压缩,数据压缩不仅允许我们压缩数据,因而使用较少的计算机内存或磁盘空间,但它也让我们加快 ...
[UFLDL] Dimensionality Reduction
博客内容取材于:http://www.cnblogs.com/tornadomeet/archive/2012/06/24/2560261.html Deep learning:三十五(用NN实现数据 ...
[Scikit-learn] 4.4 Dimensionality reduction - PCA
2.5. Decomposing signals in components (matrix factorization problems) 2.5.1. Principal component an ...
Scikit Learn: 在python中机器学习
转自:http://my.oschina.net/u/175377/blog/84420#OSC_h2_23 Scikit Learn: 在python中机器学习 Warning 警告:有些没能理解的 ...
Stanford机器学习笔记-10. 降维(Dimensionality Reduction)
10. Dimensionality Reduction Content 10. Dimensionality Reduction 10.1 Motivation 10.1.1 Motivation ...
可视化MNIST之降维探索Visualizing MNIST: An Exploration of Dimensionality Reduction
At some fundamental level, no one understands machine learning. It isn’t a matter of things being to ...
海量数据挖掘MMDS week4: 推荐系统之数据降维Dimensionality Reduction
http://blog.csdn.net/pipisorry/article/details/49231919 海量数据挖掘Mining Massive Datasets(MMDs) -Jure Le ...
第八章——降维（Dimensionality Reduction）
机器学习问题可能包含成百上千的特征.特征数量过多,不仅使得训练很耗时,而且难以找到解决方案.这一问题被称为维数灾难(curse of dimensionality).为简化问题,加速训练,就需要降维了 ...
壁虎书8 Dimensionality Reduction
many Machine Learning problems involve thousands or even millions of features for each training inst ...

随机推荐

MySQL数据库的基本认识与操作
Mysql是一个数据库,但是我们安装的mysql数据库服务,服务就会有状态,启动,停止,重启.我们使用mysql必须保证mysql启动. 使用mysql数据库需要连接数据库 Mysql -u -p - ...
【2017-07-03】CSS实现父级div透明，子集不透明。
父级背景色 background: rgba(0, 0, 0, 0.5);
JAVA连接Derby数据库
其实,JAVA连接Derby数据库也很简单,和一般的数据库操作一样:1.加载驱动2.获取连接3.进行数据库操作4.记得关闭连接示例如下: import java.sql.ResultSet; imp ...
nginx配置跨域之后前后端调用，二次请求
公司项目从前后端不分离转到前后端分离首先遇到的问题就是前后端分离的时候跨域的问题但是当跨域成功配置并且能访问成功的时候发现每次客户端的请求都会发送两次第一次是OPTIONS的请求,然后才是正常 ...
[唐胡璐]Android自动化- 测试环境搭建中遇到的问题
这里主要讲一下在配置过程中遇到一个小问题，其他的步骤会略过。安装JDK，并设置环境变量下载Android ADT, 解压后，文件夹显示如下： Download the ADT bundle for ...
python2.7 psycopg2
psycopg2 安装 sql='''INSERT INTO "CNYB"."PRE_DQ_PLANT"("ID", "ORG_I ...
[codeforces][dp]
链接:https://ac.nowcoder.com/acm/problem/21314来源:牛客网题目描述牛牛正在打一场CF 比赛时间为T分钟,有N道题,可以在比赛时间内的任意时间提交代码第i ...
Luogu P4270 [USACO18FEB]Cow Gymnasts (打表找规律)
题意传送门题解首先我们不竖着看奶牛而是横着看.从下往上把奶牛叫做处于第0,1,2...0,1,2...0,1,2...层.那么相当于第000层的不动,第111层的平移一格,第222层的平移222 ...
1、概述&应用场景
1.概述&应用场景 Java反射机制是在运行状态中,对于任意一个类(Class)文件,都能够知道这个类的所有属性和方法: 对于任意一个对象,都能够调用它的任意一个方法和属性: 这种动态获取的信 ...
C语言学习系列（一）开门首篇
一.特辑此次是我自己的学习之路,和大家一起分享(我现在是做Java),途中遇到什么问题大家也可以提出来一起讨论一起进步: 主要参考教程是菜鸟教程上面的C语言教程,以及大学课本C语言教程-第四版(谭浩 ...

[Scikit-learn] 2.5 Dimensionality reduction - Probabilistic PCA & Factor Analysis

主成分分析和因子分析十大不同

Model selection with Probabilistic PCA and Factor Analysis (FA)

[Scikit-learn] 2.5 Dimensionality reduction - Probabilistic PCA & Factor Analysis的更多相关文章

随机推荐

热门专题