Factor_Analysis

Factor_Analysis（因子分析）
Factor Analysis 简书：较好理解的解释，其中公式有一定的推导（仅展现关键步骤，细节大多需要自行补充），基本为结论式。

感性层面理解：首先，明确FA和PCA的区别。PCA做的是对某个样本，试图寻找到一组方差尽量大的线性表示（基向量），以便降维；FA做的是，假想存在一些隐变量，它们影响着我们的观测结果（即我们得到的数据样本），我们试图找到两者的联系：$x = \Lambda z + \mu + \epsilon$，在简书中有说明其MLE函数形式，不难看出它的MLE形式难以求解，故采用EM（机器学习之最大期望(EM)算法，讲得不错）迭代以求最优解。此外，FA通常用于$m<<n$的庆幸

心路历程：首先，我去推了一下EM，发现自己之前学的时候，由于是在GMM求解的时候需要的，所以并没有很仔细地推导，所以就再去推导了一次~~推了我一页草稿纸~~。其次，没有找到：$\mu_{x_1|x_2} = \mu_1 + \Sigma_{12} \Sigma_{22}^{-1} (x_2 - \mu_2)$ 以及 $\Sigma_{1|2} = \Sigma_{11} - \Sigma_{12} \Sigma_{22}^{-1} \Sigma_{21}$ 的公式名称，如果看官知晓其名称，望告知不才，感激不尽。最后，还是忘记了矩阵求导，又去查了一下，而我也尚未进行公式回带和化简整合。~~自闭了，一大堆~~

疑问：简书作者在开头提到：由于存在隐变量，同时不能由MLE得到close form。（close form：即闭式解，通俗解释就是$\nabla f(x) = 0$的$x$表达式），这里不理解为何没有闭式解，目前推的结果（MLE式子），大概猜测是因为$m<<n$的缘故，这样带来的结果就是$\left| \Sigma \right| = 0$（其实本身$\left| \Sigma \right|$是不等于0的，但是由于$m<<n$，所以它等于0，其实就是由于样本数量不足，或者说难以得到如此高维并且充足的样本）。显然，$\left| \Sigma \right| = 0$会在后续中遇到诸多麻烦，最容易想的就是$\Sigma$是不可逆的，这显然很难进行接下来的计算，虽然我算的不多，但是$\Sigma^{-1}$几乎都是需要的。然而，可以引入伪逆，所以肯定还有我没有想到的原因，或者说伪逆会带来较差的表现等等。

备注：由于博客园写推导公式较为麻烦，所以没有在博客上进行推导，不过建议看官如果并未学习过上述知识，还是手推几次以便加强理解和记忆（当然也有一些少年仅仅看就能得到很好理解，并且运用巧妙）。比如在EM算法中，求解lower_bound之前，分子分母同乘一个量以便之后用Jensen不等式化简（orz）等等（~~好像其他的操作就比较平凡了~~）。最近闲来无事的时候，发现很多学习过的算法，特别是需要一定数学式子或者思维来求解的（~~我竟然想去求LCM解烤鸡？？~~），似乎都忘了需要求解的表达式（嘴上讲讲天花乱坠，手里推推苦思冥想），虽然求解过程都不难，但是对于我来说，其中一些技巧还是需要理解的~~有些计算量也是大啊~~。

Factor_Analysis的更多相关文章

zoj Simple Equation 数论
题目链接:http://acm.zju.edu.cn/onlinejudge/showProblem.do?problemId=5176 AX+BY = XY => (X-B)*(Y-A)= ...
Python机器学习笔记使用scikit-learn工具进行PCA降维
之前总结过关于PCA的知识:深入学习主成分分析(PCA)算法原理.这里打算再写一篇笔记,总结一下如何使用scikit-learn工具来进行PCA降维. 在数据处理中,经常会遇到特征维度比样本数量多得多 ...
OtterTune源码解析
为了方便后面对ottertune进行魔(hu)改(gao),需要先搞清楚它的源码结构和pipeline OtterTune分为两大部分: server side: 包括一个MySQL数据库(用于存储调 ...

随机推荐

BPM业务流程管理系统_K2受邀出席QAD客户日活动，赋能企业云端智造_工作流引擎
10月17日,K2受邀参加由厦门易维主办的以“走进QAD云ERP,深耕智能制造”为主题的QAD客户日活动.本次大会是以工业4.0背景下传统制造业面临巨大压力和挑战为导向,旨在探讨如何助力企业迅速适应业 ...
Vue列表动画----自己做的
<!DOCTYPE html> <html lang="en"> <head> <meta charset="UTF-8&quo ...
【robotframework】robotframework环境搭建
一.基于python3.6环境在dos命令输入 pip install robotframework 在线安装robotframework在dos命令输入 pip install Pypubsub= ...
c# 接口使用
tensorflow与numpy的版本兼容性问题
在Python交互式窗口导入tensorflow出现了下面的错误: root@ubuntu:~# python3 Python 3.6.8 (default, Oct 7 2019, 12:59:55 ...
Codeforces Round #582 (Div. 3)-G. Path Queries-并查集
Codeforces Round #582 (Div. 3)-G. Path Queries-并查集 [Problem Description] 给你一棵树,求有多少条简单路径$(u,v)$,满足 ...
第七届蓝桥杯C/C++程序设计本科B组决赛 ——凑平方数(填空题)
凑平方数把0~9这10个数字,分成多个组,每个组恰好是一个平方数,这是能够办到的.比如:0, 36, 5948721 再比如:10985247361, 25, 63907840, 4, 289, 1 ...
0020SpringBoot使用SpringCloud中的eureka实现远程调用
要实现远程调用,主要需要三个module:一个注册中心.一个服务提供者.一个服务消费者,然后进行各自的配置和编码,详细内容如下: 1.建一个空的project,创建3各module a.注册中心模块 ...
0、Python学习路线
阶段一.Python语言(熟练掌握Python多线程并发编程技术,可以编写爬虫程序和语音识别软件.) 1.1 基础语法 1.1.1 python概述 1.1.2 数据的存储 1.1.3 ...
vue 数组更新检测注意事项

Factor_Analysis

Factor_Analysis的更多相关文章

随机推荐

热门专题