Andrew Ng机器学习公开课笔记–Independent Components Analysis

网易公开课，第15课
notes，11

参考，

PCA本质是旋转找到新的基(basis)，即坐标轴，并且新的基的维数大大降低
ICA也是找到新的基，但是目的是完全不一样的，而且ICA是不会降维的

对于ICA，最经典的问题，“鸡尾酒会”问题
在鸡尾酒会，上很多人同时在说话，还有背景音乐，如果我们放若干个话筒进行声音采集
是否可以从采集到的数据中，分离出每个人独立的声音

假设有n个不同的人，m个时间采集点，一般会用和人数一样多的话筒，也是n个

is an n-dimensional vector， is the acoustic reading recorded by microphone j at time i

is an n-dimensional vector， is the sound that speaker j was uttering at time i.

x向量，表示在时间点i，n个采集器收集到的声音数据
s向量，表示在时间点i，n个人真正发出的声音

那么x中每个值，一定是s中所有的值的一个线性变换产生的，话筒可能收集到从所有人发出的声音，根据远近或其他环境不同，不同的线性变换参数

所以可以表示成，

A is an unknown square matrix called the mixing matrix

现在问题比较清晰，我们可以观察到x，需要求出s
那么只要我们可以求出A，就可以求出x

设，
s= Wx

所以我们的目标变成求出W
denote the i-th row of W, so that

the j-th source can be recovered by computing

ICA ambiguities

很明显，如果没有任何先验知识，光凭x= As，是不可能求出唯一的A和s的
比如你求出A，但是2A也是可以的

或者PA，也是可以的，P为permutation matrix，其实就是调换其中行的位置，因为只要相应的调换S中人的位置即可

但是这些对于我们的例子影响不大，比如A和2A只是音量大小不同而已

并且s一定是非高斯分布才可以使用ICA
因为高斯分布的密度函数是rotationally symmetric

比如，x = As，其中s满足高斯分布，那么x也一定满足高斯分布
并且协方差为，

且x满足分布

此时，我们改变A

设R be an arbitrary orthogonal (less formally, a rotation/reflection) matrix，

那么有，

你会发现的分布没有变化，仍然是分布

所以如果s是高斯分布，你根本无法求出唯一的A，因为对于不同的A，你会得到相同的观察值x

ICA algorithm

下面直接来看ICA算法如何求出W

The algorithm we describe is due to Bell and Sejnowski, and the interpretation we give will be of their algorithm as a method for maximum likelihood estimation.

仍然是用最大似然来求解这个问题，

Joint distribution为，假设sources 之间都是独立的

因为前面有，

所以有，

为何多了个W的行列式，参考讲义的证明，不加是错误的

前面说了，如果没有任何先验知识，是不可能求出W的，
所以这边我们需要假设p(s)的分布

这里是通过假设cumulative distrbution function (cdf) F，来求出p的

F的定义，区间上的概念和

所以有，

F(x)要满足两个性质是：单调递增和在[0,1]，所以sigmoid函数很适合

于是有，

那么现在目标函数，log likelihood为，

然后用随机梯度下降，得到W，完成求解

其中后面的梯度就是对log likelihood求导得到的

对W行列式求导，，参考矩阵的线性代数

参考，独立成分分析（Independent Component Analysis）

Andrew Ng机器学习公开课笔记–Independent Components Analysis的更多相关文章

Andrew Ng机器学习公开课笔记–Principal Components Analysis (PCA)
网易公开课,第14, 15课 notes,10 之前谈到的factor analysis,用EM算法找到潜在的因子变量,以达到降维的目的这里介绍的是另外一种降维的方法,Principal Compo ...
Andrew Ng机器学习公开课笔记 -- 支持向量机
网易公开课,第6,7,8课 notes,http://cs229.stanford.edu/notes/cs229-notes3.pdf SVM-支持向量机算法概述, 这篇讲的挺好,可以参考先继 ...
Andrew Ng机器学习公开课笔记 -- 学习理论
网易公开课,第9,10课 notes,http://cs229.stanford.edu/notes/cs229-notes4.pdf 这章要讨论的问题是,如何去评价和选择学习算法 Bias/va ...
Andrew Ng机器学习公开课笔记 -- Regularization and Model Selection
网易公开课,第10,11课 notes,http://cs229.stanford.edu/notes/cs229-notes5.pdf Model Selection 首先需要解决的问题是,模型 ...
Andrew Ng机器学习公开课笔记–Reinforcement Learning and Control
网易公开课,第16课 notes,12 前面的supervised learning,对于一个指定的x可以明确告诉你,正确的y是什么但某些sequential decision making问题,比 ...
Andrew Ng机器学习公开课笔记 – Factor Analysis
网易公开课,第13,14课 notes,9 本质上因子分析是一种降维算法参考,http://www.douban.com/note/225942377/,浅谈主成分分析和因子分析把大量的原始变量, ...
Andrew Ng机器学习公开课笔记 -- Mixtures of Gaussians and the EM algorithm
网易公开课,第12,13课 notes,7a, 7b,8 从这章开始,介绍无监督的算法对于无监督,当然首先想到k means, 最典型也最简单,有需要直接看7a的讲义 Mixtures of G ...
Andrew Ng机器学习公开课笔记 -- Online Learning
网易公开课,第11课 notes,http://cs229.stanford.edu/notes/cs229-notes6.pdf 和之前看到的batch learning算法不一样,batch ...
Andrew Ng机器学习公开课笔记 -- 线性回归和梯度下降
网易公开课,监督学习应用.梯度下降 notes,http://cs229.stanford.edu/notes/cs229-notes1.pdf 线性回归(Linear Regression) 先看个 ...

随机推荐

Wordpress模板制作、改造、设计
如何定义index.php以及如何派生出其它文件,在index.php文件中,在body元素内,新建如下结构化标记元素,各元素都带有不同的id属性: <div id=”page”> < ...
Codeforces Round #352 (Div. 2) D. Robin Hood 二分
D. Robin Hood We all know the impressive story of Robin Hood. Robin Hood uses his archery skills a ...
电赛菜鸟营培训（二）——STM32F103CB之中断控制
一.中断的概念中断可以理解为一个有激励给它就会立马给你响应的一个东东.就是说在你执行main函数的内容时,当有这个触发时便会跳转到这个中断内存,执行这段代码. Attention: 1.中断的用法, ...
Html的一点点收获
结束了牛腩,总结了自己的收获,我开始了征战HTML的计划,在看<提高班培养计划>的时候,我很诧异,因为<HTML孙鑫>这个项目竟然就只有一天的时间,怎么可以这样,但是,我还是决 ...
VMware 虚拟机网络组网问题
1.VMware虚拟机组网概述整个结构: 需要确定的内容: 1) 虚拟机连接到哪个VMnet(交换机)? 2) VMnet(交换机)的组网模式? 首先,讲一下VMware的界面内容安装好VMwar ...
js上传和预览图片
[1].[代码] [HTML]代码跳至 [1] <!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" ...
DFS POJ 2362 Square
题目传送门 /* DFS:问能否用小棍子组成一个正方形剪枝有3:长的不灵活,先考虑:若根本构不成正方形,直接no:若第一根比边长长,no 这题是POJ_1011的精简版:) */ #include ...
TODO：C# Socket
http://www.cnblogs.com/licongjie/archive/2006/10/26/540640.html http://blog.csdn.net/ZOU_SEAFARER/ar ...
重构实践——为了try-catch大兴排场
可能是我们共同的强迫症,不要说看到,就算想到太多的try-catch也很难接受. 于是,开始了一些尝试,这些尝试都算是思维的锻炼.场面的见识.经验的积累. Version1 —— 原始版本一开始,在 ...
游戏 slider
using UnityEngine; using System.Collections; public class La : MonoBehaviour { float verticalValue=0 ...

Andrew Ng机器学习公开课笔记–Independent Components Analysis

Andrew Ng机器学习公开课笔记–Independent Components Analysis的更多相关文章

随机推荐

热门专题