Expectation maximization - EM算法学习总结

原创博客，转载请注明出处 Leavingseason http://www.cnblogs.com/sylvanas2012/p/5053798.html

EM框架是一种求解最大似然概率估计的方法。往往用在存在隐藏变量的问题上。我这里特意用"框架"来称呼它，是因为EM算法不像一些常见的机器学习算法例如logistic regression， decision tree，只要把数据的输入输出格式固定了，直接调用工具包就可以使用。可以概括为一个两步骤的框架：

E-step：估计隐藏变量的概率分布期望函数（往往称之为Q函数，它的定义在下面会详细给出）；

M-step：求出使得Q函数最大的一组参数

实际使用过程中，我们先要根据不同的问题先推导出Q函数，再套用E-M两步骤的框架。

下面来具体介绍为什么要引入EM算法？

不妨把问题的全部变量集（complete data）标记为X，可观测的变量集为Y，隐藏变量集为Z，其中X = (Y , Z) . 例如下图的HMM例子, S是隐变量，Y是观测值：

又例如，在GMM模型中（下文有实例），Y是所有观测到的点，z_i 表示 y_i 来自哪一个高斯分量，这是未知的。

问题要求解的是一组参数，使得最大。在求最大似然时，往往求的是对数最大：（1）

对上式中的隐变量做积分（求和）：

（2）式往往很难直接求解。于是产生了EM方法，此时我们想要最大化全变量（complete data）X的对数似然概率：假设我们已经有了一个模型参数的估计（第0时刻可以随机取一份初始值），基于这组模型参数我们可以求出一个此时刻X的概率分布函数。有了X的概率分布函数就可以写出的期望函数，然后解出使得期望函数最大的值，作为更新的参数。基于这个更新的再重复计算X的概率分布，以此迭代。流程如下：

Step 1：随机选取初始值

Step 2：给定和观测变量Y，计算条件概率分布

Step 3：在step4中我们想要最大化，但是我们并不完全知道X（因为有一些隐变量），所以我们只好最大化的期望值，而X的概率分布也在step 2 中计算出来了。所以现在要做的就是求期望，也称为Q函数：

其中，表示给定观测值y时所有可能的x取值范围，即

Step 4 求解

Step 5 回到step 2，重复迭代下去。

为什么要通过引入Q函数来更新theta的值呢？因为它和我们的最大化终极目标（公式（1））有很微妙的关系：

定理1：

证明：在step4中，既然求解的是arg max，那么必然有。于是：

其中，（3）到（4）是因为X=(Y , Z), y=T(x), T是某种确定函数，所以当x确定了，y也就确定了（但反之不成立）；即：而（4）中的log里面项因为不包含被积分变量x，所以可以直接提到积分外面。

所以E-M算法的每一次迭代，都不会使目标值变得更差。但是EM的结果并不能保证是全局最优的，有可能收敛到局部最优解。所以实际使用中还需要多取几种初始值试验。

实例：高斯混合模型GMM

假设从一个包含k个分量的高斯混合模型中随机独立采样了n个点，现在要估计所有高斯分量的参数。例如图（a）就是一个k=3的一维GMM。

高斯分布函数为：

令为第m次迭代时，第i个点来自第j个高斯分量的概率，那么：

并且

因为每个点是独立的，不难证明有：

于是首先写出每个：

忽略常数项，求和，完成E-step：

为简化表达，再令，

Q函数变为：

现在到了M-step了，我们要解出使得Q函数最大化的参数。最简单地做法是求导数为0的值。

首先求w。因为w有一个约束：

可以使用拉格朗日乘子方法。除去和w无关的项，写出新的目标函数：

求导：

很容易解出w：

同理解出其他参数：

总结：个人觉得，EM算法里面最难懂的是Q函数。初次看教程的时候，很能迷惑人，要弄清楚是变量，是需要求解的；是已知量，是从上一轮迭代推导出的值。

Expectation maximization - EM算法学习总结的更多相关文章

EM（Expectation Maximization）算法
EM(Expectation Maximization)算法参考资料: [1]. 从最大似然到EM算法浅解 [2]. 简单的EM算法例子 [3]. EM算法)The EM Algorithm(详尽 ...
EM算法学习资料备忘
将学习EM算法过程中看到的好的资料汇总在这里,供以后查询.也供大家參考. 1. 这是我学习EM算法最先看的优秀的入门文章,讲的比較通俗易懂,并且举了样例来说明当中的原理.不错! http://blog ...
EM算法学习笔记
转载请注明出处: http://www.cnblogs.com/gufeiyang 首先考虑这么一个问题.操场东边有100个男生,他们的身高符合高斯分布.操场西边有100个女生,她们的身高也符合高斯分 ...
EM算法(Expectation Maximization)
1 极大似然估计假设有如图1的X所示的抽取的n个学生某门课程的成绩,又知学生的成绩符合高斯分布f(x|μ,σ2),求学生的成绩最符合哪种高斯分布,即μ和σ2最优值是什么? 图1 学生成绩的分 ...
机器学习五 EM 算法
目录引言经典示例 EM算法 GMM 推导参考文献: 引言 Expectation maximization (EM) 算法是一种非常神奇而强大的算法. EM算法于 1977年由Dempster ...
Expectation Maximization and GMM
Jensen不等式 Jensen不等式给出了积分的凸函数值必定大于凸函数(convex)的积分值的定理.在凸函数曲线上的任意两点间连接一条线段,那么线段会位于曲线之上,这就是将Jensen不等式应用到 ...
EM算法详解
EM算法详解 1 极大似然估计假设有如图1的X所示的抽取的n个学生某门课程的成绩,又知学生的成绩符合高斯分布f(x|μ,σ2),求学生的成绩最符合哪种高斯分布,即μ和σ2最优值是什么? 图1 学生成 ...
EM算法(Expectation Maximization Algorithm)
EM算法(Expectation Maximization Algorithm) 1. 前言这是本人写的第一篇博客(2013年4月5日发在cnblogs上,现在迁移过来),是学习李航老师的< ...
最大期望算法 Expectation Maximization概念
在统计计算中,最大期望(EM,Expectation–Maximization)算法是在概率(probabilistic)模型中寻找参数最大似然估计的算法,其中概率模型依赖于无法观测的隐藏变量(Lat ...

随机推荐

使用Apache Tomcat Maven插件部署运行 Web 项目
什么是Apache Tomcat Maven Plugin? Maven Plugin 是Apache Tomcat 提供的一个Maven插件,它可以在你没有tomcat容器时将任何一个war项目文件 ...
OOD原则汇总
头五项原则是关于类设计的,它们是: ◆ SRP,单一职责原则,一个类应该有且只有一个改变的理由. ◆ OCP,开放封闭原则,你应该能够不用修改原有类就能扩展一个类的行为. ◆ LSP,Liskov替换 ...
js中字符串与Unicode 字符值序列的相互转换
一. 字符串转Unicode 字符值序列 var str = "abcdef"; var codeArr = []; for(var i=0;i<str.length;i++ ...
连接Oracle远程数据库错误：ORA-12541，ORA-12514，ORA-01017的解决方法！
1.出现如下错误:ORA-12541:TNS:no listener,如下图所示: 错误原因是我们没有开启Listener监听器服务,解决方法是在服务中开启这个服务,如下图所示. 2.出现如下错误:O ...
nginx添加模块 (非覆盖安装)
nginx添加模块(非覆盖安装) 原已经安装好的nginx,现在需要添加一个未被编译安装的模块: 查看原来编译时都带了哪些参数# /usr/local/nginx/sbin/nginx -V ngin ...
Java异常处理和设计【转】
Java异常处理和设计在程序设计中,进行异常处理是非常关键和重要的一部分.一个程序的异常处理框架的好坏直接影响到整个项目的代码质量以及后期维护成本和难度.试想一下,如果一个项目从头到尾没有考虑过异常 ...
jquery parent和parents,children和find
parent返回匹配元素的父元素的元素集合:parents返回匹配元素的祖先元素的元素集合. children返回匹配元素的子元素的元素集合:find返回匹配元素的后代元素的元素集合.
[转]比NPOI更討喜的Excel元件-EPPlus
本文转自:http://blog.darkthread.net/post-2012-05-12-epplus.aspx 前陣子發表 [潛盾機]將檔案結構匯成Excel文件,從網友佑翔的留言(特此感謝) ...
uva 1152 4 values whose sum is zero ——yhx
The SUM problem can be formulated as follows: given four lists A;B;C;D of integer values, computehow ...
uva 10562 undraw the trees（烂题） ——yhx
aaarticlea/png;base64,iVBORw0KGgoAAAANSUhEUgAABB4AAAM9CAYAAAA7ObAlAAAgAElEQVR4nOyd25GsupKGywVswAV8wA ...

Expectation maximization - EM算法学习总结

Expectation maximization - EM算法学习总结的更多相关文章

随机推荐

热门专题