极大似然估计是利用已知的样本结果,去反推最有可能(最大概率)导致这样结果的参数值,也就是在给定的观测变量下去估计参数值.然而现实中可能存在这样的问题,除了观测变量之外,还存在着未知的隐变量,因为变量未知,因此无法直接通过最大似然估计直接求参数值.EM算法是一种迭代算法,用于含有隐变量的概率模型的极大似然估计,或者说是极大后验概率估计. 1.经典的三硬币模型 引入一个例子来说明隐变量存在的问题.假设有3枚硬币,分别记作A,B,C.这些硬币正面出现的概率分别是π,p,q.我们的实验过程如下,先投掷硬