概率分布

4种实验结果	$E_1$	$E_2$	$E_3$	$E_4$
记录它们发生的次数	$y_1$	$y_2$	$y_3$	$y_4$
记录次数结果	125	18	20	34
4种结果发生的概率	$\frac{1}{2}-\frac{\theta}{4}$	$\frac{1}{4}-\frac{\theta}{4}$	$\frac{1}{4}+\frac{\theta}{4}$	$\frac{\theta}{4}$

求$\theta$的估计值？

法 1：采用最大似然估计

\[L(\theta) = \frac{(y_1+y_2+y_3+y_4)!}{y_1! y_2! y_3!y_4!}(\frac{1}{2}-\frac{\theta}{4})^{y_1}(\frac{1}{4}-\frac{\theta}{4})^{y_2}(\frac{1}{4}+\frac{\theta}{4})^{y_3}(\frac{\theta}{4})^{y_4} = C\times (\frac{1}{2}-\frac{\theta}{4})^{y_1}(\frac{1}{4}-\frac{\theta}{4})^{y_2}(\frac{1}{4}+\frac{\theta}{4})^{y_3}(\frac{\theta}{4})^{y_4} \]

\[\ln L(\theta) = \ln [C\times (\frac{1}{2}-\frac{\theta}{4})^{y_1}(\frac{1}{4}-\frac{\theta}{4})^{y_2}(\frac{1}{4}+\frac{\theta}{4})^{y_3}(\frac{\theta}{4})^{y_4}]\]

\[\ln L(\theta) = \ln C+y_1\ln (\frac{1}{2}-\frac{\theta}{4}) + y_2\ln (\frac{1}{4}-\frac{\theta}{4})+y_3\ln (\frac{1}{4}+\frac{\theta}{4})+y_4 \ln (\frac{\theta}{4})\]

\[\frac{\partial \ln L(\theta) }{\partial\theta}=-\frac{y_1}{2-\theta}-\frac{y_2}{1-\theta}+\frac{y_3}{1+\theta}+\frac{y_4}{\theta}=0\]

\[-\frac{125}{2-\theta}-\frac{18}{1-\theta}+\frac{20}{1+\theta}+\frac{34}{\theta}=0\]

上面估计$\theta$的方程是一个关于$\theta$的一元三次方程，问题是不容易求解。

问题转化求解：EM算法

引入隐藏变量$Z$，从新对概率分布进行分配。

4种实验结果	$E_1$	$E_2$	$E_3$	$E_4$
记录它们发生的次数	$y_1$	$y_2$	$y_3$	$y_4$
记录次数结果	125	18	20	34
4种结果发生的概率	$\frac{1}{2}-\frac{\theta}{4}$	$\frac{1}{4}-\frac{\theta}{4}$	$\frac{1}{4}+\frac{\theta}{4}$	$\frac{\theta}{4}$
隐藏变量	$z_1$	$z_2$	$z_3$	$z_4$	$z_5$	$z_6$
发生的概率	$\frac{1}{4}-\frac{\theta}{4}$	$\frac{1}{4}$	$\frac{1}{4}-\frac{\theta}{4}$	$\frac{\theta}{4}$	$\frac{1}{4}$	$\frac{\theta}{4}$

存在的关系为：$y_1=z_1+z_2\; ;y_2=z_3\;;y_3=z_4+z_5\;;y_4=z_6$

从新计算似然函数
\[L(\theta) = \frac{(z_1+z_2+z_3+z_4+z_5+z_6)!}{z_1! z_2! z_3!z_4!z_5!z_6!}(\frac{1}{4}-\frac{\theta}{4})^{z_1} (\frac{1}{4})^{z_2}(\frac{1}{4}-\frac{\theta}{4})^{z_3}(\frac{\theta}{4})^{z_4} (\frac{1}{4})^{z_5}(\frac{\theta}{4})^{z_6}\]
\[\ln L(\theta) = \ln C + z_1\ln (\frac{1}{4}-\frac{\theta}{4})+z_2\ln (\frac{1}{4})+z_3\ln(\frac{1}{4}-\frac{\theta}{4})+z_4\ln(\frac{\theta}{4})+z_5\ln(\frac{1}{4})+z_6\ln(\frac{\theta}{4})\]

\[\frac{\partial \ln L(\theta) }{\partial\theta}=-\frac{z_1+z_3}{1-\theta}+\frac{z_4+z_6}{\theta}=0\]

求解上式，我们发现由原来的一元三次方程变为了非常容易求解的方程，求解难度减少。
\[\theta^* = \frac{z_4+z_6}{z_4+z_6+z_1+z_3}=\frac{z_4+y_4}{z_4+y_4+z_1+y_2}=\frac{z_4+34}{z_4+34+z_1+18}\]

求解难度降低了，但是我们发现$z_1\;;z_4$不知道，我们该如何解决呢？

根据 $y_1=z_1+z_2\; ;y_2=z_3\;;y_3=z_4+z_5\;;y_4=z_6$；可以得知
\[z_1\sim B(y_1, \frac{\frac{1}{4}-\frac{\theta}{4}}{\frac{1}{2}-\frac{\theta}{4}}=\frac{1-\theta}{2-\theta})\]
\[z_4 \sim B(y_3, \frac{\frac{\theta}{4}}{\frac{1}{4}+\frac{\theta}{4}}=\frac{\theta}{1+\theta})\]

第一步：（E步骤）目的是消去潜在变量 $z_1\;;z_4$
\[E(z_1)= y_1\times \frac{1-\theta}{2-\theta}=125\times \frac{1-\theta}{2-\theta}\]
\[E(z_4)= y_3\times \frac{\theta}{1+\theta}=20\times \frac{\theta}{1+\theta}\]
令 $z_1 = E(z_1)\;; z_4=E(z_4)$
第二部：（M步骤）目的是最大化估计值$\theta^*$
\[\theta^* =\frac{z_4+34}{z_4+34+z_1+18}=\frac{20\times \frac{\theta}{1+\theta}+34}{20\times \frac{\theta}{1+\theta}+34+125\times \frac{1-\theta}{2-\theta}+18}\]
采用迭代法求解$\theta^*$
\[\theta^{i+1} =\frac{20\times \frac{\theta^i}{1+\theta^i}+34}{20\times \frac{\theta^i}{1+\theta^i}+34+125\times \frac{1-\theta^i}{2-\theta^i}+18}\]

任取 $\theta \in (0,1)$ ，开始迭代。
eg: $\theta^0=0.5$ 开始，计算出$\theta^1\;;\theta^2\;;\theta^3\;;\cdots$ 直到收敛

EM算法：入门案例的更多相关文章

机器学习：EM算法
EM算法各类估计最大似然估计 Maximum Likelihood Estimation,最大似然估计,即利用已知的样本结果,反推最有可能(最大概率)导致这样结果的参数值的计算过程. 直白来讲,就 ...
你所不知道的 CSS 阴影技巧与细节滚动视差？CSS 不在话下神奇的选择器 :focus-within 当角色转换为面试官之后 NPOI 教程 - 3.2 打印相关设置前端XSS相关整理委托入门案例
你所不知道的 CSS 阴影技巧与细节关于 CSS 阴影,之前已经有写过一篇,box-shadow 与 filter:drop-shadow 详解及奇技淫巧,介绍了一些关于 box-shadow ...
EM算法(Expectation Maximization)
1 极大似然估计假设有如图1的X所示的抽取的n个学生某门课程的成绩,又知学生的成绩符合高斯分布f(x|μ,σ2),求学生的成绩最符合哪种高斯分布,即μ和σ2最优值是什么? 图1 学生成绩的分 ...
贝叶斯公式由浅入深大讲解—AI基础算法入门
1 贝叶斯方法长久以来,人们对一件事情发生或不发生的概率,只有固定的0和1,即要么发生,要么不发生,从来不会去考虑某件事情发生的概率有多大,不发生的概率又是多大.而且概率虽然未知,但最起码是一个确定 ...
EM算法学习资料备忘
将学习EM算法过程中看到的好的资料汇总在这里,供以后查询.也供大家參考. 1. 这是我学习EM算法最先看的优秀的入门文章,讲的比較通俗易懂,并且举了样例来说明当中的原理.不错! http://blog ...
贝叶斯公式由浅入深大讲解—AI基础算法入门【转】
本文转载自:https://www.cnblogs.com/zhoulujun/p/8893393.html 1 贝叶斯方法长久以来,人们对一件事情发生或不发生的概率,只有固定的0和1,即要么发生, ...
JWT的入门案例
1.什么是JWT? JWT全称JSON Web Token.是为了在网络应用环境键传递声明而执行的一种基于JSON的开放标准. 2.JWT的使用场景? 授权:一旦用户登录,每个后续请求将包括JWT,允 ...
EM算法-完整推导
前篇已经对EM过程,举了扔硬币和高斯分布等案例来直观认识了, 目标是参数估计, 分为 E-step 和 M-step, 不断循环, 直到收敛则求出了近似的估计参数, 不多说了, 本篇不说栗子, 直接来 ...
Shiro简介、入门案例、web容器的集成
目的: shiro简介 Shiro入门案例 Shiro与web容器的集成 shiro简介(中文官网:https://www.w3cschool.cn/shiro/andc1if0.html) 1.什么 ...

随机推荐

说一下 HashSet 的实现原理？（未完成）
说一下 HashSet 的实现原理?(未完成)
WebRTC基于GCC的拥塞控制算法[转载]
实时流媒体应用的最大特点是实时性,而延迟是实时性的最大敌人.从媒体收发端来讲,媒体数据的处理速度是造成延迟的重要原因:而从传输角度来讲,网络拥塞则是造成延迟的最主要原因.网络拥塞可能造成数据包丢失,也 ...
string::assign
string (1) string& assign (const string& str); substring (2) string& assign (const strin ...
记一次基于 mpvue 的小程序开发及上线实战
小程序名称:一起打车吧项目地址: 客户端:https://github.com/jrainlau/taxi-together-client 服务端:https://github.com/jrainl ...
Django的 select_related 和 prefetch_related 函数对 QuerySet 查询的优化
引言在数据库存在外键的其情况下,使用select_related()和prefetch_related()很大程度上减少对数据库的请求次数以提高性能 1.实例准备模型: from django.d ...
BZOJ 3924 / Luogu P3345 [ZJOI2015]幻想乡战略游戏 (动态点分治/点分树)
题意树的结构不变,每个点有点权,每一条边有边权,有修改点权的操作,设xxx为树中一点.求∑idist(x,i)∗a[i]\sum_idist(x,i)*a[i]i∑dist(x,i)∗a[i]的最 ...
Springboot项目关闭Httpclient的Debug日志
今天在做httpclient测试时,发现控制台打印了好多请求相关的信息,如何去掉这些不打印? (2)在配置文件包下加入logback.xml文件,文件内容如下: <?xml version=&q ...
HDU 6048 - Puzzle | 2017 Multi-University Training Contest 2
/* HDU 6048 - Puzzle [ 思维,结论 ] | 2017 Multi-University Training Contest 2 题意: 类似华容道的问题, N*M 的矩阵中N*M- ...
编译vim8
1.获取最新的vim源码 $ wget https://codeload.github.com/vim/vim/tar.gz/v8.1.2256 2.解压缩 $ tar -xvzf vim-8.1.2 ...
python基于opencv实现人脸定位
import cv2 # 读取图片 img = cv2.imread("image.jpg") # 加载模型,模型可以从https://github.com/opencv/open ...

4种实验结果	\(E_1\)	\(E_2\)	\(E_3\)	\(E_4\)
记录它们发生的次数	\(y_1\)	\(y_2\)	\(y_3\)	\(y_4\)
记录次数结果	125	18	20	34
4种结果发生的概率	\(\frac{1}{2}-\frac{\theta}{4}\)	\(\frac{1}{4}-\frac{\theta}{4}\)	\(\frac{1}{4}+\frac{\theta}{4}\)	\(\frac{\theta}{4}\)

4种实验结果	\(E_1\)	\(E_2\)	\(E_3\)	\(E_4\)
记录它们发生的次数	\(y_1\)	\(y_2\)	\(y_3\)	\(y_4\)
记录次数结果	125	18	20	34
4种结果发生的概率	\(\frac{1}{2}-\frac{\theta}{4}\)	\(\frac{1}{4}-\frac{\theta}{4}\)	\(\frac{1}{4}+\frac{\theta}{4}\)	\(\frac{\theta}{4}\)
隐藏变量	\(z_1\)	\(z_2\)	\(z_3\)	\(z_4\)	\(z_5\)	\(z_6\)
发生的概率	\(\frac{1}{4}-\frac{\theta}{4}\)	\(\frac{1}{4}\)	\(\frac{1}{4}-\frac{\theta}{4}\)	\(\frac{\theta}{4}\)	\(\frac{1}{4}\)	\(\frac{\theta}{4}\)

EM算法：入门案例

概率分布

法 1：采用最大似然估计

问题转化求解：EM算法

EM算法：入门案例的更多相关文章

随机推荐

热门专题