机器学习：高斯混合模型及EM算法

Mixtures of Gaussian

这一讲，我们讨论利用EM (Expectation-Maximization)做概率密度的估计。假设我们有一组训练样本x(1),x(2),...x(m),因为是unsupervised的学习问题，所以我们没有任何y的信息。

我们希望利用一个联合分布p(x(i),z(i))=p(x(i)|z(i))p(z(i))来拟合这些数据, 其中z(i)∼Multinomial(ϕ) (ϕj⩾0, ∑kj=1ϕj=1,参数ϕj给出了概率p(z(i)=j))，并且 x(i)|z(i)=j∼N(μj,Σj)，我们让k表示z(i)可能值的个数，因此在这个模型中，每一个训练样本x(i)是由随机取某一个值的变量z(i)生成的，所以x(i)是从k个的高斯分布中的一个(由z(i)指示)提取出来的。这个称为高斯混合模型，我们也要注意到z(i)是隐含的随机变量，高斯混合模型涉及的参数是ϕ,μ,Σ，为了估计这些变量，我们可以建立如下的表达式：

l(ϕ,μ,Σ)=∑i=1mlogp(x(i);ϕ,μ,Σ)=∑i=1mlog∑z(i)=1kp(x(i)|z(i);μ,Σ)p(z(i),ϕ)

我们发现，通过求偏导数求极值的方法，无法得到这些参数的解，从上面的表达式可以看出，随机变量z(i)告诉了我们x(i)是从k个高斯分布中的其中一个生成的，如果我们知道是哪一个高斯分布，或者说如果知道z(i)的值，那我们可以利用最大似然估计的方法估计参数

ϕ,μ,Σ，如果z(i)已知，那么上式可以写成：

l(ϕ,μ,Σ)=∑i=1mlogp(x(i)|z(i);μ,Σ)+logp(z(i),ϕ)

利用最大似然估计，可以求得这些参数为：

ϕjμjΣj=1m∑i=1m1{z(i)=j}=∑mi=11{z(i)=j}x(i)∑mi=11{z(i)=j}=∑mi=11{z(i)=j}(x(i)−μj)(x(i)−μj)T∑mi=11{z(i)=j}

从上面的表达式可以看出，如果z(i)的值已知，那么参数ϕ,μ,Σ的估计与之前介绍的Gaussian discriminant analysis 模型对参数的估计是一样的，这里的z(i)就像Gaussian discriminant analysis 模型中的输出y一样。

但是遗憾的是，我们不知道z(i)的值，所以这里我们要介绍另外一种unsupervised的学习方法，称为EM算法，EM算法主要分为两步，在E-step，我们主要对z(i)的值做猜测，在M-step，我们在E-step假设的基础上，利用最大似然估计求参数ϕ,μ,Σ，算法主要流程如下：

Repeat until convergence {

E-step：对于每一个i,j,设置：

w(i)j:=p(z(i)=j|x(i);ϕ,μ,Σ)

M-step：跟新如下参数：

ϕj:=1m∑i=1mw(i)j

μj:=∑mi=1w(i)jx(i)∑mi=1w(i)j

Σj:=∑mi=1w(i)j(x(i)−μj)(x(i)−μj)T∑mi=1w(i)j

}

在E-step，我们可以通过给定的x(i)和当前估计的参数计算z(i)的后验概率，利用贝叶斯估计，我们可以得到：

p(z(i)=j|x(i);ϕ,μ,Σ)=p(x(i)|z(i)=j;μ,Σ)p(z(i)=j,ϕ)∑kl=1p(x(i)|z(i)=l;μ,Σ)p(z(i)=l,ϕ)

这里，p(x(i)|z(i)=j;μ,Σ)通过计算一个均值为μj，协方差为Σj的高斯分布在x(i)处的概率密度得到，p(z(i)=j,ϕ)

是由ϕj给出，在E-step计算的w(i)j的值，表示我们对z(i)的一种弱估计。

同样，我们也可以将M-step的参数跟新与知道z(i)确切值的参数估计的表达式进行对比，可以看出两者是一致的，只不过前面的表达式1{z(i)=j}指出了我们利用哪个高斯分布，而现在换成了w(i)j。

EM 算法同样会让人联想起k均值算法，k均值是硬聚类，将样本聚到某一类里，而EM算法是弱聚类，样本所属的高斯分布由w(i)j估计。

参考来源：

Andrew Ng, “Machine Learning”, Stanford University.

机器学习：高斯混合模型及EM算法的更多相关文章

高斯混合模型的EM算法
高斯混合模型的EM算法混合高斯模型高斯混合模型的概率分布可以写成多个高斯分布的线形叠加,即 \[ p(\mathbf x) = \sum_{k=1}^{K}\pi_k\mathcal N(\mat ...
SIGAI机器学习第二十三集高斯混合模型与EM算法
讲授高斯混合模型的基本概念,训练算法面临的问题,EM算法的核心思想,算法的实现,实际应用. 大纲: 高斯混合模型简介实际例子训练算法面临的困难EM算法应用-视频背景建模总结高斯混合模型简写GMM,期 ...
机器学习基础知识笔记（一）-- 极大似然估计、高斯混合模型与EM算法
似然函数常说的概率是指给定参数后,预测即将发生的事件的可能性.拿硬币这个例子来说,我们已知一枚均匀硬币的正反面概率分别是0.5,要预测抛两次硬币,硬币都朝上的概率: H代表Head,表示头朝上 p( ...
机器学习之高斯混合模型及EM算法
第一部分: 这篇讨论使用期望最大化算法(Expectation-Maximization)来进行密度估计(density estimation). 与k-means一样,给定的训练样本是,我们将隐含类 ...
高斯混合模型与EM算法
对于高斯混合模型是干什么的呢?它解决什么样的问题呢?它常用在非监督学习中,意思就是我们的训练样本集合只有数据,没有标签. 它用来解决这样的问题:我们有一堆的训练样本,这些样本可以一共分为K类,用z(i ...
聚类之高斯混合模型与EM算法
一.高斯混合模型概述 1.公式高斯混合模型是指具有如下形式的概率分布模型: 其中,αk≥0,且∑αk=1,是每一个高斯分布的权重.Ø(y|θk)是第k个高斯分布的概率密度,被称为第k个分模型,参数为 ...
高斯混合和EM算法
首先介绍高斯混合模型: 高斯混合模型是指具有以下形式的概率分布模型: 一般其他分布的混合模型用相应的概率密度代替(1)式中的高斯分布密度即可. 给定训练集,我们希望构建该数据联合分布这里,其中是概率 ...
机器学习笔记—混合高斯和 EM 算法
本文介绍密度估计的 EM(Expectation-Maximization,期望最大). 假设有 {x(1),...,x(m)},因为是无监督学习算法,所以没有 y(i). 我们通过指定联合分布 p( ...
【机器学习】GMM和EM算法
机器学习算法-GMM和EM算法目录机器学习算法-GMM和EM算法 1. GMM模型 2. GMM模型参数求解 2.1 参数的求解 2.2 参数和的求解 3. GMM算法的实现 3.1 gmm类的定 ...

随机推荐

调用tensorflow中的concat方法时Expected int32, got list containing Tensors of type '_Message' instead.
grid = tf.concat(0, [x_t_flat, y_t_flat, ones])#报错语句 grid = tf.concat( [x_t_flat, y_t_flat, ones],0) ...
NN优化方法对照：梯度下降、随机梯度下降和批量梯度下降
1.前言这几种方法呢都是在求最优解中常常出现的方法,主要是应用迭代的思想来逼近.在梯度下降算法中.都是环绕下面这个式子展开: 当中在上面的式子中hθ(x)代表.输入为x的时候的其当时θ參数下的输出值 ...
Proftpd快速搭建FTP服务器
前言在Linux系统中,FTP服务器软件有很多,都已经成熟,像vsftpd, wu-ftp, Pure-FTPd等.但这些软件安装配置起来都比较麻烦,搭建个人的FTP服务器,还是Proftpd比较简 ...
在c++11中你最惊讶的新feature是什么？
对我来说,我最惊讶竟然把对于多线程的支持加到标准中了.真的想不明确,对于c++这样一种语言.怎么会加进这个东西. 1. 由于各个平台的不同,对于多线程的支持会有很多平台独有的特色.这样c++标准的定义 ...
Codeforces Beta Round #1 A. Theatre Square
从今天開始.就要在Codeforces里有一个新的開始了,貌似任务非常重的说~~ Codeforces专题我将会记录全部通过的题目,事实上仅仅要通过的题目都是水题啊!. 题目大意: 依照要求计算须要多 ...
梦入IBM之java基础-网络编程
如今我们来谈谈最后的内容:网络编程: 1):TCP中是线程与线程进行通讯!内部的执行机制是这种:先有一个线程去监听某个port.然后假设有Socket连接上来了以后,server会生成一个Socket ...
makefile 与android.mk中加信息打印
makefile里面加打印: ［table］@echo ' zImage - Compressed kernel image' android.mk里面加信息打印: $(warning TEXT... ...
关于CUDA两种API:Runtime API 和 Driver API
CUDA 眼下有两种不同的 API:Runtime API 和 Driver API,两种 API 各有其适用的范围. 高级API(cuda_runtime.h)是一种C++ ...
css控制打印时只显示指定区域
CreateTime--2017年9月26日08:16:04 Author:Marydon css控制打印时只显示指定区域思路: 1.使用打印命令@media print: 2.控制执行打印命令 ...
Linux安装Java/Maven
所需文件:jdk 下载安装Java INSTALL_PATH=/opt/soft TAR_FILE=/mnt/d/resources/soft/jdk-8u152-linux-x64.tar.gz ...

机器学习 ： 高斯混合模型及EM算法

机器学习 ： 高斯混合模型及EM算法的更多相关文章

随机推荐

热门专题

机器学习：高斯混合模型及EM算法

机器学习：高斯混合模型及EM算法的更多相关文章