EM 算法实例

#coding:utf-8

import math

import copy

import numpy as np

import matplotlib.pyplot as plt

isdebug = True

#指定k个高斯分布參数，这里指定k=2。

#注意2个高斯分布具有同样方差Sigma。均值分别为Mu1,Mu2。

#共1000个数据

#生成训练样本。输入6,40,20,2

#两类样本方差为6。

#一类均值为20。一类为40

#随机生成1000个数

def ini_data(Sigma,Mu1,Mu2,k,N):

  #保存生成的随机样本

  global X 

  #求类别的均值

  global Mu

  #保存样本属于某类的概率

  global Expectations 

  #1*N的矩阵。生成N个样本

  X = np.zeros((1,N))

  #随意给定两个初始值，任猜两类均值

  #赋值一次就可以，最后要输出的量

  Mu = np.random.random(2) #0-1之间

  print Mu

  #给定1000*2的矩阵。保存样本属于某类的概率

  Expectations = np.zeros((N,k)) 

  #生成N个样本数据

  for i in xrange(0,N):

    #在大于0.5在第1个分布，小于0.5在第2个分布

    if np.random.random(1) > 0.5:

      #均值40加上方差倍数。样本数据满足N(40,Sigma)正态分布

      X[0,i] = np.random.normal()*Sigma + Mu1 #

    else:

      #均值40加上方差倍数，样本数据满足N(20,Sigma)正态分布

      X[0,i] = np.random.normal()*Sigma + Mu2 

  if isdebug:

    print "***********"

    print u"初始观測数据X："

    print X

#E步 计算每一个样本属于男女各自的概率

#输入：方差Sigma。类别k。样本数N

def e_step(Sigma,k,N):

  #样本属于某类概率

  global Expectations

  #两类均值

  global Mu

  #样本

  global X

  #遍历全部样本点，计算属于每一个类别的概率

  for i in xrange(0,N):

    #分母，用于归一化

    Denom = 0

    #遍历男女两类，计算各自归一化分母

    for j in xrange(0,k):

      #计算分母

      Denom += math.exp((-1/(2*(float(Sigma**2))))*(float(X[0,i]-Mu[j]))**2)

    #遍历男女两类，计算各自分子部分

    for j in xrange(0,k):

      #分子

      Numer = math.exp((-1/(2*(float(Sigma**2))))*(float(X[0,i]-Mu[j]))**2)

      #每一个样本属于该类别的概率

      Expectations[i,j] = Numer/Denom

  if isdebug:

    print "***********"

    print u"隐藏变量E（Z）："

    print len(Expectations)

    #数据总个数

    print Expectations.size

    #矩阵数据

    print Expectations.shape

    #打印出隐藏变量的值

    print Expectations

#M步 期望最大化

def m_step(k,N):

  #样本属于某类概率P(k|xi)

  global Expectations

  #样本

  global X

  #计算两类的均值

  #遍历两类

  for j in xrange(0,k):

    Numer = 0

    Denom = 0

    #当前类别下，遍历全部样本

    #计算该类别下的均值和方差

    for i in xrange(0,N):

      #该类别样本分布P(k|xi)xi

      Numer += Expectations[i,j]*X[0,i]

      #该类别类样本总数Nk，Nk等于P(k|xi)求和

      Denom +=Expectations[i,j]

    #计算每一个类别各自均值uk

    Mu[j] = Numer / Denom

#算法迭代iter_num次。或达到精度Epsilon停止迭代

#迭代次数1000次， 误差达到0.0001终止

#输入：两类同样方差Sigma。一类均值Mu1，一类均值Mu2

#类别数k。样本数N，迭代次数iter_num。可接受精度Epsilon

def run(Sigma,Mu1,Mu2,k,N,iter_num,Epsilon):

  #生成训练样本

  ini_data(Sigma,Mu1,Mu2,k,N)

  print u"初始<u1,u2>:", Mu

  #迭代1000次

  for i in range(iter_num):

    #保存上次两类均值

    Old_Mu = copy.deepcopy(Mu)

    #E步

    e_step(Sigma,k,N)

    #M步

    m_step(k,N)

    #输出当前迭代次数及当前预计的值

    print i,Mu

    #推断误差

    if sum(abs(Mu-Old_Mu)) < Epsilon:

      break

if __name__ == '__main__':

  #sigma,mu1,mu2,模型数，样本总数，迭代次数，迭代终止收敛精度

   run(6,40,20,2,1000,1000,0.0001)

   plt.hist(X[0,:],100) #柱状图的宽度

   plt.show()

EM 算法实例的更多相关文章

机器学习中的EM算法具体解释及R语言实例（1）
最大期望算法(EM) K均值算法很easy(可參见之前公布的博文),相信读者都能够轻松地理解它. 但以下将要介绍的EM算法就要困难很多了.它与极大似然预计密切相关. 1 算法原理最好还是从一个样例開 ...
opencv3中的机器学习算法之：EM算法
不同于其它的机器学习模型,EM算法是一种非监督的学习算法,它的输入数据事先不需要进行标注.相反,该算法从给定的样本集中,能计算出高斯混和参数的最大似然估计.也能得到每个样本对应的标注值,类似于kmea ...
Expectation maximization - EM算法学习总结
原创博客,转载请注明出处 Leavingseason http://www.cnblogs.com/sylvanas2012/p/5053798.html EM框架是一种求解最大似然概率估计的方法.往 ...
简单易学的机器学习算法——EM算法
简单易学的机器学习算法——EM算法一.机器学习中的参数估计问题在前面的博文中,如“简单易学的机器学习算法——Logistic回归”中,采用了极大似然函数对其模型中的参数进行估计,简单来讲即对于一系 ...
EM算法--第一篇
在统计计算中,最大期望(EM)算法是在概率(probabilistic)模型中寻找参数最大似然估计或者最大后验估计的算法,其中概率模型依赖于无法观测的隐藏变量(LatentVariable).最大期望 ...
Python实现机器学习算法：EM算法
''' 数据集:伪造数据集(两个高斯分布混合) 数据集长度:1000 ------------------------------ 运行结果: ---------------------------- ...
PLSA及EM算法
前言:本文主要介绍PLSA及EM算法,首先给出LSA(隐性语义分析)的早期方法SVD,然后引入基于概率的PLSA模型,其参数学习采用EM算法.接着我们分析如何运用EM算法估计一个简单的mixture ...
Machine Learning系列--EM算法理解与推导
EM算法,全称Expectation Maximization Algorithm,译作最大期望化算法或期望最大算法,是机器学习十大算法之一,吴军博士在<数学之美>书中称其为“上帝视角”算 ...
EM算法--原理
EM算法即期望最大化(Expection Maximization)算法,是一种最优化算法,在机器学习领域用来求解含有隐变量的模型的最大似然问题.最大似然是一种求解模型参数的方法,顾名思义,在给定一组 ...

随机推荐

FPGA LVDS I/O as an Analog Programmable Comparator
http://www.eetimes.com/author.asp?section_id=36&doc_id=1320289 Seeing the new ADC IP being bandi ...
我的sourceinsight的配置
下面是我的sourceinsight的配置,点击下面的链接,下载*.em文件,将他们添加到Base工程,设置相应的快捷键即可,或者导入下载的配置文件. http://pan.baidu.com/s/1 ...
解决/dev/fb0无法打开的问题
最近要在Linux做基于frame Buffer的图形显示,不论我在独立分区的Linux FC6系统中,还是在装有Red hat9的VPC中,都无法打开/dev/fb0.从网上找了很多资料,都没能解决 ...
Ruby：对象模型（又称八卦模型）笔记
备注如果说哪门语言对我影响最大,那就是Ruby了,在.NET阵营多年,试图去用C#的思维去解释很多东西,当然解释Java是足够了,可惜我也用了好几年去解释Javascript,结果是可想而知的:解释 ...
js隐藏表格的一行数据
1.方法 document.getElementById('customerAccount_tr').style.display="";//缴纳人名称显示 document.get ...
MySQL解决[Err] 1206 - The total number of locks exceeds the lock table size问题
MySQL解决[Err] 1206 - The total number of locks exceeds the lock table size问题查看MySQL版本:mysql>show ...
Python学习（四）数据结构 —— str
Python 字符串 str 本章大致介绍了 Python 的字符串类型 str,包括字符串的赋值及转义.字符串运算符.字符串格式化输出以及一些字符串的内建函数等. 字符串赋值及转义我们可以使用 ...
Python学习 —— 阶段综合练习一
Python 阶段综合练习一综合之前的函数.数据结构.流程控制等,做以下实例练习:(建议先不要看代码,自己先试着写:代码仅供参考,有多种实现方法) 1. 定义 is_Even 函数,传一 int 参 ...
OpenCV学习(3) OpenCV框架
OpenCV是一个开源的视觉库,其中包括很多计算机视觉的算法实现.在版本2.2以后,OpenCV采用C++特征的API,在1.x版本中,OpenCV函数都是传统的C语言形式. ...
CSS_LESS 语法/函数详解
嵌套规则 01 #header { color: black; }#header .navigation { font-size: 12px; 02 }#header .logo { 03 w ...

EM 算法 实例

EM 算法 实例的更多相关文章

随机推荐

热门专题

EM 算法实例

EM 算法实例的更多相关文章