前言

　　预备知识

　　一、估计问题

　　　　1、问题推导

2、前向算法/后向算法

　　二、序列问题

　　总结

前言

HMM隐马尔可夫模型，这个名字看起来熟悉，其实很是陌生。它给人一种很神秘高深的感觉，确实，很强大的一个模型，在概率论统计学应该是应用广泛而且很重要的；虽说很高深强大的一个模型，其原理确实我们最基础的理论知识不断推导计算来的。

上一篇《HMM隐马尔可夫模型来龙去脉（一）》，从HMM基础理论开始，我们可以学习得知，其原理来源于概率论基本重要知识，包括了条件概率、贝叶斯公式、概率分布函数...

而这一篇将继续探索隐马尔可夫模型，深入理解模型背后解决的各种问题，力求基本弄懂这个似乎熟悉而又陌生深奥的模型。接下来探索HMM三个经典的基本问题的解决方案，逐步通过问题推导，公式解析，算法实现，有章可循地真正来理解来龙去脉！

预备知识

建议先翻看前一篇《HMM隐马尔可夫模型来龙去脉（一）》逐步详细介绍的内容。

一般的，将HMM简单表示为一个三元组 $\mu=(A,B,\pi)$ , π是初始状态的概率分布，A是状态转移概率，B是符号发射概率。

由此观察序列 $O=O_1O_2...O_T$ 可以通过以下步骤产生：

根据初识状态的概率分布 $\pi_i$ 选择一个初识状态 $q_1=s_i$ .
设t=1.
根据状态 $s_i$ 的符号发射概率分布 $b_i(k)$ 输出 $O_t=v_k$ .
根据状态转移概率分布 $a_{ij}$ ，将此时 t 的状态转移到新的状态 $q_{t+1}=s_j$ .
t=t+1,如果 t<T ，重复执行步骤3和4，否则结束算法。

一、估计问题

1、问题推导

估计问题：给定一个观察序列 $O=O_1O_2...O_T$ 和模型 $\mu=(A,B,\pi)$ ，如何快速计算序列O的概率。即 $P(O|\mu)$ ?

我们很直观知道，这其实就是一个条件概率的计算问题。在给定的模型条件下，可以推导以下：

首先根据预备知识可以计算任意状态序列Q下，观察序列O的概率：

$P(O|Q)=\prod_{t=1}^{T}P(O_t|q_t)=b_{q_1}(O_1 )\times b_{q_2}(O_2)\times b_{q_T}(O_T)$

而且 $P(Q)=\pi_{q_1}a_{q_1q_2}...a_{q_{T-1}q_T}$ ,

另外根据条件概率 $P(O,Q)=P(O|Q)\times P(Q)$ .

综上公式，求得在模型 $\mu=(A,B,\pi)$ 下，

$P(O)=\sum_{Q}P(O,Q)=\sum_{Q}P(O|Q)P(Q)=\sum_{Q}\pi_{q_1}b_{q_1}(O_1)\prod_{t=1}^{T}a_{q_tq_{t+1}}b_{q_{t+1}}(O_{t+1})$ .

然而，这个直观简单的推导公式，计算时间复杂度达到指数级爆炸！ $N^{T}$ ! ! ! ,所以呢，需要寻找更高效的计算方法来解决指数级时间问题。

由此，引出HMM中的动态规划方法，一般用格架的组织形式描述。格架算法示意图如下：

思想是：对于一个个状态下的HMM，某一时刻结束时，每个格子能够记录HMM所有输出符号的概率，较长子路径概率可以由较短子路径概率计算出来。

2、前向算法/后向算法

第一步，定义一个前向变量 $\alpha_t(i)=P(O_1O_2O_3...O_t,q_t=s_i)$ ，表示在时间 t ，HMM在状态 $s_i$ 输出一个序列的概率。

第二步，根据动态规划思想，在时间 t+1 的概率计算为： $\alpha_{t+1}=(\sum_{i=1}^{N}\alpha_{t}a_{ij})b_j(O_{t+1})$ , 其中表示从状态 i 转移到状态 j 并输出观察符号O的概率。

第三步，根据前向变量，可以计算 $P(O|\mu)$ ，就是在所有状态下观察到序列O的概率：

$P(O|\mu)=\sum_{1=1}^{N}\alpha_T(i)$ .

前向变量归纳关系图：

前向算法总结：

1、初始化： $\alpha_t(i)=\pi_ib_i(O_1),1\leqslant i\leqslant N$

2、归纳计算： $\alpha_{t+1}=(\sum_{i=1}^{N}\alpha_{t}a_{ij})b_j(O_{t+1}),1\leqslant t \leqslant T-1$

3、求和： $P(O|\mu)=\sum_{1=1}^{N}\alpha_T(i)$

复杂度分析：步骤1计算每个前向变量需要考虑N个状态转移，步骤2计算N个前向变量，所以时间复杂度O(N*N)，步骤3在时间1~T过程中，计算量为O(T)，所以总时间复杂度为 $O(N^2T)$ . 因此，使用该算法解决在多项式时间内计算问题。

后向算法方法类似，使用动态规划方法计算，后向变量定义为 $\beta _t(i)=P(O_{t+1}...O_T|q_t=s_i,\mu)$ ，归纳关系图如下：

后向算法总结：

1、初始化： $\beta _T(i)=1,1\leqslant i\leqslant N$

2、归纳计算： $\beta_{t}=\sum_{j=1}^{N}a_{ij}b_j(O_{t+1})\beta_{t+1}(j),1\leqslant t \leqslant T-1;1\leqslant i\leqslant N$

3、求和： $P(O|\mu)=\sum_{1=1}^{N}\pi_ib_i(O_1)\beta_1(i)$ . 同理，时间复杂度也是 $O(N^2T)$ 。

二、序列问题

1、问题推导

序列问题：给定一个观察序列 $O=O_1O_2...O_T$ 和模型 $\mu=(A,B,\pi)$ ，如何快速选择最优状态序列Q，使之最好地解释观察序列O？

对该问题的正确理解就是，给定观察序列和模型后，使条件概率 $P(O|\mu)$ 最大的状态序列，即 $\hat{Q}=argmaxP(Q|O,\mu)$ .

因此，维比特算法定义了一个维比特变量 $\delta _t(i)$ . 在时间 t 时，HMM沿着某一路径到达状态 $s_i$ ,使观察序列O概率最大化。

$\delta _t(i)=maxP(q_1,q_2,...,q_t=s_i|O_1O_2...O_t|\mu)$ .

2、维特比算法

$\delta _t(i)$ 有如下递归关系， $\delta _t(i)=max[\delta_t(j)a_{ij}]b_i(O_{t+1})$ ,根据这个递归关系，所以可以运用动态规划搜索技术。

另外，为了记录时间 t 时，HMM通过的一条概率最大的路径达到状态 $s_i$ ，算法设置了另外一个变量 $\varphi _t(i)$ 来记录前一个时间的状态。

维比特算法如下:

三、参数估计问题

1、问题推导

参数估计问题：给定一个观察序列和模型，使得 $P(O|\mu)$ 最大化。

我们知道，HMM中的状态序列是不可见的，所以这里采用期望最大化法(EM)，它可以用于含有隐变量的统计模型的参数最大似然估计。

基本思想：从 $\mu_0$ 得到从某一个状态转移到另一个状态的期望次数，由此得到模型 $\mu_1$ ，然后，重新估计模型的参数，执行这个迭代过程，直到参数收敛于最大似然估计值。

2、期望最大化算法（前向后向算法）

这种EM方法的具体实现使用到了前向后向算法(forward-backward algorithm)。

这里需要用到几个变量表示概率：

公式(6-24)：在时间 t 位于状态 $s_i$ ，时间 t+1位于状态 $s_j$ 的概率 $\varepsilon _t(i,j)=P(q_t=s_i,q_{t+1}=s_j,O|\mu)$ .

公式(6-25)：另外，在时间 t 位于状态 $s_i$ 的概率 $\gamma _t(i)=\sum_{j=1}^{N}\varepsilon _t(i,j)$

$\mu$ 的参数估计公式：

公式(6-26)： $\bar{\pi_i}=P(q_1=s_i|O,\mu)=\gamma _1(i)$

公式(6-27)： $\bar{a_{ij}}=\frac{\sum_{t=1}^{T-1}\varepsilon_t(i,j) }{\sum_{t=1}^{T-1}\gamma_t(i)}$

公式(6-28.)： $\bar{b_j(k)}=\frac{\sum_{t=1}^{T}\gamma _t(j)\times \delta (O_t,v_k)}{\sum_{t=1}^{T}\gamma _t(j)}$

由上述公式，得出前向后向算法：

总结

至此，我们对隐马尔可夫模型(HMM)有了比较深入的理解，从原理上全面认识HMM实现思想，这一篇非常抽象的展示许多公式，虽然对这些公式不能够完全掌握，但是最重要的是，能够理解HMM三个基本问题解决方案的思想方法，这些经典奇妙的算法也是人们在不断探索中发现的并完善。所以，对于初学者来说，思想方法最重要，原理需要理明白，具体应用实现是利用已经封装好的工具。

这一篇将探索HMM三个经典的基本问题的解决方案，逐步通过问题推导，公式解析，算法实现，对于HMM理解不再天马行空般，来龙去脉基本理清！希望能帮助到像我一样初学者的伙伴，欢迎大佬交流指正！

两篇内容深入理解HMM：

我的CSDN博客：https://blog.csdn.net/Charzous/article/details/108311177

我的博客园：https://www.cnblogs.com/chenzhenhong/p/13592058.html

本文链接：https://blog.csdn.net/Charzous/article/details/108311177

HMM隐马尔可夫模型来龙去脉（二）的更多相关文章

HMM隐马尔可夫模型来龙去脉（一）
目录隐马尔可夫模型HMM学习导航一.认识贝叶斯网络 1.概念原理介绍 2.举例解析二.马尔可夫模型 1.概念原理介绍 2.举例解析三.隐马尔可夫模型 1.概念原理介绍 2.举例解析四.隐马尔 ...
HMM隐马尔可夫模型（词语粘合）
HMM用于自然语言处理(NLP)中文分词,是用来描述一个含有隐含未知参数的马尔可夫过程,其目的是希望通过求解这些隐含的参数来进行实体识别,说简单些也就是起到词语粘合的作用. HMM隐马尔可夫模型包括: ...
HMM隐马尔科夫模型
这是一个非常重要的模型,凡是学统计学.机器学习.数据挖掘的人都应该彻底搞懂. python包: hmmlearn 0.2.0 https://github.com/hmmlearn/hmmlearn ...
机器学习-HMM隐马尔可夫模型-笔记
HMM定义 1)隐马尔科夫模型 (HMM, Hidden Markov Model) 可用标注问题,在语音识别. NLP .生物信息.模式识别等领域被实践证明是有效的算法. 2)HMM 是关于时序的概 ...
自然语言处理(1)-HMM隐马尔科夫模型基础概念（一）
隐马尔科夫模型HMM 序言文本序列标注是自然语言处理中非常重要的一环,我先接触到的是CRF(条件随机场模型)用于解决相关问题,因此希望能够对CRF有一个全面的理解,但是由于在学习过程中发现一个算法像 ...
HMM 隐马尔科夫模型
参考如下博客: http://www.52nlp.cn/itenyh%E7%89%88-%E7%94%A8hmm%E5%81%9A%E4%B8%AD%E6%96%87%E5%88%86%E8%AF%8 ...
HMM：隐马尔可夫模型HMM
http://blog.csdn.net/pipisorry/article/details/50722178 隐马尔可夫模型隐马尔可夫模型(Hidden Markov Model,HMM)是统计模 ...
详解隐马尔可夫模型(HMM)中的维特比算法
笔记转载于GitHub项目:https://github.com/NLP-LOVE/Introduction-NLP 4. 隐马尔可夫模型与序列标注第3章的n元语法模型从词语接续的流畅度出发,为全切 ...
隐马尔可夫模型(Hidden Markov Model)
隐马尔可夫模型(Hidden Markov Model) 隐马尔可夫模型(Hidden Markov Model, HMM)是一个重要的机器学习模型.直观地说,它可以解决一类这样的问题:有某样事物存在 ...

随机推荐

CF R 635 div1 C Kaavi and Magic Spell 区间dp
LINK:Kaavi and Magic Spell 一打CF才知道自己原来这么菜这题完全没想到. 可以发现如果dp f[i][j]表示前i个字符匹配T的前j个字符的方案数此时转移变得异常麻烦 ...
wps 2011 破解版软件
今天换了一台新电脑. wps 都没有系统的太过忍受不了整了一天终于是找到了一个合适安装的想要的邮件发给我 673658917@qq.com
Flask 框架小记
Flask 框架小记 Flask 实例创建示例的代码 from flask import Flask # __name__ 是模块名, 用于反射导入模块 app = Flask(__name__, ...
java多线程（三）：多线程单例模式，双重检查，volatile关键字
一.事先准备首先准备一个运行用的代码: public class Singleton { public static void main(String[] args) { Thread[] thre ...
Java 开发者的编程噩梦，为什么你的代码总有 bug🐛？
文章已经收录在 Github.com/niumoo/JavaNotes ,更有 Java 程序员所需要掌握的核心知识,欢迎Star和指教. 欢迎关注我的公众号,文章每周更新. 很多 Java 初学者在 ...
【API进阶之路】高考要考口语？我用多模态评测API做了一场10w+刷屏活动
摘要:闲着没事用多模态评测API做了一个测评英语口语的互动小游戏,居然成了一场10万人参与的刷屏级活动. 上一期故事说到,我成为了公司技术委员会副主席,上任后的第一件事是建立了一个云容器化的研发资料库 ...
db2 创建function报错
create function fun_fw_sfyczy(pi_operunitid varchar(2)) returns varchar(2)LANGUAGE SQL BEGIN ATOMIC ...
Vue 给子组件绑定v-model
父组件使用子组件时,使用v-model指令,在子组件中使用value获取props的值父组件 <template> <div style="margin:20px;dis ...
《闲扯Redis十》Redis 跳跃表的结构实现
一.前言 Redis 提供了5种数据类型:String(字符串).Hash(哈希).List(列表).Set(集合).Zset(有序集合),理解每种数据类型的特点对于redis的开发和运维非常重要. ...
go 字符串
目录前言 1.声明/赋值 2.遍历 3.操作 1.截取 2.修改 3.连接 4.比较 5.查长 6.格式化输出 4.字符串优势跳转前言不做文字的搬运工,多做灵感性记录这是平时学习总结的地方, ...

HMM隐马尔可夫模型来龙去脉（二）

前言

预备知识

一、估计问题

1、问题推导

2、前向算法/后向算法

二、序列问题

1、问题推导

2、维特比算法

三、参数估计问题

1、问题推导

2、期望最大化算法（前向后向算法）

总结

HMM隐马尔可夫模型来龙去脉（二）的更多相关文章

随机推荐

热门专题