Viterbi 维特比算法解决的是篱笆型的图的最短路径问题,图的节点按列组织,每列的节点数量可以不一样,每一列的节点只能和相邻列的节点相连,不能跨列相连,节点之间有着不同的距离,距离的值就不在

题目背景

从前有个村儿,村里的人的身体情况只有两种可能:健康、发烧

假设这个村儿的人没有体温计或者百度这种神奇东西,他唯一判断他身体情况的途径就是到村头我的偶像金正月的小诊所询问。月儿通过询问村民的感觉,判断她的病情,再假设村民只会回答正常、头晕或冷

有一天村里奥巴驴就去月儿那去询问了。

  • 第一天她告诉月儿她感觉正常。
  • 第二天她告诉月儿感觉有点冷。
  • 第三天她告诉月儿感觉有点头晕。

    那么问题来了,月儿如何根据阿驴的描述的情况,推断出这三天中阿驴的一个身体状态呢?

已知情况

隐含的身体状态 = {健康,发烧}

可观察的感觉状态 = {正常,冷,头晕}

月儿预判的阿驴身体状态的概率分布(初始状态矩阵) = {健康:0.6,发烧:0.4}

月儿认为的阿驴身体健康状态的转换概率分布(转移矩阵) =

  1. {
  2. 健康->健康: 0.7 ,
  3. 健康->发烧: 0.3 ,
  4. 发烧->健康:0.4 ,
  5. 发烧->发烧: 0.6
  6. }

月儿认为的在相应健康状况条件下,阿驴的感觉的概率分布(发射矩阵) =

  1. {
  2. 健康,正常:0.5 ,冷 0.4 ,头晕: 0.1
  3. 发烧,正常:0.1 ,冷 0.3 ,头晕: 0.6
  4. }

由上面我们可以发现,HMM的三要素都齐备了,下面就是解决问题了。

阿驴连续三天的身体感觉依次是: 正常、冷、头晕 。

过程:

第一天的时候,对每一个状态(健康或者发烧),分别求出第一天身体感觉正常的概率:P(第一天健康) = P(正常|健康)P(健康|初始情况) = 0.5 * 0.6 = 0.3 P(第一天发烧) = P(正常|发烧)P(发烧|初始情况) = 0.1 * 0.4 = 0.04

第二天的时候,对每个状态,分别求在第一天状态为健康或者发烧情况下观察到冷的最大概率。在维特比算法中,我们先要求得路径的单个路径的最大概率,然后再乘上观测概率。P(第二天健康) = max{0.30.7, 0.040.4}0.4=0.30.70.4=0.084 此时我们需要记录概率最大的路径的前一个状态,即0.084路径的前一个状态,我们在小本本上记下,第一天健康。 P(第二天发烧)=max{0.30.3, 0.040.6}0.3=0.027, 同样的在0.027这个路径上,第一天也是健康的。

第三天的时候,跟第二天一样。P(第三天健康)=max{0.0840.7, 0.0270.4}0.1=0.00588,在这条路径上,第二天是健康的。P(第三天发烧)=max{0.0840.3, 0.0270.6}0.6=0.01512,在这条路径上,第二天是健康的。

最后一天的状态概率分布即为最优路径的概率,即P(最优)=0.01512,这样我们可以得到最优路径的终点,是发烧

由最优路径开始回溯。请看我们的小本本,在求得第三天发烧概率的时候,我们的小本本上面写的是第二天健康,好了,第二天就应该是健康的状态,然后在第二天健康的情况下,我们记录的第一天是健康的。这样,我们的状态序列逆推出来了。即为:健康,健康,发烧

简略的画个图吧:



这儿的箭头指向就是一个回溯查询小本本的过程,我们在编写算法的时候,其实也得注意,每一个概率最大的单条路径上都要把前一个状态记录下来。

代码

Viterbi

  1. package com.vipsoft.viterbi;
  2. /**
  3. * 维特比算法
  4. * @author hankcs
  5. */
  6. public class Viterbi
  7. {
  8. /**
  9. * 求解HMM模型
  10. * @param obs 观测序列
  11. * @param states 隐状态
  12. * @param start_p 初始概率(隐状态)
  13. * @param trans_p 转移概率(隐状态)
  14. * @param emit_p 发射概率 (隐状态表现为显状态的概率)
  15. * @return 最可能的序列
  16. */
  17. public static int[] compute(int[] obs, int[] states, double[] start_p, double[][] trans_p, double[][] emit_p)
  18. {
  19. double[][] V = new double[obs.length][states.length];
  20. int[][] path = new int[states.length][obs.length];
  21. for (int y : states)
  22. {
  23. V[0][y] = start_p[y] * emit_p[y][obs[0]];
  24. path[y][0] = y;
  25. }
  26. for (int t = 1; t < obs.length; ++t)
  27. {
  28. int[][] newpath = new int[states.length][obs.length];
  29. for (int y : states)
  30. {
  31. double prob = -1;
  32. int state;
  33. for (int y0 : states)
  34. {
  35. double nprob = V[t - 1][y0] * trans_p[y0][y] * emit_p[y][obs[t]];
  36. if (nprob > prob)
  37. {
  38. prob = nprob;
  39. state = y0;
  40. // 记录最大概率
  41. V[t][y] = prob;
  42. // 记录路径
  43. System.arraycopy(path[state], 0, newpath[y], 0, t);
  44. newpath[y][t] = y;
  45. }
  46. }
  47. }
  48. path = newpath;
  49. }
  50. double prob = -1;
  51. int state = 0;
  52. for (int y : states)
  53. {
  54. if (V[obs.length - 1][y] > prob)
  55. {
  56. prob = V[obs.length - 1][y];
  57. state = y;
  58. }
  59. }
  60. return path[state];
  61. }
  62. }

DoctorExample

  1. package com.vipsoft.viterbi;
  2. import static com.vipsoft.viterbi.DoctorExample.Feel.cold;
  3. import static com.vipsoft.viterbi.DoctorExample.Feel.dizzy;
  4. import static com.vipsoft.viterbi.DoctorExample.Feel.normal;
  5. import static com.vipsoft.viterbi.DoctorExample.Status.Fever;
  6. import static com.vipsoft.viterbi.DoctorExample.Status.Healthy;
  7. public class DoctorExample
  8. {
  9. enum Status
  10. {
  11. /**
  12. * 健康
  13. */
  14. Healthy,
  15. /**
  16. * 发热
  17. */
  18. Fever,
  19. }
  20. enum Feel
  21. {
  22. /**
  23. * 正常
  24. */
  25. normal,
  26. /**
  27. * 冷
  28. */
  29. cold,
  30. /**
  31. * 头晕
  32. */
  33. dizzy,
  34. }
  35. static int[] states = new int[]{Healthy.ordinal(), Fever.ordinal()};
  36. /**
  37. * 初始矩阵
  38. * { 健康:0.6 , 发烧: 0.4 }
  39. */
  40. static double[] start_probability = new double[]{0.6, 0.4};
  41. /**
  42. * 转移矩阵
  43. * {
  44. * 健康->健康:0.7 ,
  45. * 健康->发烧:0.3 ,
  46. * 发烧->健康:0.4 ,
  47. * 发烧->发烧:0.6
  48. * }
  49. */
  50. static double[][] transititon_probability = new double[][]{
  51. {0.7, 0.3},
  52. {0.4, 0.6},
  53. };
  54. /**
  55. * 发射矩阵
  56. * {
  57. * 健康,正常:0.5 ,冷 :0.4 ,头晕: 0.1 ;
  58. * 发烧,正常:0.1 ,冷 :0.3 ,头晕: 0.6
  59. * }
  60. */
  61. static double[][] emission_probability = new double[][]{
  62. {0.5, 0.4, 0.1},
  63. {0.1, 0.3, 0.6},
  64. };
  65. public static void main(String[] args)
  66. {
  67. // 连续三天的身体感觉依次是: 正常、冷、头晕,推算出这三天的身体状态
  68. int[] observations = new int[]{normal.ordinal(), cold.ordinal(), dizzy.ordinal()};
  69. int[] result = Viterbi.compute(observations, states, start_probability, transititon_probability, emission_probability);
  70. for (int r : result)
  71. {
  72. System.out.print(Status.values()[r] + " ");
  73. }
  74. System.out.println();
  75. }
  76. }

源码:https://gitee.com/VipSoft/VipBoot/tree/develop/vipsoft-viterbi/src/main/java/com/vipsoft/viterbi

引用:https://www.zhihu.com/question/20136144 里的问题回答,正好是 HanLP 的Demo示例

HanLP — HMM隐马尔可夫模型 -- 维特比(Viterbi)算法 --示例代码 - Java的更多相关文章

  1. HMM隐马尔可夫模型(词语粘合)

    HMM用于自然语言处理(NLP)中文分词,是用来描述一个含有隐含未知参数的马尔可夫过程,其目的是希望通过求解这些隐含的参数来进行实体识别,说简单些也就是起到词语粘合的作用. HMM隐马尔可夫模型包括: ...

  2. HMM隐马尔可夫模型来龙去脉(一)

    目录 隐马尔可夫模型HMM学习导航 一.认识贝叶斯网络 1.概念原理介绍 2.举例解析 二.马尔可夫模型 1.概念原理介绍 2.举例解析 三.隐马尔可夫模型 1.概念原理介绍 2.举例解析 四.隐马尔 ...

  3. HMM隐马尔可夫模型来龙去脉(二)

    目录 前言 预备知识 一.估计问题 1.问题推导 2.前向算法/后向算法 二.序列问题 1.问题推导 2.维特比算法 三.参数估计问题 1.问题推导 2.期望最大化算法(前向后向算法) 总结 前言 H ...

  4. 隐马尔可夫模型的前向算法(java实现),今天奉上

    隐马尔可夫模型的前向算法(手动实现),今天奉上,由于研究生期间,实现的时候没有多加注释,这里为了让更好的人进入自然语言处理领域,特此,将前向算法奉上,具体公式可参考52nlp的HMN系列博客. 参考了 ...

  5. HMM隐马尔科夫模型

    这是一个非常重要的模型,凡是学统计学.机器学习.数据挖掘的人都应该彻底搞懂. python包: hmmlearn 0.2.0 https://github.com/hmmlearn/hmmlearn ...

  6. 机器学习-HMM隐马尔可夫模型-笔记

    HMM定义 1)隐马尔科夫模型 (HMM, Hidden Markov Model) 可用标注问题,在语音识别. NLP .生物信息.模式识别等领域被实践证明是有效的算法. 2)HMM 是关于时序的概 ...

  7. 自然语言处理(1)-HMM隐马尔科夫模型基础概念(一)

    隐马尔科夫模型HMM 序言 文本序列标注是自然语言处理中非常重要的一环,我先接触到的是CRF(条件随机场模型)用于解决相关问题,因此希望能够对CRF有一个全面的理解,但是由于在学习过程中发现一个算法像 ...

  8. ZH奶酪:隐马尔可夫模型学习小记——forward算法+viterbi算法+forward-backward算法(Baum-welch算法)

    网上关于HMM的学习资料.博客有很多,基本都是左边摘抄一点,右边摘抄一点,这里一个图,那里一个图,公式中有的变量说不清道不明,学起来很费劲. 经过浏览几篇博文(其实有的地方写的也比较乱),在7张4开的 ...

  9. HMM:隐马尔科夫模型-维特比算法

    http://blog.csdn.net/pipisorry/article/details/50731584 目标-解决HMM的基本问题之二:给定观察序列O=O1,O2,-OT以及模型λ,如何选择一 ...

  10. HMM 隐马尔科夫模型

    参考如下博客: http://www.52nlp.cn/itenyh%E7%89%88-%E7%94%A8hmm%E5%81%9A%E4%B8%AD%E6%96%87%E5%88%86%E8%AF%8 ...

随机推荐

  1. Python将一个正整数分解质因数。例如:输入90,打印出90=2*3*3*5。

    def SlowSnail(n): while n != 1: # 循环保证递归 for index in range(2, n + 1): if n % index == 0: n //= inde ...

  2. 发现AI自我意识:不期而遇的局部技术奇点

    Q*的启示 之前的文章里提到过,人工智能思维能力创造的必不可少的条件是状态空间的搜索.今天的大新闻里,我们都看到了Q*的确使用了搜索算法.所以今天我会稍微谈一下这个话题. 主要思想就是人工智能的进一步 ...

  3. [AI]人工智能早就可以拥有有大量的初级意识

    引子 意识是人类最基本而神秘的经验之一.在探索意识的本质时,我们需要建立清晰的概念分类体系,以免将它混同于其他概念而无法深入研究. 本文旨在阐述人类意识可能包含的两个层面:初级意识和高级意识,并明确区 ...

  4. 黑客玩具入门——5、继续Metasploit

    1.利用FTP漏洞并植入后门 实验靶机:Metasploitable2. 实践: 使用nmap扫描目标靶机 nmap -sV xxx.xxx.xxx.xxx(目标ip) 生成linux系统后门 msf ...

  5. 新来个架构师,把Xxl-Job原理讲的炉火纯青

    大家好,我是三友~~ 今天来继续探秘系列,扒一扒轻量级的分布式任务调度平台Xxl-Job背后的架构原理 公众号:三友的java日记 核心概念 这里还是老样子,为了保证文章的完整性和连贯性,方便那些没有 ...

  6. freeswitch如何解决sip信令的NAT问题

    概述 freeswitch是一款简单好用的VOIP开源软交换平台. 公网环境复杂多变,客户环境更是各种稀奇古怪的问题. fs在针对sip信令的NAT问题有针对性的参数设置. 本文讨论的范围限于fs的公 ...

  7. ubuntu防火墙ufw基本使用方法

    ubuntu系统基本使用方法 防火墙 # 查看服务器防火墙状态 ufw status # 将防火墙设置为可用状态 ufw enable # 将防火墙设置为关闭状态 ufw disbale # 放行端口 ...

  8. 数据结构入门之单链表代码实现(java)

    1:单链表是: 单链表是一种链式存取的 数据结构 用一组地址任意的 存储单元 存放线性表中的数据元素. 链表中的数据是以结点来表示的,每个结点的构成:元素 ( 数据元素 的映象) + 指针 (指示后继 ...

  9. 直接在*.vue文件(SFC)中使用JSX/TSX渲染函数,真香!

    前言 在日常开发中vue的模版语法在大多数情况都能够满足我们的需求,但是在一些复杂的业务场景中使用模版语法就有些麻烦了.这个时候灵活的JSX/TSX渲染函数就能派上用场了,大多数同学的做法都是将*.v ...

  10. 【昇腾】ModelArts与Atlas 200 DK云端协同开发——行人检测Demo(完整版)

    摘要:本文主要为大家展示如何基于ModelArts与Atlas 200 DK 端云协同开发的行人检测Demo实现过程. 基于开源数据集,使用ModelArts训练行人检测模型,在本地MindStudi ...