机器学习&数据挖掘笔记_13（用htk完成简单的孤立词识别）

　　最近在看图模型中著名的HMM算法，对应的一些理论公式也能看懂个大概，就是不太明白怎样在一个具体的机器学习问题（比如分类，回归）中使用HMM，特别是一些有关状态变量、观察变量和实际问题中变量的对应关系，因此目前急需一个实际例子来加深对HMM算法的仰慕，大家如有好的例子来具体学HMM算法的话，欢迎分享！众所周知，著名的HMM开源库为Hidden Markov Model Toolkit（以下简称HTK），而HTK在语音识别领域应用很成功，这2天花了些时间学习了HTK的使用，完成的是最简单孤立词的识别，即Yes、No的语音识别，网上这方面的教程纵多，见参考资料部分。

　　当然了，进行实验的前提是正确安装HTK，安装过程可以结合HTK目录下（HTK解压后所在目录）的readme文件和文章windows下安装编译HTK语音识别工具包。

我主要是参考文章语音识别工具箱之HTK安装与使用中的步骤来完成Yes/No语音识别的，大概的步骤和博主的差不多（这里不再重现该过程，因为这方面资料实在太多），下面主要讲下一些细微的需要注意的地方：

　　1. 录音的原文件不能太少，不然在进行HMM初始化时很容易报错。我这里Yes和No都录的是25次。

　　2. 在用HSLab.exe录音时，由于这个小软件实在是不太好用，有些bug。每次录完2个音，把它标注好，重命名（即手动命名，按照一定顺序，不要重名，下次录音前需把该软件给后重新打开，否则即使你是重新new了一个文件后录的音，在你标注音频文件后保存文件时该软件很有可能会把以前标注过的音频信息给重复过来，这样在后面的HInit 步骤会老出错。因此，在每次标注音频文件.lab时，一定要保证其标注的信息只对应一个音频文件.sig。注意标注时，htk时间后面的单位是10us，转换成秒时需要除以10^7.

　　3. 在进行Hcompv步骤时，只需运行一次来得到vFloors文件(不需要对yes,no,sil分别运行)。

　　4. 如果在HRest步骤出现与vFloors有关的错误，则可以在HRest命令中省去与vFloors相关的内容，这样一般不太会影响后面HMM的训练和识别。

　　5. 在HParse步骤时，在建立gram.txt文件时，文件的最后要有一个空行，否则HParse步会一直失败。

　　其它方面基本按照语音识别工具箱之HTK安装与使用就可以了。另外，还HTK (v.3.1): Basic Tutorial和htkbook也是非常好的参考资料。

　　由实验可知，这里每个单词都定义为一个HMM模型，HMM模型中状态的个数是人为先验设定的，这里统一采用4个（状态数可以不相同），每个状态的实际含义大致是该单词发音的声母、韵母等（也不一定严格对应），多个状态的序列构成了一个单词。每个状态的输出（即观察变量）为GMM的参数向量，这些参数向量的长度和训练语音断的MFCC特征长度一致，这里都是39维。

　　参考资料：

语音识别工具箱之HTK安装与使用

利用HTK工具包快速建立一个语音命令识别系统

基于HTK语音工具包进行孤立词识别的使用教程

HTK工具搭建识别器的总体框架

windows下安装编译HTK语音识别工具包

HTK (v.3.1): Basic Tutorial.pdf

htkbook.pdf

http://htk.eng.cam.ac.uk/

机器学习&数据挖掘笔记_13（用htk完成简单的孤立词识别）的更多相关文章

机器学习&数据挖掘笔记_14（GMM-HMM语音识别简单理解）
为了对GMM-HMM在语音识别上的应用有个宏观认识,花了些时间读了下HTK(用htk完成简单的孤立词识别)的部分源码,对该算法总算有了点大概认识,达到了预期我想要的.不得不说,网络上关于语音识别的通俗 ...
基于HTK语音工具包进行孤立词识别的使用教程
选自:http://my.oschina.net/jamesju/blog/116151 1前言最近一直在研究HTK语音识别工具包,前几天完成了工具包的安装编译和测试,这几天又按耐不住好奇,决定自己 ...
亲自动手用HTK实现YES NO孤立词识别
很久以前的发在研学论坛的帖子了,再重新整理了一下,希望对新手有用. 完整版链接:http://yun.baidu.com/s/1hapcE 第一步创建语音文件录音命令:HSLab any_nam ...
机器学习&数据挖掘笔记（常见面试之机器学习算法思想简单梳理）
机器学习&数据挖掘笔记_16(常见面试之机器学习算法思想简单梳理) 作者:tornadomeet 出处:http://www.cnblogs.com/tornadomeet 前言: 找工作时( ...
[转]机器学习&数据挖掘笔记_16（常见面试之机器学习算法思想简单梳理）
机器学习&数据挖掘笔记_16(常见面试之机器学习算法思想简单梳理) 转自http://www.cnblogs.com/tornadomeet/p/3395593.html 前言: 找工作时(I ...
机器学习&数据挖掘笔记_16（常见面试之机器学习算法思想简单梳理）
前言: 找工作时(IT行业),除了常见的软件开发以外,机器学习岗位也可以当作是一个选择,不少计算机方向的研究生都会接触这个,如果你的研究方向是机器学习/数据挖掘之类,且又对其非常感兴趣的话,可以考虑考 ...
机器学习&数据挖掘笔记_15（关于凸优化的一些简单概念）
没有系统学过数学优化,但是机器学习中又常用到这些工具和技巧,机器学习中最常见的优化当属凸优化了,这些可以参考Ng的教学资料:http://cs229.stanford.edu/section/cs22 ...
机器学习&数据挖掘笔记_12（对Conjugate Gradient 优化的简单理解）
数学优化方法在机器学习算法中至关重要,本篇博客主要来简单介绍下Conjugate Gradient(共轭梯度法,以下简称CG)算法,内容是参考的文献为:An Introduction to the C ...
机器学习&数据挖掘笔记_19（PGM练习三：马尔科夫网络在OCR上的简单应用）
前言: 接着coursera课程:Probabilistic Graphical Models上的实验3,本次实验是利用马尔科夫网络(CRF模型)来完成单词的OCR识别,每个单词由多个字母组合,每个字 ...

随机推荐

hdu 5944 Fxx and string
\:nn,下标从1开始,第\:i\:i位的字母为\:s_isi,现在Fxx想知道有多少三元组\:(i,j,k)\:(i,j,k)满足下列条件 1.i,j,k\:i,j,k三个数成等比数列 2.s ...
【腾讯Bugly干货分享】深入理解 ButterKnife，让你的程序学会写代码
本文来自于腾讯bugly开发者社区,非经作者同意,请勿转载,原文地址:http://dev.qq.com/topic/578753c0c9da73584b025875 0.引子话说我们做程序员的,都 ...
Github注册过程以及对管理软件的了解
二.目前流行的源程序管理软件和项目管理软件主要有以下一些: 1.Visual Source Safe 优点:如果开发工具是VS.NET,用VSS较合适,方便,安装配置和使用都简单,版本控制简单,打la ...
[.net 面向对象编程基础] (2) 关于面向对象编程
[.net 面向对象编程基础] (2) 关于面向对象编程首先是,面向对象编程英文 Object-Oriented Programming 简称 OOP 通俗来说,就是针对对象编程的意思那么问 ...
java提高篇(二)-----理解java的三大特性之继承
在<Think in java>中有这样一句话:复用代码是Java众多引人注目的功能之一.但要想成为极具革命性的语言,仅仅能够复制代码并对加以改变是不够的,它还必须能够做更多的事情.在这句 ...
【转载】关于sql server 代理（已禁用代理xp）
原文地址:http://blog.sina.com.cn/s/blog_493cafbb0100qy91.html 症状: SQL SERVER2005里面,启动SQL代理服务,启动正常,但是在sql ...
[每日电路图] 7、设计一个PCB的流程及细节·总结——给外行的同学或刚入行的同学一个宏观鸟瞰电路板设计的大致流程的文章
前言最近两天使用AD14软件设计了一个蓝牙防丢器电路板(PCB)图纸,中间有一些细节在本文中记录下,方便下次设计PCB时参考.也希望能给外行的同学或刚入行的同学一个宏观鸟瞰电路板设计的大致流程的文章 ...
ECMAScript5的其它新特性
之前两篇博客 ECMAScript5 Object的新属性方法,ECMAScript5 Array新增方法,分别介绍了ECMAScript5对Object和Array的拓展,这两个对象最常用,而且改动 ...
【重要更新】Senparc.Weixin SDK v4.4 升级说明
本次更新同时影响以下所有Senparc.Weixin相关版本的dll: Senparc.Weixin.dll 升级到 v4.4.2(重要) Senparc.Weixin.MP.dll 升级到 v13. ...
MVVM架构~knockoutjs系列之从Knockout.Validation.js源码中学习它的用法
返回目录说在前有时,我们在使用一个插件时,在网上即找不到它的相关API,这时,我们会很抓狂的,与其抓狂,还不如踏下心来,分析一下它的源码,事实上,对于JS这种开发语言来说,它开发的插件的使用方法都 ...

机器学习&数据挖掘笔记_13（用htk完成简单的孤立词识别）

机器学习&数据挖掘笔记_13（用htk完成简单的孤立词识别）的更多相关文章

随机推荐

热门专题