kaldi HMM-GMM全部训练脚本分解】的更多相关文章

目录 train_mono.sh train_deltas.sh train_lda_mllt.sh train_sat.sh train_mono.sh 单音素训练脚本: //初始化,[topo feats] -> [0.mdl tree] gmm-init-mono //生成训练图,[0.mdl text l.fst] -> [train.fst] compile-train-graph //对标签进行初始化对齐[train.fst feats 0.mdl tree] -> [1.a…
目录 1. gmm-init-mono 模型初始化 2. compile-train-graghs 训练图初始化 3. align-equal-compiled 特征文件均匀分割 4. gmm-acc-stats-ali 累积模型重估所需数据 5. gmm-sum-accs 并行数据合并 6. gmm-est 声音模型参数重估 7. gmm-boost-silence 模型平滑处理 8. gmm-align-compiled 特征重新对齐 9. train_mono.sh 整体流程详解 转载注明…
在Kaldi中,单音素GMM的训练用的是Viterbi training,而不是Baum-Welch training.因此就不是用HMM Baum-Welch那几个公式去更新参数,也就不用计算前向概率.后向概率了.Kaldi中用的是EM算法用于GMM时的那三个参数更新公式,并且稍有改变.  Baum-Welch算法更新参数时,因为要计算前向后向概率,很费时间,因此使用Viterbi Training作为Baum-Welch算法的近似.在Baum-Welch算法中,计算前向后向概率时,要用到所有…
转自:http://blog.csdn.net/zjm750617105/article/details/55211992 对于每个类别的GMM有几种思路: 第一是将所有训练数据按类别分开,每类的数据训练一个GMM模型 第二是将所有的数据训练一个UBM模型,然后将训练数据按类别分开,用MAP去训练每个类别的GMM(对角UBM的MAP貌似kaldi 没有) 第三就是将所有的数据训练一个UBM模型,然后不做MAP,直接用训好的UBM所GMM的初始值,然后将所有训练数据按类别分开,训练三个GMM模型(…
原文转载:https://blog.csdn.net/zhongshaoyy/article/details/53502373 cifar10训练步骤如下: (1)打开终端,应用cd切换路径,如 cd ~/caffe/data/cifar10 , (2)继续执行命令   ./get_cifar10.sh, (3)成功下载数据集之后,执行ls即可见所下载的数据文件, (4)再次将路径切换到cd ~/caffe/examples/cifar10 (5)继续执行命令 ./create_cifar10.…
报错的两种报错原因: 1.输入数的路径错误,需要将路径进行修改排查目录是否出错 2.训练原数据格式不对 3.train.prototxt文件中并未设置test层,而在solver层则设置了test的迭代等参数 两种解决方法 1.对错误原因1,则改为正确路径 2.对错误原因2,修改create_data.sh文件将数据改为相应格式(或者修改train.prototxt文件,将参数改为数据源格式) 3.对错误原因3,在train.prototxt文件增加test层,或者将solver.prototx…
Baum-Welch算法就是EM算法,所以首先给出EM算法的Q函数 \[\sum_zP(Z|Y,\theta')\log P(Y,Z|\theta)\] 换成HMM里面的记号便于理解 \[Q(\lambda,\lambda') = \sum_zP(I|O,\lambda')\log P(I,O|\lambda)\] 根据状态序列和观测序列的联合分布 \[\begin{align*} P(O,I|\lambda) &= \sum_IP(O|I,\lambda)P(I|\lambda)\\ &…
--local str = "文字45 文字 789 文们adsd45 文字 wowo 文字 文字 wowo我们 wowo456 wiwo 465我们 456sdf 45 45我们adsd45"local s1="温馨提醒:现在离2010汇锦集团表面处理技术研讨会还有1天,报到时间为6报月19日14:00-20:00:who are you"--模板--local s2="一aA 馨提醒二b B文字b abc文字 "--local s2=&quo…
本文简单地介绍了KWS的原理--为Lattice中每个词生成索引并进行搜索:介绍了如何处理OOV--替补(Proxy,词典内对OOV的替补)关键词技术:介绍了KWS的语料库格式:介绍了KWS在Kaldi中的示例训练脚本和搜索脚本.     KWS系统示例: 论文下载: http://www.clsp.jhu.edu/~guoguo/papers/icassp2013_lexicon_value.pdf 论文标题:QUANTIFYING THE VALUE OF PRONUNCIATION LEX…
转自:http://blog.csdn.net/huchad/article/details/52092796 使用kaldi的DNN做音频分类,异常声音检测. HMM/GMM -> HMM/DNN 基本上沿用语音识别的思路,有两点注意一下即可. 1. 在训HMM/GMM时,训到monophone即可,使用monophone的HMM与alignment来训DNN 2.语言模型的准备,手动构造一个一元的简单模型即可 DNN的主要训练步骤如下: #Step 1. Pre-train DBN step…