steps/train_lda_mllt.sh】的更多相关文章

LDA+MLLT指的是在计算MFCC后对特征进行的变换:首先对特征进行扩帧,使用LDA降维(默认降低到40),然后经过多次迭代轮数估计一个对角变换(又称为MLLT或CTC) .详见 http://kaldi-asr.org/doc/transform.html         <<LDA_MLLT三音素HMM的训练流程图.vsdx>>    …
usage: steps/align_si.sh <data-dir> <lang-dir> <src-dir> <align-dir> e.g.: steps/align_si.sh data/train data/lang exp/tri1 exp/tri1_ali 对特征进行若干变换 调整模型的静音音素权重 根据词-词标识符映射表(words.txt),将标注转换为词标识符的序列: tra="ark:utils/sym2int.pl --ma…
<<LDA_MLLT_fMLLR三音素HMM的训练流程图.vsdx>>    …
<<单音素HMM的训练流程图.vsdx>> 定义拓扑结构.参数初始化 $ gmm-init-mono --shared-phones=$lang/phones/sets.int "--train-feats=$feats subset-feats --n=10 ark:- ark:-|" $lang/topo $feat_dim $dir/0.mdl $dir/tree $ wc -w data/lang_test/phones/sets.int data/la…
参考   kaldi 的全部资料_v0.4 cmd.sh 脚本为: 可以很清楚的看到有 3 个分类分别对应 a,b,c.a 和 b 都是集群上去运行这个样子, c 就是我们需要的.我们在虚拟机上运行的.你需要修改这个脚本 # "queue.pl" uses qsub. The options to it are # options to qsub. If you have GridEngine installed, # change this to a queue you have a…
steps/train_mono.sh --nj "$train_nj" --cmd "$train_cmd" data/train data/lang exp/mono || exit 1 data lang dir # 使用差分特征训练GMM模型 # 因为每一步训练的模型都会导致状态的均值发生变换,而决策树是与状态的分布相关的.也就是说,旧的决策树就不适用于新训练的模型.因此,需要重新为新模型训练新的决策树(根据特征和新的alignment). 流程: 使用特征…
============================================================================ MonoPhone Training & Decoding ============================================================================ steps/train_mono.sh --nj 30 --cmd run.pl --mem 4G data/train data/…
转载声明:本文为转载文章 作者:ferb2015 原文地址:https://blog.csdn.net/eqiang8848/article/details/81543599 kaldi是一个开源的语音识别工具箱,是基于c++.perl.shell编写的,可以在windows和unix 平台上编译. 中文参考资料:<kaldi的全部资料_v0.7(未完成版本).pdf>.网盘链接 提取码:yuq0 教程网页:http://www.kaldi-asr.org/doc/ 里面可以查阅脚本的用途.使…
Oracle 12cR1 RAC 在VMware Workstation上安装(上)-OS环境配置 1.1  整体规划部分 1.1.1  所需软件介绍 Oracle RAC不支持异构平台.在同一个集群中,可以支持具有速度和规模不同的机器,但所有节点必须运行在相同的操作系统.Oracle RAC不支持具有不同的芯片架构的机器. 序号 类型 内容 数据库 p17694377_121020_Linux-x86-64_1of8.zip p17694377_121020_Linux-x86-64_2of8…
------------------------------------------------------------------------------------------------------------------------------------------------------ 孤立词参考的例子就是yes/no脚本. -------------------------------------------------------------------------------…
注:在LoadGenerator的安装使用的过程,涉及到了shell变量与环境变量.用户使用的当前shell.创建用户等一系列的linux操作系统的问题,关注我后续的博客,会为大家继续讲解这些问题. 因jmeter运行时大量占用内存的原因,所以,采用loadrunner作为本次的测试工具.测试架构:controller部署在windows操作系统下(windows下安装loadrunner的过程,可以去网上搜下,这里不做解释),loadgenerator部署在linux下. 前提条件: 1.软件…
本文作者: CODING 用户 - 何健 这次实战篇,我们借助「CODING 持续集成」,实现一个简单的 Spring Boot 项目从编码到最后部署的完整过程.本教程还有 B 站视频版,帮助读者更好地学习理解. 思路 在线上环境构建.测试.部署 这种情况,通常会将 jenkins 安装在服务器上,确保构建测试等操作环境和线上环境一致. 此时通常会在 jenkins 中配置好需要持续集成的仓库,以及具体流程. 这种方式非常简单粗暴,也非常有效,但是缺点也很明显.可能 jenkins 会成为线上环…
基本模型没有变化,主要是调参,配置: %WER     65%  下降到了     15% 后面再继续优化... Graph compilation finish!steps/decode.sh --nj 1 --cmd utils/run.pl exp/mono0/graph_tgpr data/waves_test exp/mono0/decode_waves_testdecode.sh: feature type is deltasteps/diagnostic/analyze_lats.…
转自: http://www.jianshu.com/p/5b19605792ab?utm_campaign=maleskine&utm_content=note&utm_medium=pc_all_hots&utm_source=recommendation http://www.jianshu.com/p/6338fab6bd0a 刚刚拿到一个简单语料库练手,发现只有语音和对应文字, 这篇文章记录了从数据预处理到kaldi对数据进行训练和测试的全过程,这里首先训练单音节模型,其…
============================================================================ MMI + SGMM2 Training & Decoding ============================================================================ steps/align_sgmm2.sh --nj 30 --cmd run.pl --mem 4G --transform-d…
Delta特征是将mfcc特征(13维)经过差分得到的 它是做了一阶二阶的差分 提取的mfcc特征是13维的 然后通过delta就变成了39维 一阶差分: D(P(t))=P(t)-P(t-1) 二阶差分: D(D(P(t)))=(P(t)-P(t-1))-(P(t-1)-P(t-2)) Delta=Δ=差分 在 voxforge/s5/run.sh:116 rm/s5/run.sh:80 vystadial_cz/s5/run.sh:82 都注释了下一行的训练使用delta+delta-del…
text中每一个文本段由一个音频索引(indexed by utterance) 使用该方式的egs:librispeech.timit.thchs30.atc_en.atc_cn 语料的组织形式为: 一个音频(包含一个语句)对应一个文本(包含一个文本段) 或 一个音频(包含一个语句)对应一个文本(包含多个文本段)中的一个文本段 text中每一个文本段由一个时间片索引(indexed by segment) 使用该方式的egs: tedlium.atc0_comp_LDC94S14A 时间片由s…
Chain模型的训练流程 链式模型的训练过程是MMI的无网格的版本,从音素级解码图生成HMM,对其使用前向后向算法,获得分母状态后验,通过类似的方式计算分子状态后验,但限于对应于转录的序列. 对于神经网络的每个输出索引(即对于每个pdf-id),我们计算(分子占有概率 - 分母占用概率)的导数,并将它们在网络中反向传播. 分母FST 对于计算中的分母部分,我们对HMM进行前向-后向计算.实际上,由于我们把它表示为一个有限状态接受器,标签(pdf-id)与弧而不是状态相关联,所以在正常的公式中分母…
TIMIT语音库是IT和MIT合作音素级别标注的语音库,用于自动语音识别系统的发展和评估,包括来自美式英语,8个地区方言,630个人. 每个人读10个句子,每个发音都是音素级别.词级别文本标注,16kHz,16bit. 注意:不用使用TIMIT配置作为运行Kaldi的一个通用型例子,因为它不是一个非常标准的结构. 其它的一些配置也是非常好用的. ----------------------------------------------------------------------------…
steps/decode.sh #!/bin/bash # Copyright 2012 Johns Hopkins University (Author: Daniel Povey) # Apache 2.0 # Begin configuration section. transform_dir= # this option won't normally be used, but it can be used if you want to # supply existing fMLLR tr…
转:http://blog.csdn.net/shmilyforyq/article/details/76807431 博主话:这篇博客是对kaldi官网中Feature and model-space transforms in Kaldi 的翻译,因为不是专业翻译人士,接触kaldi时间也不长,所以难免有纰漏之处,希望读者如果有更好的建议和意见,可以在下面留言,有助于更好的交流,谢谢大家 介绍 Kaldi代码目前支持许多功能和模型空间的转换和预测.特征空间变换和预测以一致的方式被工具(它们在…
在Kaldi中,单音素GMM的训练用的是Viterbi training,而不是Baum-Welch training.因此就不是用HMM Baum-Welch那几个公式去更新参数,也就不用计算前向概率.后向概率了.Kaldi中用的是EM算法用于GMM时的那三个参数更新公式,并且稍有改变.  Baum-Welch算法更新参数时,因为要计算前向后向概率,很费时间,因此使用Viterbi Training作为Baum-Welch算法的近似.在Baum-Welch算法中,计算前向后向概率时,要用到所有…
Getting started, and prerequisites. rm/s5/run.sh Data preparation 如果有GridEngine, train_cmd="queue.pl -q all.q@a*.clsp.jhu.edu" decode_cmd="queue.pl -q all.q@[ah]*.clsp.jhu.edu" 如果需要在本地运行 train_cmd="run.pl" decode_cmd="ru…
Introduction 跑完kaldi的一些脚本例子,你可能想要自己用Kaldi跑自己的数据集.这里将会阐述如何准备好数据. run.sh较上的部分是有关数据准备的,通常local与数据集相关. 例如:RM数据集 local/rm_data_prep.sh /export/corpora5/LDC/LDC93S3A/rm_comp || exit 1; utils/prepare_lang.sh data/local/dict '!SIL' data/local/lang data/lang…
path.sh主要设定路径等 export KALDI_ROOT=`pwd`/../../.. [ -f $KALDI_ROOT/tools/env.sh ] && . $KALDI_ROOT/tools/env.sh export PATH=$PWD/utils/:$KALDI_ROOT/tools/openfst/bin:$PWD:$PATH [ ! -f $KALDI_ROOT/tools/config/common_path.sh ] && echo >&am…
引用自:http://baijiahao.baidu.com/s?id=1582812185263227836&wfr=spider&for=pc 引用自:https://www.cnblogs.com/YatHo/p/7856556.html 一.多参数选择 pipeline{ agent { label '192.168.0.156' } parameters{ choice(name:'test', choices:'test_a\ntest_b', description:'thi…
一.契机 相信很多使用selenium进行UI测试,再对接jenkins时,都是简单的在jenkins上将命令输入就完事了. 但是,相信你一定会遇到以下问题: 1.你需要同时跑不同文件或不同类的用例,怎么处理?用selenium grid,但我仅仅是功能,不想去区分浏览器,并且代码中我也不想写grid? 2.在jenkins中并发,怎么将报告合并成一份? 3.用测试框架的并发插件,比如nose processes, pytest的xdist,都是在一台机器上,执行selenium 同时打开多个浏…
前提说明: 测试架构:controller部署在windows操作系统下(windows下安装loadrunner的过程,可以去网上搜下,这里不做解释),loadgenerator部署在linux下. 前提条件: 1.软件版本:Windows 7 X64,Loadrunner 11.0,LoadGenerator11.0,CentOS-6.4-i386-bin-DVD1to2 2.windows和centos的防火墙关闭 3.确保centos系统的主机名可以ping通 下载loadGenerat…
前提说明: 测试架构:controller部署在windows操作系统下(windows下安装loadrunner的过程,可以去网上搜下,这里不做解释),loadgenerator部署在linux下. 前提条件: 1.软件版本:Windows 7 X64,Loadrunner 11.0,LoadGenerator11.0,CentOS-6.4-i386-bin-DVD1to2 2.windows和centos的防火墙关闭 3.确保centos系统的主机名可以ping通 下载loadGenerat…
目录 train_mono.sh train_deltas.sh train_lda_mllt.sh train_sat.sh train_mono.sh 单音素训练脚本: //初始化,[topo feats] -> [0.mdl tree] gmm-init-mono //生成训练图,[0.mdl text l.fst] -> [train.fst] compile-train-graph //对标签进行初始化对齐[train.fst feats 0.mdl tree] -> [1.a…