Kaldi的delta特征】的更多相关文章

Delta特征是将mfcc特征(13维)经过差分得到的 它是做了一阶二阶的差分 提取的mfcc特征是13维的 然后通过delta就变成了39维 一阶差分: D(P(t))=P(t)-P(t-1) 二阶差分: D(D(P(t)))=(P(t)-P(t-1))-(P(t-1)-P(t-2)) Delta=Δ=差分 在 voxforge/s5/run.sh:116 rm/s5/run.sh:80 vystadial_cz/s5/run.sh:82 都注释了下一行的训练使用delta+delta-del…
转:http://blog.csdn.net/shmilyforyq/article/details/76807431 博主话:这篇博客是对kaldi官网中Feature and model-space transforms in Kaldi 的翻译,因为不是专业翻译人士,接触kaldi时间也不长,所以难免有纰漏之处,希望读者如果有更好的建议和意见,可以在下面留言,有助于更好的交流,谢谢大家 介绍 Kaldi代码目前支持许多功能和模型空间的转换和预测.特征空间变换和预测以一致的方式被工具(它们在…
steps/train_mono.sh --nj "$train_nj" --cmd "$train_cmd" data/train data/lang exp/mono || exit 1 data lang dir # 使用差分特征训练GMM模型 # 因为每一步训练的模型都会导致状态的均值发生变换,而决策树是与状态的分布相关的.也就是说,旧的决策树就不适用于新训练的模型.因此,需要重新为新模型训练新的决策树(根据特征和新的alignment). 流程: 使用特征…
  运行前需要更改的地方:   1.matlab安装的路径以及matlab的license文件     2.噪声的路径;background.scp,以及噪声文件     3.run.sh文件中一处find $dir 改为 find $task,同样在utils/mixwithnoise.sh也存在这样的问题     数据准备部分: 1.运行时,在utils/mixNoiseWith.sh步出错,查看一下background.scp文件对应的噪声文件是否存在,或者修改噪声文件地址 2. 运行时出…
博客作者:凌逆战 论文地址:https://ieeexplore.ieee.xilesou.top/abstract/document/8683611/ 地址:https://www.cnblogs.com/LXP-Never/p/10714401.html 利用条件变分自动编码器进行人工带宽扩展的潜在表示学习 作者:Pramod Bachhav, Massimiliano Todisco and Nicholas Evans 摘要 当宽带设备与窄带设备或基础设施一起使用时,人工带宽扩展(ABE…
------------------------------------------------------------------------------------------------------------------------------------------------------------- 运行getdata.sh,下载voxforge语音库 修改cmd.sh  queue.pl为run.pl. install_srilm.sh 执行该脚本 按照网址下载srilm.tgz…
转:http://ftli.farbox.com/post/kaldizhong-wen-shi-bie Kaldi语音识别 1.声学建模单元的选择 1.1对声学建模单元加入位置信息 2.输入特征 3.区分性技术 4.多音字如何处理? 5.Noise Robust ASR 6.Deep Learning[DNN/CNN替换GMM] 7.在手机等资源受限设备 author:Feiteng Email:lifeiteng0422@gmail.com date:2014/08/10 Kaldi训练脚本…
一:Emotion Recognition from Human Speech Using Temporal Information and Deep Learning(2018 InterSpeech) (1)分帧加窗,每一帧采用的特征向量为eGeMAPS特征集中的20个特征,每个utterance使用裁剪和padding的做法使得定长512帧,所以输入为20x512的矩阵.每个样本归一化到0均值1标准差(根据对应的说话人).使用的数据集为EmoDB. (2)准确率为88.9% 二:Speec…
目录 一.服务器客户端识别系统建立方法 1. Command line to start the server(服务器端启动方式): 2. Command line to start the client(客户端启动方式): 二.使用麦克风建立客户端与服务器的实时解码 1. 使用online-server-gmm-decode-faster启动服务器: 2. 使用online-net-client启动客户端: 在kaldi 的工具集里有好几个程序可以用于在线识别.这些程序都位在src/onlin…
目录 1. gmm-init-mono 模型初始化 2. compile-train-graghs 训练图初始化 3. align-equal-compiled 特征文件均匀分割 4. gmm-acc-stats-ali 累积模型重估所需数据 5. gmm-sum-accs 并行数据合并 6. gmm-est 声音模型参数重估 7. gmm-boost-silence 模型平滑处理 8. gmm-align-compiled 特征重新对齐 9. train_mono.sh 整体流程详解 转载注明…