本文内容均翻译自这篇博文:(该博主的相关文章都比较好,感兴趣的可以自行学习) Voice Activity Detection(VAD) Tutorial 语音端点检测一般用于鉴别音频信号当中的语音出现(speech presence)和语音消失(speech absence).这里将提供一个简单的VAD方法,当检测到语音时输出为1,否则,输出为0. 语音是否出现或者在背景噪声上是否平坦决定了VAD方法的检测是否稳定(The job of a VAD is to reliably determi
应用speex进行音频去噪,speex功能很强大,因为opus的出现,用speex进行编码/解码的人几乎没有了,但是用speex来进行降噪,去除回声,增益还是很多. 这里用speex进行音频去噪,主要用如下几个关键点: 1,准确设置pcm音频的音频采样率,和帧长度, st = speex_preprocess_state_init(FRAME_SIZE, FRAME_SAMPLERATE);//初始化 2,设置降噪参数,其中DENOISE_DB默认是-25,单位是dB(分贝): int deno