上篇文章(基于MCRA-OMLSA的语音降噪(一):原理)讲了基于MCRA-OMLSA降噪的原理,本篇讲怎么做软件实现。软件实现有多种方式。单纯看降噪效果可用python,因为python有丰富的库可用,可节省不少时间,把主要精力放在降噪效果提升上。如果要把算法用在产品上就得用其他语言。我们是芯片公司,且我们team偏底层,最常用的语言是C,所以我又用C实现了该算法。本文先讲讲在python下的实现,再讲讲在C下的实现。

一,python下的实现

Python有丰富的库,音频文件读取的librosa/soundfile等,数学库的numpy(里面也包含了信号处理的fft等),连算指数积分的都有了(scipy.special.exp1)。算法原理搞清楚了后先画软件流程图,如下图:

根据流程图并且基于现成的python库很快就能把算法实现了。关键是调优,要有好的降噪效果。算法里参数较多,主要有αp、αs、αd等,其中有些有推荐的经验值,有些需要自己tuning。参数tuning过程中降噪效果评估依旧用权威的PESQ。将干净语音和噪声以指定的SNR(通常有0db/5db/10db/15db等)叠加后得到带噪语音,用降噪算法对这个带噪语音做降噪得到降噪后的语音。用PESQ工具分别将带噪语音和降噪后的语音与原来的干净语音做比较,可以得到MOS分提高了多少。花了一些时间tuning后有了一个相对不错的降噪效果,以叠加的是白噪声为例,降噪后在各种SNR下的MOS分提升如下表:

二,C语言下的实现

C语言下的实现要用在产品中,算法的运算量(即 CPU load)是一个要重点考虑的因素。实现通常分两个阶段。第一阶段是基于C中已有数学库的浮点实现,在参数值一样的情况下降噪效果要和python实现的保持一致。如果运算量较大或者处理器不支持浮点运算,需要进入第二阶段。首先将用到的数学库函数用自己写的函数(函数里只有加减乘除等)代替,然后再将整个算法定点化,使运算量降下来。

1,第一阶段

首先根据算法和流程图定义结构体和API。这里简单把API列一下,如下图:

从上图看出,MCRA和OMLSA各有两个API,相对简洁,一个是初始化,一个是算法处理。实现时遇到的第一个问题是C语言数学库里没有提供指数积分函数,需要自己实现。在网上搜了下,书《常用算法程序集(C语言)第三版》的14.15节讲了怎么算指数积分,这里简单介绍下。令

其中γ为欧拉常数(γ = 0.577215664901532860606512)。

可以通过该书9.7节的勒让德-高斯求积分法来求。对勒让德-高斯求积分法感兴趣的可以找相关资料来看,这里就不详细介绍了。把Ei(x)求出后再取反就是算法中所要的的值。取几个值比较这个实现与python里scipy.special.exp1的结果,如下表,可以看出精度还是挺高的。

算法代码写好后,还需要FFT相关的代码才能调试,FFT相关的选用了CMSIS里浮点实现的代码。调试时带噪语音文件依旧用的是python实现调试的那个,这样结果好对齐,方便比较各个环节的输出,如FFT的输出、噪声估计的输出等。调试时要一级一级的调,在误差允许的范围内,如果上一级的输出一致而本级的输出不一致,则问题就出在这一级里。在这个方法下很快就调试好了,在误差允许的范围内,每帧各个频点降噪后的幅度谱与python里的保持一致。

2,第二阶段

第二阶段可分两个子阶段,一是把数学库的函数用自己写的函数(函数里只有加减乘除等运算)替代,二是把整个算法定点化。目前第一个子阶段已完成,第二个子阶段完成后有机会也会写怎么对算法做定点化的。

算法用到的数学库函数主要是自然指数(exp())和一般指数(pow()),再加上做完FFT后是复数,需要用求平方根(sqrt())算得幅度谱,所以需要写出这几个库函数对应的函数。对于一般的求指数而言,它可以转换成求自然指数和自然对数,具体关系如下:,所以只要实现了自然指数和自然对数就可以了。这样最终实现的函数是3个:自然指数,自然对数,求平方根。至于怎么实现的这3个函数,细节较多,会在后面专门写一篇文章讲。实现完这些函数后与标准库里的做比较,误差在允许的范围内即可。再把这些函数用在算法中,拿降噪后的幅度谱与python里的比较,误差也在允许的范围内。

基于MCRA-OMLSA的语音降噪(二):实现的更多相关文章

  1. 基于MCRA-OMLSA的语音降噪(三):实现(续)

    上篇文章(基于MCRA-OMLSA的语音降噪(二):实现)讲了基于MCRA-OMLSA的语音降噪的软件实现.本篇继续讲,主要讲C语言下怎么对数学库里的求平方根(sqrt()).求自然指数(exp()) ...

  2. webRTC中语音降噪模块ANS细节详解(一)

    ANS(adaptive noise suppression) 是webRTC中音频相关的核心模块之一,为众多公司所使用.从2015年开始,我在几个产品中使用了webRTC的3A(AEC/ANS/AG ...

  3. 基于MCRA-OMLSA的语音降噪(一):原理

    前面的几篇文章讲了webRTC中的语音降噪.最近又用到了基于MCRA-OMLSA的语音降噪,就学习了原理并且软件实现了它.MCRA主要用于噪声估计,OMLSA是基于估计出来的噪声去做降噪.类比于web ...

  4. webRTC中语音降噪模块ANS细节详解(二)

    上篇(webRTC中语音降噪模块ANS细节详解(一))讲了维纳滤波的基本原理.本篇先给出webRTC中ANS的基本处理过程,然后讲其中两步(即时域转频域和频域转时域)中的一些处理细节. ANS的基本处 ...

  5. webRTC中语音降噪模块ANS细节详解(三)

    上篇(webRTC中语音降噪模块ANS细节详解(二))讲了ANS的处理流程和语音在时域和频域的相互转换.本篇开始讲语音降噪的核心部分,首先讲噪声的初始估计以及基于估计出来的噪声算先验信噪比和后验信噪比 ...

  6. webRTC中语音降噪模块ANS细节详解(四)

    上篇(webRTC中语音降噪模块ANS细节详解(三))讲了噪声的初始估计方法以及怎么算先验SNR和后验SNR. 本篇开始讲基于带噪语音和特征的语音和噪声的概率计算方法和噪声估计更新以及基于维纳滤波的降 ...

  7. Java基于opencv实现图像数字识别(二)—基本流程

    Java基于opencv实现图像数字识别(二)-基本流程 做一个项目之前呢,我们应该有一个总体把握,或者是进度条:来一步步的督促着我们来完成这个项目,在我们正式开始前呢,我们先讨论下流程. 我做的主要 ...

  8. 语音降噪论文“A Hybrid Approach for Speech Enhancement Using MoG Model and Neural Network Phoneme Classifier”的研读

    最近认真的研读了这篇关于降噪的论文.它是一种利用混合模型降噪的方法,即既利用了生成模型(MoG高斯模型),也利用了判别模型(神经网络NN模型).本文根据自己的理解对原理做了梳理. 论文是基于" ...

  9. Android RecyclerView单击、长按事件:基于OnItemTouchListener +GestureDetector标准实现(二),封装抽取成通用工具类

     Android RecyclerView单击.长按事件:基于OnItemTouchListener +GestureDetector标准实现(二),封装抽取成通用工具类 我写的附录文章2,介绍了 ...

随机推荐

  1. 大型前端项目 DevOps 沉思录 —— CI 篇

    摘要 DevOps 一词源于 Development 和 Operations 的组合,即将软件交付过程中开发与测试运维的环节通过工具链打通,并通过自动化的测试与监控,减少团队的时间损耗,更加高效稳定 ...

  2. 阿里云NAS性能测试

    测试方法:根据阿里云NAS官方文档进行测试 测试对象:性能型NAS,总容量1PB,已使用27.49GB(计算吞吐量时按30GB计算) 随机读IOPS测试 测试命令 fio -numjobs=1 -io ...

  3. [云原生]Docker - 镜像

    目录 Docker镜像 获取镜像 列出本地镜像 创建镜像 方法一:修改已有镜像 方法二:通过Dockerfile构建镜像 方法三:从本地文件系统导入 上传镜像 保存和载入镜像 移除本地镜像 镜像的实现 ...

  4. 【STM32】使用SDIO进行SD卡读写,包含文件管理FatFs(三)-SD卡的操作流程

    其他链接 [STM32]使用SDIO进行SD卡读写,包含文件管理FatFs(一)-初步认识SD卡 [STM32]使用SDIO进行SD卡读写,包含文件管理FatFs(二)-了解SD总线,命令的相关介绍 ...

  5. 链式栈——Java实现

    1 package struct; 2 3 //接口 4 interface ILinkStack{ 5 //栈中元素个数(栈大小) 6 int size(); 7 //取栈顶元素 8 Object ...

  6. CentOS6+nginx+uwsgi+mysql+django1.6.6+python2.6.6

    1.配置网关 #vi /etc/sysconfig/network NETWORKING=yes(表示系统是否使用网络,一般设置为yes.如果设为no,则不能使用网络,而且很多系统服务程序将无法启动) ...

  7. java实现链式线性表

    package ch9; public class LinkList <T>{ private class Node { //保存节点的数据 private T data; //指向下一个 ...

  8. springboot项目中集成ip2region遇到的问题及终极解决办法

    1.问题回顾 按照ip2region项目的官方集成到springboot项目后,运行测试一切都ok,没有任何问题.但是当项目打成可执行的jar包后再运行,却显示找不到ip2region.db,无法找到 ...

  9. 【编程思想】【设计模式】【行为模式Behavioral】Specification

    Python版 https://github.com/faif/python-patterns/blob/master/behavioral/specification.py #!/usr/bin/e ...

  10. 【编程思想】【设计模式】【结构模式Structural】适配器模式adapter

    Python版 https://github.com/faif/python-patterns/blob/master/structural/adapter.py #!/usr/bin/env pyt ...