Speex回声消除原理深度解析

　　这里假设读者具有自适应滤波器的基础知识。Speex的AEC是以NLMS为基础，用MDF频域实现，最终推导出最优步长估计：残余回声与误差之比。最优步长等于残余回声方差与误差信号方差之比，这个结论可以记下，下面会用到的。

　　对于长度为N的NLMS滤波器，误差信号定义为期望信号与估计信号之差，表示如下：

\[e(n) = d(n) - \hat y(n) = d(n) - \sum\limits_{k = 0}^{N - 1} {{{\hat w}_k}(n)x(n - k)} \]

　　则，滤波器的系数更新方程为：

\[{\hat w_k}(n + 1) = {\hat w_k}(n) + \mu \frac{{e(n){x^*}(n - k)}}{{\sum\nolimits_{i = 0}^{N - 1} {|x(n - i){|^2}} }} = {\hat w_k}(n) + \mu \frac{{(d(n) - \sum\nolimits_i {{{\hat w}_i}(n)x(n - i)} ){x^*}(n - k)}}{{\sum\nolimits_{i = 0}^{N - 1} {|x(n - i){|^2}} }}\]

　　设滤波器的系数误差为：

\[{\delta _k}(n) = {\hat w_k}(n) - {w_k}(n)\]

　　且期望信号为本地（近端）语音+残余回声

\[d(n) = v(n) + \sum\nolimits_k {{w_k}(n)x(n - k)} \]

　　则滤波器的系数更新方程可以重写为

\[{\delta _k}(n + 1) = {\delta _k}(n) + \mu \frac{{(v(n) - \sum\nolimits_i {{\delta _i}(n)x(n - i)} ){x^*}(n - k)}}{{\sum\nolimits_{i = 0}^{N - 1} {|x(n - i){|^2}} }}\]

　　如果每个时刻的失调定义为：

\[\Lambda (n) = \sum\nolimits_k {\delta _k^*(n){\delta _k}(n)} \]

　　那么，在每一步的迭代中，滤波器的失调可表示如下：

\[\Lambda (n + 1) = \sum\limits_{k = 0}^{N - 1} {|{\delta _k}(n) + \mu \frac{{(v(n) - \sum\nolimits_i {{\delta _i}(n)x(n - i)} ){x^*}(n - k)}}{{\sum\nolimits_{i = 0}^{N - 1} {|x(n - i){|^2}} }}{|^2}} \]

　　假设远端信号与近端信号为白噪声，且不相关。

　　\[\sigma _v^2 = E\{ |v(n){|^2}\} \]

　　为近端语音信号的方差，则失调的更新方程为

\[E\{ \Lambda (n + 1)|\Lambda (n),x(n)\} = \Lambda (n)\left[ {1 - \frac{{2\mu }}{N} + \frac{{{\mu ^2}}}{N} + \frac{{2{\mu ^2}\sigma _v^2}}{{\Lambda (n)\sum\nolimits_{i = 0}^{N - 1} {|x(n - i){|^2}} }}} \right]\]

　　这里失调函数

\[E\{ \Lambda (n + 1)|\Lambda (n),x(n)\} \]

　　为凸函数，对它关于步长求导，并置导数为0，可得：

\[\frac{{\partial E\{ \Lambda (n + 1)\} }}{{\partial \mu }} = \frac{{ - 2}}{N} + \frac{{2\mu }}{N} + \frac{{2\mu \sigma _v^2}}{{\Lambda (n)\sum\nolimits_{i = 0}^{N - 1} {|x(n - i){|^2}} }} = 0\]

　　最终推出最优步长为：

\[{\mu _{opt}}(n) = \frac{1}{{1 + \frac{{\sigma _v^2}}{{\Lambda (n)/N\sum\nolimits_{i = 0}^{N - 1} {|x(n - i){|^2}} }}}}\]

　　大家别看最下面的那个分母

\[\Lambda (n)/N\sum\nolimits_{i = 0}^{N - 1} {|x(n - i){|^2}} \]

　　式子挺长，其实意义很明确，可以近似理解为残余回声的方差，于是输出信号的方差为：近端语音的方差+残余回声的方差，用式子表示如下

\[\sigma _e^2(n) = \sigma _v^2(n) + \sigma _r^2(n)\]

　　最终，导出最优步长：

\[{\mu _{opt}}(n) = \frac{1}{{1 + \frac{{\sigma _v^2}}{{\sigma _r^2(n)}}}} = \frac{1}{{\frac{{\sigma _r^2(n) + \sigma _v^2}}{{\sigma _r^2(n)}}}} \approx \frac{{\sigma _r^2(n)}}{{\sigma _e^2(n)}}\]

\[{\mu _{opt}}(n) = \min \left( {\frac{{\hat \sigma _r^2(n)}}{{\hat \sigma _e^2(n)}},1} \right)\]

　　上面的分析是在时域，基于NLMS，可以看到：最优步长等于残余回声方差与误差信号方差之比。其中误差的方差比较好求，残余回声的方差比较难求。下面我们看下上面的结论在频域中如何解决，Speex中在频域的自适应算法为：MDF（multidelay block frequency domain）自适应滤波。

　　在频域中，设k为频率索引，字母（ell）为帧索引，上面的结论转换到频域，结果如下：

\[{\mu _{opt}}(k,\ell ) \approx \frac{{\sigma _r^2(k,\ell )}}{{\sigma _e^2(k,\ell )}}\]

　　那么，在频域如何求残余回声的方差呢，我们可以定义一个泄露系数，表示回声相对于远端信号的泄露程度，这时残余回声表示为

\[\sigma _r^2(k,\ell ){\rm{ = }}\hat \eta (\ell )\hat \sigma _{\hat Y}^2(k,\ell )\]

　　根据泄露系数求出残余回声，就可以得到最优步长

\[{\mu _{opt}}(n) = \min \left( {\hat \eta (\ell )\frac{{|\hat Y(k,\ell ){|^2}}}{{|E(k,\ell ){|^2}}},{\mu _{\max }}} \right)\]

　　也就是说，根据泄露系数，可以估计出远端信号的残余回声，进而可以得到最优步长，那么，带来另一个问题，这里的泄露系数如何估计呢？确定泄露系数的过程，其实就是一元线性回归分析中确定回归系数的过程，具体可以看下回归分析的内容。

\[\hat \eta (\ell ) = \frac{{\sum\nolimits_k {{R_{EY}}(k,\ell )} }}{{\sum\nolimits_k {{R_{YY}}(k,\ell )} }}\]

\[{R_{EY}}(k,\ell ) = (1 - \beta (\ell )){R_{EY}}(k,\ell ) + \beta (\ell ){P_Y}(k){P_E}(k)\]

\[{R_{YY}}(k,\ell ) = (1 - \beta (\ell )){R_{YY}}(k,\ell ) + \beta (\ell ){P_Y}(k){({P_Y}(k))^2}\]

\[\beta (\ell ) = {\beta _0}\min (\frac{{\hat \sigma _Y^2(\ell )}}{{\hat \sigma _e^2(\ell )}},1)\]

　　这里，是通过递归平均处理方法得到每个频点的自相关、输入信号与误差信号的互相关。最终得到泄露系数，具体实现可以参考speex 的代码实现，相关参数可以参考后面给出来参考论文。
　　

　　Speex的回声消除原理已经分析完了，最终得出结论是：只有改与泄露系数相关部分的代码，才是对效果影响最大的地方，因为根据泄露系数，最终会估计出滤波器的最优步长。

参考论文：On Adjusting the Learning Rate in Frequency Domain Echo Cancellation With Double-Talk

Speex回声消除原理深度解析的更多相关文章

LMS、NLMS最优步长理论分析与Speex回声消除可能的改进想法
一.回声消除算法模型先来分析下自适应回声消除的主要组成部分,大体上可以把回声消除模型分为两个部分横向滤波器结构滤波器系数自适应与步长控制横向滤波器用脉冲响应w(n)[有的地方也称为回声路径]与 ...
speex 回声消除的用法
speex 回声消除的用法分类: speex AEC 回声消除 2012-11-13 11:24 1336人阅读评论(0) 收藏举报 speex的回声消息就是speex_echo_cancel ...
java8Stream原理深度解析
Java8 Stream原理深度解析 Author:Dorae Date:2017年11月2日19:10:39 转载请注明出处上一篇文章中简要介绍了Java8的函数式编程,而在Java8中另外一个比 ...
mysql索引原理深度解析
mysql索引原理深度解析一.总结一句话总结: mysql索引是b+树,因为b+树在范围查找.节点查找等方面优化 hash索引,完全平衡二叉树,b树等 1.数据库中最常见的慢查询优化方式是什么? ...
Speex回声消除代码分析
先说明下,这里的代码流程是修改过的Speex流程,但与Speex代码差异不大,应该不影响阅读. (1)用RemoveDCoffset函数进行去直流 (2)远端信号预加重后放入x[i+frame_s ...
SQL注入原理深度解析
本文转自:http://www.iii-soft.com/forum.php?mod=viewthread&tid=1613&extra=page%3D1 对于Web应用来说,注射式攻 ...
第1课：SQL注入原理深度解析
对于Web应用来说,注射式攻击由来已久,攻击方式也五花八门,常见的攻击方式有SQL注射.命令注射以及新近才出现的XPath注射等等.本文将以SQL注射为例,在源码级对其攻击原理进行深入的讲解. 一.注 ...
react渲染原理深度解析
https://mp.weixin.qq.com/s/aM-SkTsQrgruuf5wy3xVmQ 原文件地址 [第1392期]React从渲染原理到性能优化(二)-- 更新渲染黄琼前端早读课 ...
Vue双向数据绑定原理深度解析
首先,什么是双向数据绑定?Vue是三大MVVM框架之一,数据绑定简单来说,就是当数据发生变化时,相应的视图会进行更新,当视图更新时,数据也会跟着变化. 在分析其原理和代码的时候,大家首先了解如下几个j ...

随机推荐

XML在线转化为JSON
http://www.utilities-online.info/xmltojson/
jenkins执行python脚本
参考: https://blog.csdn.net/qq_39247153/article/details/81003244 https://blog.csdn.net/huashao0602/art ...
IDEA生成增强for循环
itar 生成array for代码块 for (int i = 0; i < array.length; i++) { = array[i]; } itco 生成Collection迭代 fo ...
C++中的各种进制转换函数汇总及学习
一.指定格式输出 1.C中指定格式输出 printf(); //按八进制格式输出,保留5位高位补零 printf(); //按十进制格式输出,保留3位高位补零 printf(); //按十六进制格式输 ...
HDU - 1087 Super Jumping！Jumping！Jumping！(dp求最长上升子序列的和)
传送门:HDU_1087 题意:现在要玩一个跳棋类游戏,有棋盘和棋子.从棋子st开始,跳到棋子en结束.跳动棋子的规则是下一个落脚的棋子的号码必须要大于当前棋子的号码.st的号是所有棋子中最小的,en ...
第二节：numpy之数组切片、数据类型转换、随机数组
Pyspider爬虫简单框架——链家网
pyspider 目录 pyspider简单介绍 pyspider的使用实战 pyspider简单介绍一个国人编写的强大的网络爬虫系统并带有强大的WebUI.采用Python语言编写,分布式架构, ...
1、ceph-deploy之部署ceph集群
环境说明 server:3台虚拟机,挂载卷/dev/vdb 10G 系统:centos7.2 ceph版本:luminous repo: 公网-http://download.ceph.com,htt ...
高三感想+跨年感想+OI回忆录
2017.12.29晚高三感慨与OI分别很久了,发现自己已经不会敲代码了…… 高三国庆前大概比较正常,只是某只人影响有点大(现在好多了)…… 感觉国庆以后状态就没好过. 先感冒两个星期,然后某个周 ...
[luoguP3275] [SCOI2011]糖果（差分约束）
传送门差分约束裸题但是坑! 有一个点是长为10W的链,需要逆序加边才能过(真是玄学) 还有各种坑爹数据开longlong ——代码 #include <cstdio> #includ ...

Speex回声消除原理深度解析

Speex回声消除原理深度解析的更多相关文章

随机推荐

热门专题