作者:桂. 时间:2017-06-03  21:46:59 链接:http://www.cnblogs.com/xingshansi/p/6937259.html 原文下载:http://pan.baidu.com/s/1hs5kgh2 前言 1982年的文章了,主要是基于GSC框架的麦克风阵列增强,梳理一下文章的思路.这篇文章主要有两点特色: 1)在Frost’s algorithm基础上,进行了理论扩展; 2)论述了基于麦克风阵列的GSC框架. 一.理论回顾 假设噪声为加性: 其中s是des…
作者:桂. 时间:2017-06-08  08:01:41 链接:http://www.cnblogs.com/xingshansi/p/6957027.html 原文链接:http://pan.baidu.com/s/1nvp1bJF 前言 理论上借助VAD可以实现噪声估计,但这是远远不够的,例如在low-SNR场景下,甚至Noise是non-staitonary,原文交代了噪声估计的重要性: The majority of the VAD algorithms encounter probl…
作者:桂. 时间:2017-06-03  15:40:33 链接:http://www.cnblogs.com/xingshansi/p/6937576.html 前言 本文主要记录麦克风阵列的几个基本知识点,并简单介绍基本的波束合成方法:Delay and sum (DSB). 一.栅瓣效应 类似干涉仪中的phase-wrapping问题:传感器的距离超过半波长的距离. A-Beam Pattern 以线性阵列为例 输出为 对应的增益,也就是output,取频率为1KHz的数据: 有时候也用极…
作者:桂. 时间:2017-06-03  15:06:37 链接:http://www.cnblogs.com/xingshansi/p/6937635.html 原文链接:http://pan.baidu.com/s/1pKOYuiJ 前言 本文的算法就是在阵列信号增强中非常经典的Frost's Algorithm.上个世纪70年代的技术了,梳理一下该算法的思路. 一.理论框架 首先交代理论模型.噪声为加性噪声: X为带噪信号,L为理想信号,N为噪声信号,目的是希望利用一组滤波器,实现特定信号…
作者:桂. 时间:2017-06-06 13:25:58 链接:http://www.cnblogs.com/xingshansi/p/6943833.html 论文原文:http://pan.baidu.com/s/1hsuuQYK 前言 上一篇GSC是基于delay的框架进行处理,这是在无混响的情况下一种简单近似处理.许多更为复杂的应用场景,如存在的混响较严重Rt=450ms,则基于delay的模型是不合适的,有学者就考虑直接利用系统的响应函数,也就是传递函数(Transfer functi…
作者:桂. 时间:2017-06-06  16:10:47 链接:http://www.cnblogs.com/xingshansi/p/6951494.html 原文链接:http://pan.baidu.com/s/1i51Kymp omlsa代码:http://pan.baidu.com/s/1bpkvLVp omlsa论文:http://pan.baidu.com/s/1i5j3Adv 前言 这篇文章是TF-GSC的改进版.虽然TF-GSC对于方向性干扰的抑制效果不错,对于弥散噪声(di…
语音识别有近场和远场之分,且很多场景下都会用到麦克风阵列(micphone array).所谓麦克风阵列是一组位于空间不同位置的麦克风按一定的形状规则布置形成的阵列,是对空间传播声音信号进行空间采样的一种装置,采集到的信号包含了其空间位置信息.近场语音识别将声波看成球面波,它考虑各麦克风接收信号间的幅度差:远场语音识别将声波看成平面波,它忽略各麦克风接收信号间的幅度差,近似认为各接收信号之间是简单的时延关系.麦克风阵列可分为一维.二维和三维麦克风阵列.一维麦克风阵列,即线性麦克风阵列,各个麦克风…
目前基于麦克风阵列的声源定位方法大致可以分为三类:基于最大输出功率的可控波束形成技术.基于高分辨率谱图估计技术和基于声音时间差(time-delay estimation,TDE)的声源定位技术. 基于TDE的算法核心在于对传播时延的准确估计,一般通过对麦克风间信号做互相关处理得到.进一步获得声源位置信息,可以通过简单的延时求和.几何计算或是直接利用互相关结果进行可控功率响应搜索等方法.这类算法实现相对简单,运算量小,便于实时处理,因此在实际中运用最广. GCC-PHAT 基于广义互相关函数的时…
论文地址:https://ieeexplore.ieee.org/abstract/document/9414462 ICASSP 2021声学回声消除挑战:结合时间对准的自适应回声消除和基于深度学习的残余回声加噪声抑制 摘要: 本文描述了一种用于ICASSP 2021年声学回声消除挑战赛的三级声学回声消除和抑制框架.第一阶段采用分块频域自适应滤波,在不引入近端语音失真的情况下消除线性回声分量,并预先补偿远端参考信号与麦克风信号之间的时延.在第二阶段,提出了一种结合门控循环单元的深复杂U-Net…
论文地址:一种新的基于循环神经网络的远场语音通信实时噪声抑制算法 引用格式:Chen B, Zhou Y, Ma Y, et al. A New Real-Time Noise Suppression Algorithm for Far-Field Speech Communication Based on Recurrent Neural Network[C]//2021 IEEE International Conference on Signal Processing, Communica…