论文地址:https://arxiv.53yu.com/abs/2104.04325 联合在线多通道声学回声消除.语音去混响和声源分离 摘要: 本文提出了一种联合声源分离算法,可同时减少声学回声.混响和干扰源.通过最大化相对于其他源的独立性,将目标语音从混合中分离出来.结果表明,分离过程可以分解为级联的子过程,分别与声学回声消除.语音去混响和源分离相关,所有这些都使用基于辅助函数的独立分量/矢量分析技术及其求解顺序来求解是可交换的.级联解决方案不仅导致较低的计算复杂度,而且比普通联合算法具有更好…
论文地址:https://ieeexplore.ieee.org/abstract/document/9414462 ICASSP 2021声学回声消除挑战:结合时间对准的自适应回声消除和基于深度学习的残余回声加噪声抑制 摘要: 本文描述了一种用于ICASSP 2021年声学回声消除挑战赛的三级声学回声消除和抑制框架.第一阶段采用分块频域自适应滤波,在不引入近端语音失真的情况下消除线性回声分量,并预先补偿远端参考信号与麦克风信号之间的时延.在第二阶段,提出了一种结合门控循环单元的深复杂U-Net…
论文地址:https://ieeexplore.ieee.org/abstract/document/9357975/ 基于半盲源分离的非线性回声消除 摘要: 当使用非线性自适应滤波器时,数值模型与实际非线性模型之间的不匹配是非线性声回声消除(NAEC)的一个挑战.为了解决这一问题,我们提出了一种基于半盲源分离(SBSS)的有效方法,该方法对无记忆非线性进行基泛展开,然后将未知的非线性展开系数合并到回声路径中.将远端输入信号的所有基函数视为已知的等效参考信号,推导了一种基于约束比例自然梯度策略的…
论文地址:https://ieeexploreieee.53yu.com/abstract/document/9414715 Netshell 中的 AEC:关于 FCRN 声学回声消除的目标和拓扑选择 摘要: 声学回声消除(AEC)算法在信号处理中具有长期稳定的作用,其方法可以改善诸如汽车免提系统.智能家居和扬声器设备或网络会议系统等应用的性能.就在最近,第一个基于深度神经网络(DNN)的方法被提出,采用DNN联合进行AEC和残余回声抑制(RES)/噪声降低,在回声抑制性能方面有显著改善.另一…
论文地址:深度学习用于噪音和双语场景下的回声消除 博客地址:https://www.cnblogs.com/LXP-Never/p/14210359.html 摘要 传统的声学回声消除(AEC)通过使用自适应算法识别声学脉冲响应来工作. 我们将AEC公式化为有监督的语音分离问题,该问题将说话人信号和近端信号分开,以便仅将后者传输到远端. 训练双向长短时记忆的递归神经网络(BLSTM)对从近端和远端混合信号中提取的特征进行估计.然后应用BLSTM估计的理想比率掩模来分离和抑制远端信号,从而去除回波…
论文地址:http://www.interspeech2020.org/uploadfile/pdf/Thu-1-10-5.pdf 基于GAN的回声消除 摘要 生成对抗网络(GANs)已成为语音增强(如噪声抑制)中的热门研究主题.通过在对抗性场景中训练噪声抑制算法,基于GAN的解决方案通常会产生良好的性能.在本文中,提出了卷积循环GAN架构(CRGAN-EC),以解决线性和非线性回声情况.所提出的体系结构在频域中进行了训练,并预测了目标语音的时频(TF)掩码.部署了几种度量损失函数,并研究了它们…
论文地址:http://www.interspeech2020.org/uploadfile/pdf/Thu-1-10-10.pdf Attention Wave-U-Net 的回声消除 摘要 提出了一种基于U-Net的具有注意机制的AEC方法,以联合抑制声学回声和背景噪声.该方法由U-Net.一个辅助编码器和一个注意网络组成.在该方法中,Wave-U-Net从混合语音中提取估计的近端语音,辅助编码器提取远端语音的潜在特征,其中相关特征通过注意机制提供给Wave-U-Net.利用注意网络,可以有…
论文地址:https://indico2.conference4me.psnc.pl/event/35/contributions/3364/attachments/777/815/Thu-1-10-4.pdf 一种基于深度学习的鲁棒级联回声消除算法 摘要 AEC是用来消除扬声器和麦克风之间的反馈.理想情况下,AEC是一个线性问题,可以通过自适应滤波来解决.然而,在实际应用中,有两个重要的问题严重影响AEC的性能,即1)双讲问题和2)主要由扬声器和/或功率放大器引起的非线性失真.针对这两个问题,…
论文地址:https://arxiv.53yu.com/abs/2106.07577 基于 F-T-LSTM 复杂网络的联合声学回声消除和语音增强 摘要 随着对音频通信和在线会议的需求日益增加,在包括噪声.混响和非线性失真在内的复杂声学场景下,确保声学回声消除(AEC)的鲁棒性已成为首要问题.尽管已经有一些传统的方法考虑了非线性失真,但它们对于回声抑制仍然效率低下,并且在存在噪声时性能会有所衰减.在本文中,我们提出了一种使用复杂神经网络的实时 AEC 方法,以更好地建模重要的相位信息和频率时间…
BSS Audio® Introduces Full-Bandwidth Acoustic Echo Cancellation Algorithm for Soundweb London Conferencing Processors December 13, 2010       SALT LAKE CITY, Utah – BSS Audio®, a Harman International Company (NYSE-HAR), today introduced a new full-ba…
回声就是声音信号经过一系列反射之后,又听到了自己讲话的声音,这就是回声.一些回声是必要的,比如剧院里的音乐回声以及延迟时间较短的房间回声:而大多数回声会造成负面影响,比如在有线或者无线通信时重复听到自己讲话的声音(回想那些年我们开黑打游戏时,如果其中有个人开了外放,他的声音就会回荡来回荡去).因此消除回声的负面影响对通信系统是十分必要的. 针对回声消除(Acoustic Echo Cancellation,AEC )问题,现如今最流行的算法就是基于自适应滤波的回声消除算法.本文从回声信号的两种分…
论文地址:延迟约束的语音增强基音估计 引用格式:Schröter H, Rosenkranz T, Escalante-B A N, et al. LACOPE: Latency-Constrained Pitch Estimation for Speech Enhancement[C]//Interspeech. 2021: 656-660. 摘要 基频($f_0$)估计,又称基音跟踪,是语音和信号处理领域长期以来的研究课题.然而,许多基音估计算法在噪声条件下失败,或者由于其帧大小或Viter…
        回声产生的原因: 本地产生的音频信息通过网络传输到远端, 远端音频信号通过反射再由远端麦克采集到远端系统,再通过IP网络传输本地,本地播放后,在由本地麦克采集到,这就构成了类似闭环正反馈,当延时较小时,信号不断加强,就会导致啸叫现象产生,当延时较大,就会产生回音.  回音消除的基本原理是用等幅等频率但反相的信号与采集的信号相叠加,当通过网络或者物理反射获得音频信号与等频率反相的信号相叠加,就可以出去回声.问题的关键就是获取这个反相的信号,回声信号的产生主要由: 1.本地环境的反射…
背景:回声与啸叫的产生  http://blog.csdn.net/u011202336/article/details/9238397 参考资料:  http://www.speex.org/docs/manual 从代码分析,下边是Speex test demo #include <stdio.h> #include <stdlib.h> #include <sys/types.h> #include <sys/stat.h> #include <…
论文地址:https://ieeexploreieee.fenshishang.com/abstract/document/9142362 神经网络支持的回声.混响和噪声联合多通道降噪 摘要 我们考虑同时降低回声.混响和噪声的问题.在真实场景中,这些失真源可能同时出现,减少它们意味着组合相应的失真特定滤波器.当这些过滤器互相接触时,它们必须被联合优化.我们建议使用多通道高斯建模框架对线性回声消除和去混响后的目标和剩余信号进行建模,并通过神经网络联合表示它们的频谱.我们开发了一个迭代的块坐标上升算…
论文地址:ICASSP 2021声学回声消除挑战:数据集和测试框架 代码地址:https://github.com/microsoft/DNS-Challenge 主页:https://aec-challenge.azurewebsites.net/ 摘要 ICASSP 2021年声学回声消除挑战赛旨在促进声学回声消除(AEC)领域的研究,该领域是语音增强的重要组成部分,也是音频通信和会议系统中的首要问题.许多最近的AEC研究报告了在训练和测试样本(来自相同基础分布的合成数据集)上的良好性能.然…
论文地址:https://ieeexplore.ieee.org/abstract/document/9413510 基于双信号变换LSTM网络的回声消除 摘要 本文将双信号变换LSTM网络(DTLN)应用于实时声学回声消除(AEC)任务中.DTLN结合了短时傅里叶变换和堆叠网络方法中的学习特征表示,这使得在时频和时域(也包括相位信息)中能够进行鲁棒的信息处理.该模型仅在真实和合成回声场景下训练60小时.训练设置包括多语言语音.数据增强.附加噪音和混响,以创建一个可以很好地适用于各种现实环境的模…
论文翻译:https://arxiv.53yu.com/abs/2009.13931 基于高效多任务卷积神经网络的残余回声抑制 摘要 在语音通信系统中,回声会降低用户体验,需要对其进行彻底抑制.提出了一种利用卷积神经网络实现实时残余回声抑制(RAES)的方法.在多任务学习的背景下,采用双语音检测器作为辅助任务来提高性能.该训练准则基于一种新的损失函数,我们称之为抑制损失,以平衡残余回声的抑制和近端信号的失真.实验结果表明,该方法能有效抑制不同情况下的残余回声. 关键字:残余回声抑制,卷积神经网络…
论文地址:https://graz.pure.elsevier.com/en/publications/acoustic-echo-cancellation-with-cross-domain-learning 具有跨域学习的声学回声消除 摘要: 本文提出了跨域回声控制器(CDEC),提交给 Interspeech 2021 AEC-Challenge.该算法由三个构建块组成:(i) 时延补偿 (TDC) 模块,(ii) 基于频域块的声学回声消除器 (AEC),以及 (iii) 时域神经网络 (…
论文地址:https://dl.acm.org/doi/abs/10.1145/3330393.3330399 基于深度神经网络的回声消除回归方法 摘要 声学回声消除器(AEC)的目的是消除近端传声器接收到的混合信号中的声学回声.传统的方法是使用自适应有限脉冲响应(FIR)滤波器来识别房间脉冲响应(RIR),因为房间脉冲响应对各种野外场景都不具有鲁棒性.在本文中,我们提出了一种基于深度神经网络的回归方法,从近端和远端混合信号中提取的特征直接估计近端目标信号的幅值谱.利用深度学习强大的建模和泛化能…
论文地址:https://arxiv.53yu.com/abs/2005.09237 自适应数字滤波与循环神经网络相结合的回声消除技术 摘要 回声消除(AEC)在语音交互中起关键作用.由于明确的数学原理和适应条件的智能特性,具有不同实现类型的自适应滤波器始终用于AEC,从而提供了可观的性能.但是,结果中会存在某种残留回波,包括估计和实际之间不匹配引起的线性残留以及主要由音频设备上的非线性分量引起的非线性残留.可以通过精细的结构和方法减少线性残留,但非线性残留难以抑制.尽管已经提出了一些非线性处理…
论文地址:https://ieeexplore.ieee.org/abstract/document/9306224 基于RNN的回声消除 摘要 本文提出了一种基于深度学习的语音分离技术的回声消除方法.传统上,AEC使用线性自适应滤波器来识别麦克风和扬声器之间的声脉冲响应.然而,当传统方法遇到非线性条件时,处理的结果并不理想.我们的实践利用了深度学习技术的优势,这有利于非线性处理.在所采用的RNN系统中,与传统的语音分离方法不同,我们增加了单讲特征,并为每个元素分配特定的权重.实验结果表明,该方…
论文地址:https://indico2.conference4me.psnc.pl/event/35/contributions/3367/attachments/779/817/Thu-1-10-6.pdf 利用循环神经网络抑制非线性残差回声 摘要 免提通信设备的声学前端会对扬声器和麦克风之间的线性回声路径带来各种失真.虽然放大器可能会引入一个无记忆的非线性,但从扬声器通过设备外壳传递到麦克风的机械振动会引起记忆的非线性,这很难弥补.这些失真极大地限制了线性AEC算法的性能.虽然针对个别用例…
论文地址:深度噪声抑制模型的性能优化 引用格式:Chee J, Braun S, Gopal V, et al. Performance optimizations on deep noise suppression models[J]. arXiv preprint arXiv:2110.0437…
我醉了呀,当我花一天翻译完后,发现已经网上已经有现成的了,而且翻译的比我好,哎,造孽呀,但是他写的是论文笔记,而我是纯翻译,能给读者更多的思想和理解空间,并且还有参考文献,也不错哈,反正翻译是写给自己看的 文章方向:语音分离, 论文地址:Conv-TasNet:超越理想的语音分离时频幅度掩蔽 博客地址:https://www.cnblogs.com/LXP-Never/p/14769751.html 论文代码:https://github.com/naplab/Conv-TasNet | htt…
论文地址:基于通用传递函数GSC和后置滤波的语音增强 博客作者:凌逆战 博客地址:https://www.cnblogs.com/LXP-Never/p/12232341.html 摘要 在语音增强应用中,麦克风阵列后置滤波可进一步减少波束形成器输出处的噪声成分.在麦克风阵列结构中,最近提出的通用传递函数广义旁瓣消除器(TF-GSC)在定向噪声场中显示出令人印象深刻的降噪能力,同时仍保持低语音失真.但是,在扩散噪声场中,可获得的降噪效果不明显.当噪声信号不稳定时,性能甚至会进一步下降. 在本文中…
论文地址:用于端到端语音增强的卷积递归神经网络 论文代码:https://github.com/aleXiehta/WaveCRN 引用格式:Hsieh T A, Wang H M, Lu X, et al. WaveCRN: An efficient convolutional recurrent neural network for end-to-end speech enhancement[J]. IEEE Signal Processing Letters, 2020, 27: 2149…
论文地址:基于神经网络的实时语音增强的加权语音失真损失 论文代码:https://github.com/GuillaumeVW/NSNet 引用:Xia Y, Braun S, Reddy C K A, et al. Weighted speech distortion losses for neural-network-based real-time speech enhancement[C]//ICASSP 2020-2020 IEEE International Conference on…
论文地址:一种低复杂度实时增强全频带语音的感知激励方法 论文代码 引用格式:A Perceptually Motivated Approach for Low-complexity, Real-time Enhancement of Fullband Speech 摘要 近几年来,基于深度学习的语音增强方法大大超过了传统的基于谱减法和谱估计的语音增强方法.许多新技术直接在短时傅立叶变换(STFT)域中操作,导致了很高的计算复杂度.在这项工作中,我们提出了PercepNet,这是一种高效的方法,它…
论文地址:DCCRN:用于相位感知语音增强的深度复杂卷积循环网络 论文代码:https://paperswithcode.com/paper/dccrn-deep-complex-convolution-recurrent-1 引用:Hu Y,Liu Y,Lv S,et al. DCCRN: Deep complex convolution recurrent network for phase-aware speech enhancement[J]. arXiv preprint arXiv:…