随着信息技术的发展,人们对实时通信的需求不断增加,并逐渐成为工作生活中不可或缺的一部分.每年海量的音视频通话分钟数对互联网基础设施提出了巨大的挑战.尽管目前全球的互联网用户绝大多数均处于良好的网络状况,但仍有不少地区处于极差的网络条件下,除此之外,即使在网络良好区域,也仍会存在弱网现象.那么如何在有限的带宽下提供高质量的音频体验就成为了一个非常重要的研究方向. 在过去的几十年间,语音或音频的编码技术都涉及大量特定领域的知识,例如语音生成模型.近些年,随着深度学习类算法的快速发展,逐渐涌现出了多种…