阿里云视频云视频编码与增强技术团队最新研究成果论文《基于可变形卷积的压缩视频质量增强网络》（Deformable Convolution Dense Network for Compressed Video Quality Enhancement）已被 ICASSP 2022 Image, Video & Multidimensional Signal Processing 主题会议接收，并受邀在今年5月的全球会议上向工业界和学术界进行方案报告。以下为技术成果的核心内容分享。

佳芙｜作者

背景

视频压缩算法是一种广泛应用于视频传播和视频存储的技术，它能够帮助节省带宽和节约存储空间，但同时也带来了视频质量下降的问题。压缩视频质量增强任务的目标便是减少由视频压缩带来的 artifacts，提升视频质量。

近些年来，基于多帧策略的方法成为了压缩视频质量增强任务中的主流，为了融合多帧信息，这些方法大多都严重依赖于光流估计，然而不准确且低效率的光流估计算法限制住了增强算法的性能。为了打破光流估计算法的限制，本文提出了一种结合了可变形卷积的稠密残差连接网络结构，这个网络结构无需在显式光流估计的帮助下就能完成从高质量帧到低质量帧的补偿。

利用可变形卷积来实现隐式的运动估计，并通过稠密残差连接来提高模型对误差的容忍度。具体而言，我们所提出的网络结构由两个模块组成，分别是利用可变形卷积来实现隐式估计的运动补偿模块，以及使用稠密残差连接来提高模型误差容忍度和信息保留度的质量增强模块，此外，本文还提出了一个新的边缘增强损失来增强物体边缘结构。在公开数据集上的实验结果表明，该方法显著优于其他 baseline 模型。

方法解析

受到 MFQE[1] 的启发，我们的方法也使用了 PQF 来作为参考帧。在 MFQE 中，PQF 被定义为质量高于其前后连续帧的视频帧，而在本文中，使用了 I 帧来作为 PQF，高质量的 PQF 可以为低质量的输入帧提供更准确的信息，从而更大限度地提升视频帧的质量。

图 1 展示了我们的模型结构，其中表示当前帧，和分别代表最近的前后 PQF，MC module 代表运动补偿模块，后方的多个密集残差块和卷积层组成了质量增强模块。

将 PQF（或）作为参考帧，运动补偿模块中的可变形卷积层可为其预测时序运动信息，并将参考帧补偿为输入帧的内容，此时的补偿帧、同时具有和输入帧相似的内容以及和参考帧、相近的质量。

接着，质量增强模块将融合多个参考帧的信息，最终输出一个增强帧。

此外，考虑到 artifacts 通常出现在物体边缘附近，我们针对性地提出了一个边缘增强损失，这个损失可以检测并强调视频帧中的物体边缘，帮助模型更好地重建被 artifacts 破坏掉的物体轮廓。

实验结果

峰值信噪比（PSNR）和结构相似性（SSIM）是最为广泛使用的图像质量评估指标，为了更方便直观地比较算法效果，本文使用了和，即增强帧相对于输入帧的 PSNR 和 SSIM 的增量来作为评估指标。

将我们的方法与其他 5 个 baseline 模型进行了比较，在 5 个对比方法中，ARCNN[2]、DnCNN[3] 和 RNAN[4] 都是压缩图像质量增强算法，能够独立地对每一个视频帧进行增强，但表现一般。MFQE 1.0 则是一个基于多帧策略和 PQF 的压缩视频质量增强算法，在 MFQE 1.0 的基础上，MFQE 2.0[5] 通过改进 PQF 检测器和质量增强模块来进一步提升了增强效果。从表 1 中可以看出，我们的方法可获得了比其他 5 个方法更高的和。特别地，对于 QP=37 的测试序列，我们相对于 MFQE2.0 的性能提升接近是 MFQE2.0 相对于 MFQE1.0 的提升的两倍。

图 2 展示了 5 种方法的主观效果，显然我们所提的方法可以将视频帧的质量提升得更高。以图 2 中的球、伞架和嘴巴为例，我们的方法恢复出了更清晰的物体边缘和更多的细节，这说明对于视频中快速运动的物体，比如球，我们网络中使用的金字塔结构的可变形卷积可以更准确地补偿运动，并且在质量增强模块的高效帮助和边缘增强损失的正确引导下，本文方法在边缘重建和细节补充上获得了更优表现。

基于该技术的深度研发，极大提升了阿里云视频云窄带高清产品对低质量视频的边缘细节修复效果，尤其是在人们比较关注的人脸区域提升效果更加显著，从而为用户提供更好的观看体验，该成果可广泛运用于短视频和直播场景中，如已应用于央视春晚、阿里健康等场景。此外，该项技术对中高质量视频也有很好的视觉提升效果，在同等带宽下，使整体画面变得更加清晰，未来该技术还将广泛应用于更多的场景以提升观看体验。

关于窄带高清

窄带高清是一项基于阿里云独家转码技术的媒体处理功能，采用阿里云独有算法，突破视频编码器能力上限，对转码技术进行升级和迭代，持续优化视频播放的流畅度与清晰度，实现在同等画质下更省流、在同等带宽下更高清的观看体验。窄带高清利用其低码高清、画质重生、场景定制、节省 50% 带宽成本等技术特点，为 2022 年北京“云上冬奥”和阿里云聚“Alibaba Cloud ME”提供了重要技术支撑。（窄带高清产品官网）

参考文献

[1]Ren Yang, Mai Xu, Zulin Wang, and Tianyi Li, “Multiframe quality enhancement for compressed video,” in Proceedings of the IEEE Conference on Computer Vision and Pattern Recognition, 2018, pp. 6664–6673.

[2]Chao Dong, Yubin Deng, Chen Change Loy, and Xiaoou Tang, “Compression artifacts reduction by a deep convolutional network,” in Proceedings of the IEEE International Conference on Computer Vision, 2015, pp. 576–584.

[3]Kai Zhang, Wangmeng Zuo, Yunjin Chen, Deyu Meng, and Lei Zhang, “Beyond a gaussian denoiser: Residual learning of deep cnn for image denoising,” IEEE Transactions on Image Processing, vol. 26, no. 7, pp. 3142–3155, 2017.

[4]Yulun Zhang, Kunpeng Li, Kai Li, Bineng Zhong, and Yun Fu, “Residual non-local attention networks for image restoration,” arXiv preprint arXiv:1903.10082, 2019.

[5] Zhenyu Guan, Qunliang Xing, Mai Xu, Ren Yang, Tie Liu, and Zulin Wang, “Mfqe 2.0: A new approach for multi-frame quality enhancement on compressed video,” IEEE Transactions on Pattern Analysis and Machine Intelligence, 2019.

「视频云技术」你最值得关注的音视频技术公众号，每周推送来自阿里云一线的实践技术文章，在这里与音视频领域一流工程师交流切磋。公众号后台回复【技术】可加入阿里云视频云产品技术交流群，和业内大咖一起探讨音视频技术，获取更多行业最新信息。

ICASSP 2022 | 前沿音视频成果分享：基于可变形卷积的压缩视频质量增强网络的更多相关文章

Bandicam视频录制技巧总结+小丸工具箱压缩视频解决视频体积问题
1.视频录制. 录制质量建议选择100,保证原文件的质量才能更好地保证渲染转码后输出视频的质量.音效这里就一个关键点,就是编码器默认的MPEG-1 L2,会导致会声会影渲染输出出错,程序强行关闭,Ve ...
开源倾情奉献：基于.NET打造IP智能网络视频监控系统（一）开放源代码
本文为 Dennis Gao 原创技术文章,发表于博客园博客,未经作者本人允许禁止任何形式的转载. 开源倾情奉献系列链接开源倾情奉献:基于.NET打造IP智能网络视频监控系统(一)开放源代码开源倾 ...
基于.NET打造IP智能网络视频监控系统
开源倾情奉献:基于.NET打造IP智能网络视频监控系统(一)开放源代码开源倾情奉献系列链接开源倾情奉献:基于.NET打造IP智能网络视频监控系统(一)开放源代码开源倾情奉献:基于.NET打造 ...
javaCV开发详解之2：推流器实现，推本地摄像头视频到流媒体服务器以及摄像头录制视频功能实现(基于javaCV-FFMPEG、javaCV-openCV)
javaCV系列文章: javacv开发详解之1:调用本机摄像头视频 javaCV开发详解之2:推流器实现,推本地摄像头视频到流媒体服务器以及摄像头录制视频功能实现(基于javaCV-FFMPEG.j ...
线上分享-- 基于DDD的.NET开发框架-ABP介绍
前言为了能够帮助.Net开发者开拓视野,更好的把最新的技术应用到工作中,我在3月底受邀到如鹏网.net训练营直播间为各位学弟学妹们进行ABP框架的直播分享.同时为了让更多的.NET开发者了解ABP框 ...
今日头条、抖音、西瓜、火山、微视、陌陌等自媒体平台小视频批量下载工具v1.1.0（视频搬运福利）
前言目前各大自媒体平台爆火,网络流量暴涨,各大自媒体平台的小视频为广大个广告主带来了如泉涌般的的视频流量,更给广大的自媒体小编带来了丰厚的利益回报,想要创做更多的自媒体内容着实不易,下面给广大的小视 ...
4G来临，短视频社交分享应用或井喷
因为工作的原因,接触短视频社交应用的时间相对较多,不管是自家的微视,还是别人家的Vine.玩拍.秒拍等,都有体验过.随着时间的推移,我愈发感受到有一股似曾相识的势能正在某个地方慢慢积聚,直到今天我才猛 ...
基于RTP的h.264视频传输系统设计（一）
一.H.264 的层次介绍 H.264 定义三个层次,每一个层次支持一组特定的编码功能.而且按照各个层次指定所指定的功能.基础层次(baselineprofile)支持I 帧和 P 帧[1]的帧内和帧 ...
ios开发视频播放后台下载功能实现：1，ios播放视频，包含基于AVPlayer播放器，2，实现下载，iOS后台下载（多任务同时下载，单任务下载，下载进度，下载百分比，文件大小，下载状态）（真机调试功能正常）
ABBPlayerKit ios开发视频播放后台下载功能实现 : 代码下载地址:https://github.com/niexiaobo/ABBPlayerKit github资料学习和下载地址:ht ...
手淘架构组最新实践 | iOS基于静态库插桩的⼆进制重排启动优化抖音研发实践：基于二进制文件重排的解决方案 APP启动速度提升超15% 编译期插桩
抖音研发实践:基于二进制文件重排的解决方案 APP启动速度提升超15% 原创 Leo 字节跳动技术团队 2019-08-09 https://mp.weixin.qq.com/s/Drmmx5JtjG ...

随机推荐

LabVIEW基于机器视觉的实验室设备管理系统(3)
目录行动计划创建用户信息数据库后面板连线初始化确认修改确认id 判断旧密码是否正确判断两次输入的新密码是否相同修改用户数据库中的密码结尾效果演示上一期我们完成了欢迎登录和信息查询 ...
PLC 和Modbus/串口设备现场总线通信及短信报警解决方案
在实现 Modbus 设备与 PROFIBUS DP 协议 PLC 通讯的同时可以在手机端实时的接收报警短信,使客户足不出户了解设备与 PLC 的状态,及时处理现场中的问题. 系统组成 Modbus ...
品牌全渠道营销系统如何与不同经销商ERP打通
品牌商在与各经销商ERP系统打通方面面临的挑战.传统的ERP系统往往使得数据收集和合作变得繁琐且低效,导致市场响应迟缓,影响整体的供应链管理和市场决策.我们的解决方案旨在破解这一难题,提供一个全渠道营 ...
Echarts图表基本参数设置说明
ECharts 是一款强大的数据可视化库,可以通过 JavaScript 构建交互式和动态的图表.在使用 ECharts 进行图表绘制时,我们可以通过设置各种参数来达到我们想要的效果.下面是对 ECh ...
【VMware vSAN】主机之间网络性能测试，提示“无法运行网络性能测试。请稍后重试。”的处理过程。
vSAN集群监控,有一个主动测试功能,里面可以针对vSAN主机进行虚拟机创建测试.网络性能测试等. 官方解释: 虚拟机创建测试通常需要 20 至 40 秒时间,在超时情况下最长需要 180 秒时间.将 ...
SpringBoot内容协商机制
1.是什么? SpringBoot内容协商机制是一种实现了内容协商(Content Negotiation)的Web服务器,它可以根据客户端请求的不同,将响应返回给客户端. 在传统的Web服务器中,如 ...
华企盾DSC：wps个人模式无策略组新建的文件仍然加密
解决方法:右键wps安装目录手动解密即可(原因:wps模板被加密导致)
华企盾DSC编辑文件不加密常见问题
1.先查看客户端日志主进程是否是加密进程.日志中是不是勾选智能半透明.加密类型是否有添加 2.用procmon监控保存的文件找出writefile的进程是否有添加,进程树是否有父进程,加密类型是否正确 ...
传统GIS与数字孪生结合带来的改变
传统的地理信息系统(GIS)在地理数据的收集.存储和分析方面发挥着重要作用,而数字孪生技术则通过虚拟模型的构建与真实世界进行交互和模拟.将传统GIS与数字孪生技术相结合,不仅增强了地理数据的可视化和分 ...
当数字孪生系统接入CesiumJS，将为智慧城市项目带来怎样的改变？
数字孪生系统接入CesiumJS的契机,正是智慧城市项目的需要.因为许多智慧城市项目中包含了大量地形.倾斜摄影.DOM.DEM等GIS数据,那么为了能够在数字孪生系统中导入这些GIS数据,同时让这些数 ...

ICASSP 2022 | 前沿音视频成果分享：基于可变形卷积的压缩视频质量增强网络

背景

方法解析

实验结果

关于窄带高清

ICASSP 2022 | 前沿音视频成果分享：基于可变形卷积的压缩视频质量增强网络的更多相关文章

随机推荐

热门专题