Paper | A novel deep learning-based method of improving coding efficiency from the decoder-end for HEVC
发表在2017年DCC。
这篇文章立意很简单,方法也很简单,但是做得早、效果好、引用量也不错(40+)。
指标:在HEVC的intra、LDP、LDB和RA模式下,BDBR平均可以下降5%、6.4%、5.3%和5.5%。
由于是解码端(decoder-end)的网络,因此可以进一步解决inloop-filter没能解决的块效应和振铃效应等压缩伪影。
以下摘一些精彩的叙述,同时重点看清楚实施细节。
精彩叙述
提升压缩质量是视频编码的永恒主题。然而,无论我们如何修改编码器,视频冗余已经很难下降。
在解码端增强视频质量,等价于提升了压缩效率。
这种方法受益于端到端训练,并且可以拓展至视频压缩标准。
由于实际的有损压缩标准都不是理论最优的,因此就存在信息冗余可以被继续挖掘和利用。
JPEG、H264、HEVC等方法之所以没能突破压缩率极限,就是因为它们没有利用外部信息或先验。
我们无需修改编码器。
作者将那些传统的优化方法称为compressive-sensing-based methods。它们通常不考虑外部先验,但仍然能取得一定效果,说明冗余仍然是存在的。
细节
DCAD:Deep CNN-based Auto Decoder。

训练目标:MSE损失。
网络结构:10层\(64 \times 3 \times 3\)滤波器堆叠,ReLU激活函数(除了最后一层),全局残差网络,各层补零。
作者试过20层,效果并没有更好。
在选择训练块时,作者是根据TU分割信息选择的。作者尽量使得每一种TU分割的数量相同,即均匀出现在训练集中。
对于高QP模型,作者将低QP模型迁移过来,以更好地学习。
图像为YCbCr三通道,只在亮度通道上增强。
HM 16.0压缩,考虑了QP = 22,27,32,37。
AdaDelta优化方法比学习率衰减方法更好。关于四个QP的初始学习率分别设为1,0.1,0.1和0.01。
最后一层的学习率是全局的1/10。
Paper | A novel deep learning-based method of improving coding efficiency from the decoder-end for HEVC的更多相关文章
- 【RS】Deep Learning based Recommender System: A Survey and New Perspectives - 基于深度学习的推荐系统:调查与新视角
[论文标题]Deep Learning based Recommender System: A Survey and New Perspectives ( ACM Computing Surveys ...
- Predicting effects of noncoding variants with deep learning–based sequence model | 基于深度学习的序列模型预测非编码区变异的影响
Predicting effects of noncoding variants with deep learning–based sequence model PDF Interpreting no ...
- 论文翻译:2021_Towards model compression for deep learning based speech enhancement
论文地址:面向基于深度学习的语音增强模型压缩 论文代码:没开源,鼓励大家去向作者要呀,作者是中国人,在语音增强领域 深耕多年 引用格式:Tan K, Wang D L. Towards model c ...
- 论文笔记: Deep Learning based Recommender System: A Survey and New Perspectives
(聊两句,突然记起来以前一个学长说的看论文要能够把论文的亮点挖掘出来,合理的进行概括23333) 传统的推荐系统方法获取的user-item关系并不能获取其中非线性以及非平凡的信息,获取非线性以及非平 ...
- Paper Reading——LEMNA:Explaining Deep Learning based Security Applications
Motivation: The lack of transparency of the deep learning models creates key barriers to establishi ...
- Paper List ABOUT Deep Learning
Deep Learning 方向的部分 Paper ,自用.一 RNN 1 Recurrent neural network based language model RNN用在语言模型上的开山之作 ...
- 个性探测综述阅读笔记——Recent trends in deep learning based personality detection
目录 abstract 1. introduction 1.1 个性衡量方法 1.2 应用前景 1.3 伦理道德 2. Related works 3. Baseline methods 3.1 文本 ...
- paper 147:Deep Learning -- Face Data Augmentation(一)
1. 在深度学习中,当数据量不够大时候,常常采用下面4中方法: (1)人工增加训练集的大小. 通过平移, 翻转, 加噪声等方法从已有数据中创造出一批"新"的数据.也就是Data ...
- Deep Learning 12_深度学习UFLDL教程:Sparse Coding_exercise(斯坦福大学深度学习教程)
前言 理论知识:UFLDL教程.Deep learning:二十六(Sparse coding简单理解).Deep learning:二十七(Sparse coding中关于矩阵的范数求导).Deep ...
随机推荐
- LeetCode 705:设计哈希集合 Design HashSet
题目: 不使用任何内建的哈希表库设计一个哈希集合 具体地说,你的设计应该包含以下的功能 add(value):向哈希集合中插入一个值. contains(value) :返回哈希集合中是否存在这个值. ...
- activiti5初识
因工作需要,接手新的项目,其中用到了activiti实现的工作流,特意去大致学习下,特此记录下. 1.acticiti5框架说明及表结构介绍 Activiti5工作流引擎框架: 它实际上是一个java ...
- solr集群Server refused connection at: http://127.0.0.1:6060/solr/ego 注册zookeepr自动使用内网ip
引导:适用于各种注册服务,zookeeper和被注册的服务器不在同一ip上,产生的注册了127.0.0.1本地ip地址 在使用solr集群操作的时候,报了如下的错误 org.apache.solr.c ...
- WPF中Expander的用法和控件模板详解
一.Expander的用法 在WPF中,Expander是一个很实用的复合控件,可以很方便的实现下拉菜单和导航栏等功能.先介绍简单的用法,而后分析他的控件模板. <Window.Resource ...
- Java生鲜电商平台-微服务架构概述
Java生鲜电商平台-微服务架构概述 单体架构存在的问题 在传统的软件技术架构系统中,基本上将业务功能集中在单一应用内,或者是单一进程中.尽管现代化的软件架构理论以及设计原则已推广多年,但实际技术衍化 ...
- 在Vue-cli3.x中引入element-ui的新方式
今天登上element官网,发现element对vue-cli3.x的项目做了特殊定制: 这意味着即使是按需引入,也无需像过去那样手动安装babel-plugin-component,配置babel. ...
- 移动应用性能测试剖析以及PerfDog与其他工具的对比分析11.22
商业转载请联系腾讯WeTest获得授权,非商业转载请注明出处. 导语: 在IT.互联网及游戏行业,软件测试都是一个重要且不可或缺的过程,测试是软件生命周期中的一个重要阶段,是软件质量保证的关键步骤.目 ...
- 用canvas画一个时钟
<!DOCTYPE html> <html lang="en"> <head> <meta charset="UTF-8&quo ...
- EGit(Git Eclipse Plugin)使用
https://shihlei.iteye.com/blog/2124411 前言: 1)Git于SVN的不同 Git是分布式数据库,本地创建仓库,即可在本地完成版本控制(等价于SVN在本地 ...
- mssql sqlserver 数据类型sql_variant简介说明
转自: http://www.maomao365.com/?p=9712 摘要: 下文讲述sqlserver中sql_variant数据类型定义.赋值.应用的相关说明,如下所示: 实验环境:sql ...