Paper | A novel deep learning-based method of improving coding efficiency from the decoder-end for HEVC
发表在2017年DCC。
这篇文章立意很简单,方法也很简单,但是做得早、效果好、引用量也不错(40+)。
指标:在HEVC的intra、LDP、LDB和RA模式下,BDBR平均可以下降5%、6.4%、5.3%和5.5%。
由于是解码端(decoder-end)的网络,因此可以进一步解决inloop-filter没能解决的块效应和振铃效应等压缩伪影。
以下摘一些精彩的叙述,同时重点看清楚实施细节。
精彩叙述
提升压缩质量是视频编码的永恒主题。然而,无论我们如何修改编码器,视频冗余已经很难下降。
在解码端增强视频质量,等价于提升了压缩效率。
这种方法受益于端到端训练,并且可以拓展至视频压缩标准。
由于实际的有损压缩标准都不是理论最优的,因此就存在信息冗余可以被继续挖掘和利用。
JPEG、H264、HEVC等方法之所以没能突破压缩率极限,就是因为它们没有利用外部信息或先验。
我们无需修改编码器。
作者将那些传统的优化方法称为compressive-sensing-based methods。它们通常不考虑外部先验,但仍然能取得一定效果,说明冗余仍然是存在的。
细节
DCAD:Deep CNN-based Auto Decoder。
训练目标:MSE损失。
网络结构:10层\(64 \times 3 \times 3\)滤波器堆叠,ReLU激活函数(除了最后一层),全局残差网络,各层补零。
作者试过20层,效果并没有更好。
在选择训练块时,作者是根据TU分割信息选择的。作者尽量使得每一种TU分割的数量相同,即均匀出现在训练集中。
对于高QP模型,作者将低QP模型迁移过来,以更好地学习。
图像为YCbCr三通道,只在亮度通道上增强。
HM 16.0压缩,考虑了QP = 22,27,32,37。
AdaDelta优化方法比学习率衰减方法更好。关于四个QP的初始学习率分别设为1,0.1,0.1和0.01。
最后一层的学习率是全局的1/10。
Paper | A novel deep learning-based method of improving coding efficiency from the decoder-end for HEVC的更多相关文章
- 【RS】Deep Learning based Recommender System: A Survey and New Perspectives - 基于深度学习的推荐系统:调查与新视角
[论文标题]Deep Learning based Recommender System: A Survey and New Perspectives ( ACM Computing Surveys ...
- Predicting effects of noncoding variants with deep learning–based sequence model | 基于深度学习的序列模型预测非编码区变异的影响
Predicting effects of noncoding variants with deep learning–based sequence model PDF Interpreting no ...
- 论文翻译:2021_Towards model compression for deep learning based speech enhancement
论文地址:面向基于深度学习的语音增强模型压缩 论文代码:没开源,鼓励大家去向作者要呀,作者是中国人,在语音增强领域 深耕多年 引用格式:Tan K, Wang D L. Towards model c ...
- 论文笔记: Deep Learning based Recommender System: A Survey and New Perspectives
(聊两句,突然记起来以前一个学长说的看论文要能够把论文的亮点挖掘出来,合理的进行概括23333) 传统的推荐系统方法获取的user-item关系并不能获取其中非线性以及非平凡的信息,获取非线性以及非平 ...
- Paper Reading——LEMNA:Explaining Deep Learning based Security Applications
Motivation: The lack of transparency of the deep learning models creates key barriers to establishi ...
- Paper List ABOUT Deep Learning
Deep Learning 方向的部分 Paper ,自用.一 RNN 1 Recurrent neural network based language model RNN用在语言模型上的开山之作 ...
- 个性探测综述阅读笔记——Recent trends in deep learning based personality detection
目录 abstract 1. introduction 1.1 个性衡量方法 1.2 应用前景 1.3 伦理道德 2. Related works 3. Baseline methods 3.1 文本 ...
- paper 147:Deep Learning -- Face Data Augmentation(一)
1. 在深度学习中,当数据量不够大时候,常常采用下面4中方法: (1)人工增加训练集的大小. 通过平移, 翻转, 加噪声等方法从已有数据中创造出一批"新"的数据.也就是Data ...
- Deep Learning 12_深度学习UFLDL教程:Sparse Coding_exercise(斯坦福大学深度学习教程)
前言 理论知识:UFLDL教程.Deep learning:二十六(Sparse coding简单理解).Deep learning:二十七(Sparse coding中关于矩阵的范数求导).Deep ...
随机推荐
- ubuntu命令查看英伟达显卡型号
在终端输入如下命令:nvidia-smi
- java.lang.ClassNotFoundException: XXX (no security manager: RMI class loader disabled)
在搞RMI远程发布,consumer去获取rmi远程服务的代理对象的时候出现了如下的错误 问题发现: 由于我发布的对象的包路径和获取的对象的包路径不一致,导致了这样的问题 解决方案: 包路径改为一致就 ...
- Java开发桌面程序学习(七)——ImageView设置图片以及jar包读取fxml文件
ImageView设置图片 JavaFx的ImageView,设置图片不能直接通过属性设置,只能通过代码来设置 ImageView设置图片 首先,我们让fxml对应的那个controller的java ...
- Android Studio 提高开发效率的插件
好久没有更新博客了,最近搞个listview搞得半死不活的,心累~~ 今天带来的是Android Studio插件的整理,全是我已经安装使用的,写这篇博文的目的也是因为我怕我自己给忘记怎么用(尴尬) ...
- RocketMQ(4)---RocketMQ核心配置讲解
RocketMQ核心配置讲解 RocketMQ的核心配置在broker.conf配置文件里,下面我们来分析下它. 一.broker.conf配置 下面只列举一些常用的核心配置讲解. 1.broker. ...
- windows server 2008 r2 安装 vs2017 无法进入安装界面问题解决方法
在 windows server 2008 r2 版本操作系统上安装 vs2017 经常出现下载进度条结束后没有任何反应问题,一般是因为安装程序兼容性造成的,解决方案如下: 将 C:\Program ...
- go-函数和错误处理
函数基本语法 func 函数名(形参列表)(返回值列表){ 执行语句 return 返回值列表 }//返回值可以没有可以有多个可以有一个 包 引入 为了解决两个程序员取得函数名同名的情况 原理 本质就 ...
- Python笔记:设计模式之facade模式
facade模式,即门面模式,也称外观模式,这个模式的核心思想是使用facade对象为外部客户端提供一个统一的访问一组子系统的接口,即客户端不会直接与各个子系统交互,而是通过facade对象与各个子系 ...
- RandomAccessFile实现简易记事本工具操作
package seday03; import java.io.IOException; import java.io.RandomAccessFile; import java.util.Scann ...
- C++ this指针的理解和作用
01 C++ 程序到 C 程序的翻译 要想理解 C++ 的 this 指针,我们先把下面的 C++ 代码转换成 C 的代码 class Car { public: int m_price; // 成员 ...