发表在2017年DCC。

这篇文章立意很简单,方法也很简单,但是做得早、效果好、引用量也不错(40+)。

指标:在HEVC的intra、LDP、LDB和RA模式下,BDBR平均可以下降5%、6.4%、5.3%和5.5%。
由于是解码端(decoder-end)的网络,因此可以进一步解决inloop-filter没能解决的块效应和振铃效应等压缩伪影。

以下摘一些精彩的叙述,同时重点看清楚实施细节。

精彩叙述

  • 提升压缩质量是视频编码的永恒主题。然而,无论我们如何修改编码器,视频冗余已经很难下降。

  • 在解码端增强视频质量,等价于提升了压缩效率。

  • 这种方法受益于端到端训练,并且可以拓展至视频压缩标准。

  • 由于实际的有损压缩标准都不是理论最优的,因此就存在信息冗余可以被继续挖掘和利用。

  • JPEG、H264、HEVC等方法之所以没能突破压缩率极限,就是因为它们没有利用外部信息或先验。

  • 我们无需修改编码器。

  • 作者将那些传统的优化方法称为compressive-sensing-based methods。它们通常不考虑外部先验,但仍然能取得一定效果,说明冗余仍然是存在的。

细节

DCAD:Deep CNN-based Auto Decoder。

  • 训练目标:MSE损失。

  • 网络结构:10层\(64 \times 3 \times 3\)滤波器堆叠,ReLU激活函数(除了最后一层),全局残差网络,各层补零。

  • 作者试过20层,效果并没有更好。

  • 在选择训练块时,作者是根据TU分割信息选择的。作者尽量使得每一种TU分割的数量相同,即均匀出现在训练集中。

  • 对于高QP模型,作者将低QP模型迁移过来,以更好地学习。

  • 图像为YCbCr三通道,只在亮度通道上增强。

  • HM 16.0压缩,考虑了QP = 22,27,32,37。

  • AdaDelta优化方法比学习率衰减方法更好。关于四个QP的初始学习率分别设为1,0.1,0.1和0.01。

  • 最后一层的学习率是全局的1/10。

Paper | A novel deep learning-based method of improving coding efficiency from the decoder-end for HEVC的更多相关文章

  1. 【RS】Deep Learning based Recommender System: A Survey and New Perspectives - 基于深度学习的推荐系统:调查与新视角

    [论文标题]Deep Learning based Recommender System: A Survey and New Perspectives ( ACM Computing Surveys  ...

  2. Predicting effects of noncoding variants with deep learning–based sequence model | 基于深度学习的序列模型预测非编码区变异的影响

    Predicting effects of noncoding variants with deep learning–based sequence model PDF Interpreting no ...

  3. 论文翻译:2021_Towards model compression for deep learning based speech enhancement

    论文地址:面向基于深度学习的语音增强模型压缩 论文代码:没开源,鼓励大家去向作者要呀,作者是中国人,在语音增强领域 深耕多年 引用格式:Tan K, Wang D L. Towards model c ...

  4. 论文笔记: Deep Learning based Recommender System: A Survey and New Perspectives

    (聊两句,突然记起来以前一个学长说的看论文要能够把论文的亮点挖掘出来,合理的进行概括23333) 传统的推荐系统方法获取的user-item关系并不能获取其中非线性以及非平凡的信息,获取非线性以及非平 ...

  5. Paper Reading——LEMNA:Explaining Deep Learning based Security Applications

    Motivation: The lack of transparency of the deep  learning models creates key barriers to establishi ...

  6. Paper List ABOUT Deep Learning

    Deep Learning 方向的部分 Paper ,自用.一 RNN 1 Recurrent neural network based language model RNN用在语言模型上的开山之作 ...

  7. 个性探测综述阅读笔记——Recent trends in deep learning based personality detection

    目录 abstract 1. introduction 1.1 个性衡量方法 1.2 应用前景 1.3 伦理道德 2. Related works 3. Baseline methods 3.1 文本 ...

  8. paper 147:Deep Learning -- Face Data Augmentation(一)

    1. 在深度学习中,当数据量不够大时候,常常采用下面4中方法:  (1)人工增加训练集的大小. 通过平移, 翻转, 加噪声等方法从已有数据中创造出一批"新"的数据.也就是Data ...

  9. Deep Learning 12_深度学习UFLDL教程:Sparse Coding_exercise(斯坦福大学深度学习教程)

    前言 理论知识:UFLDL教程.Deep learning:二十六(Sparse coding简单理解).Deep learning:二十七(Sparse coding中关于矩阵的范数求导).Deep ...

随机推荐

  1. ubuntu命令查看英伟达显卡型号

    在终端输入如下命令:nvidia-smi

  2. java.lang.ClassNotFoundException: XXX (no security manager: RMI class loader disabled)

    在搞RMI远程发布,consumer去获取rmi远程服务的代理对象的时候出现了如下的错误 问题发现: 由于我发布的对象的包路径和获取的对象的包路径不一致,导致了这样的问题 解决方案: 包路径改为一致就 ...

  3. Java开发桌面程序学习(七)——ImageView设置图片以及jar包读取fxml文件

    ImageView设置图片 JavaFx的ImageView,设置图片不能直接通过属性设置,只能通过代码来设置 ImageView设置图片 首先,我们让fxml对应的那个controller的java ...

  4. Android Studio 提高开发效率的插件

    好久没有更新博客了,最近搞个listview搞得半死不活的,心累~~ 今天带来的是Android Studio插件的整理,全是我已经安装使用的,写这篇博文的目的也是因为我怕我自己给忘记怎么用(尴尬) ...

  5. RocketMQ(4)---RocketMQ核心配置讲解

    RocketMQ核心配置讲解 RocketMQ的核心配置在broker.conf配置文件里,下面我们来分析下它. 一.broker.conf配置 下面只列举一些常用的核心配置讲解. 1.broker. ...

  6. windows server 2008 r2 安装 vs2017 无法进入安装界面问题解决方法

    在 windows server 2008 r2 版本操作系统上安装 vs2017 经常出现下载进度条结束后没有任何反应问题,一般是因为安装程序兼容性造成的,解决方案如下: 将 C:\Program ...

  7. go-函数和错误处理

    函数基本语法 func 函数名(形参列表)(返回值列表){ 执行语句 return 返回值列表 }//返回值可以没有可以有多个可以有一个 包 引入 为了解决两个程序员取得函数名同名的情况 原理 本质就 ...

  8. Python笔记:设计模式之facade模式

    facade模式,即门面模式,也称外观模式,这个模式的核心思想是使用facade对象为外部客户端提供一个统一的访问一组子系统的接口,即客户端不会直接与各个子系统交互,而是通过facade对象与各个子系 ...

  9. RandomAccessFile实现简易记事本工具操作

    package seday03; import java.io.IOException; import java.io.RandomAccessFile; import java.util.Scann ...

  10. C++ this指针的理解和作用

    01 C++ 程序到 C 程序的翻译 要想理解 C++ 的 this 指针,我们先把下面的 C++ 代码转换成 C 的代码 class Car { public: int m_price; // 成员 ...