h.264 率失真优化
Rate Distortion Optimization
搜索时,一个不可避免的问题就是如何对mv进行比较,从而得到最优
对于同一压缩算法来说,码率越高表示图像质量越好、失真越小,但是码率越高要求更大的存储空间,也会增加网络传输的压力。因此在码率与失真中找出平衡点,使压缩效果最优,这种方法叫做R-D Optimization(码率失真优化)
典型的高码率下,码率与失真关系(R-D关系式)为
$R(D) = {\alpha}{ln(\frac{\delta^2}{D})}$
$R$为码率,$\alpha$为系数,$\delta^2$为方差,$D$为失真。
方差越大,意味着图像细节越多,因此码率也会越大;失真越大,意味着图像由于压缩所损失的细节越多,那么码率越小。

R-D曲线
R与D好比鱼与熊掌,取一方,必然会舍去另一方,两者不可能都取得最佳,因此如何取舍,就需要权衡利弊。最好的方法,就是看哪个权重大,哪个的比例就大,权重小的比例小,这就是拉格朗日方法。
拉格朗日代价函数为:
$J = D + \lambda_{MODE} \cdot R$
要使得代价最小,那么在其导数为0处有最小值:
$\frac{dJ}{dR} = \frac{dD}{dR} + \lambda_{MODE} = 0$
现假设D与R的权重比为$\lambda_{MODE}$,并假设上方点A为根据上方结论得到的最佳位置,那么点A处有斜率:
$k = -\lambda_{MODE} = \frac{dD}{dR}$
又因为可以通过对R-D关系式求导,然后整理得:
$\frac{dD}{dR} = -\frac{D}{\alpha}$
因此,在R-D最优点处有:
$\lambda_{MODE} = \frac{D}{\alpha}$
另外,在典型的高码率下,失真近似满足公式:
$D = \frac{ ( 2 \cdot QUANT )^2}{12}$
把D代入上述公式,得到:
$\lambda_{MODE} = \frac{1}{3\alpha}\cdot QUANT^2$
即:
$\lambda_{MODE} = \zeta\cdot QUANT^2$
最终可以通过函数拟合得到$\zeta = 0.85$,在h.264中,当存在B帧编码时$\zeta = 0.68$,则有:
$\begin{align*}
\lambda_{MODE}
&= 0.68\cdot QUANT^2 \\
&= 0.68 \cdot (2^\frac{QP - 12}{6})^2 \\
&= 0.68\cdot 2^\frac{QP - 12}{3}
\end{align*}$
注:QP在这里减去12是因为在h.264早期只有40个QP,而现在由52个QP
由于上面计算的时候用的是$\delta^2$(方差),即SSD,但是实际上h.264计算用的是
$\begin{align*}
SAD &= \sum_{(x,y)\in A}\left | s[x,y] - s'[x,y]\right | \\
SSD &= \sum_{(x,y)\in A}\left | s[x,y] - s'[x,y]\right |^2
\end{align*}$
那么
$\lambda_{MOTION} = \sqrt{\lambda_{MODE}}$
为了方便计算,在一般h.264的编码器中采用的都是
$D = SAD$
而R则需要知道当前所选择的mv与ref所占用的bit,而这些都是可以事先计算出来的,在JM中不同的mv与ref所占的bit都在编码前被初始化了,用数组存储起来。mv与ref采用的都是哥伦布编码。
$R = Bit_{mv} + Bit_{ref}$
h.264 率失真优化的更多相关文章
- H.264学习笔记3——帧间预测
帧间预测主要包括运动估计(运动搜索方法.运动估计准则.亚像素插值和运动矢量估计)和运动补偿. 对于H.264,是对16x16的亮度块和8x8的色度块进行帧间预测编码. A.树状结构分块 H.264的宏 ...
- H.264开源解码器评测
转自:http://wmnmtm.blog.163.com/blog/static/38245714201142883032575/ 要播放HDTV,就首先要正确地解开封装,然后进行视频音频解码.所以 ...
- 【图像处理】H.264开源解码器评测
转自:http://wmnmtm.blog.163.com/blog/static/38245714201142883032575/ 要播放HDTV,就首先要正确地解开封装,然后进行视频音频解码.所以 ...
- x264 - 高品质 H.264 编码器
转自:http://www.5i01.cn/topicdetail.php?f=510&t=3735840&r=18&last=48592660 H.264 / MPEG-4 ...
- H.264简介
H.264/MPEG-4 AVC (H.264) 是1995年自MPEG-2视频压缩标准发布以后最新的, 最有前途的视频压缩标准. H.264是由ITU-U和ISO/IEC联合开发组共同开发的最新国际 ...
- 转:MediaCoder H.264格式编码参数设置及详解
转: http://mediacoder.com.cn/node/81 由于现在大部分视频转码都选择H.264格式进行编码,同时CUDA编码的画质还达不到x264软编码的质量(如果你对画质无要求,可以 ...
- H.264视频的RTP荷载格式
Status of This Memo This document specifies an Internet standards track protocol for the Internet ...
- 音视频编解码技术(一):MPEG-4/H.264 AVC 编解码标准
一.H264 概述 H.264,通常也被称之为H.264/AVC(或者H.264/MPEG-4 AVC或MPEG-4/H.264 AVC) 1. H.264视频编解码的意义 H.264的出现就是为了创 ...
- h.264并行熵解码
在前面讨论并行解码的章节中,我们专注于讨论解码的宏块重建部分,甚至把宏块重建描述成宏块解码,这是因为在解码工作中,宏块重建确实占了相当大的比重,不过解码还包含其它的部分,按照解码流程可粗略分为: 读取 ...
随机推荐
- linux防火墙 基础知识
转 http://drops.wooyun.org/tips/1424 iptables介绍 linux的包过滤功能,即linux防火墙,它由netfilter 和 iptables 两个组件组成. ...
- 如何下载coursera视频
国内观看Coursera非常卡顿,经常播放到一半就卡死了,不知道什么原因.因此只能想办法下载下来之后再看. Github上有一个脚本点击打开链接,提供整门课程的下载服务.用着还是非常方便的,使用方法如 ...
- linux两台server远程copy文件
1.将远程机器的文件copy到本地 scp -r root@10.10.15.25:/bea /gg 将远程的/bea copy到/gg以下 -r Recursively copy ent ...
- Android代码混淆
混淆器(ProGuard) --- 混淆器通过删除从未用过的代码和使用晦涩名字重命名类.字段和方法,对代码进行压缩,优化和混淆.结果是一个比較小的.apk文件,该文件比較难进行逆向project.因此 ...
- android EditText中的inputType
android 1.5以后添加了软件虚拟键盘的功能,所以在输入提示中将会有对应的软键盘模式 android中inputType属性在EditText输入值时启动的虚拟键盘的风格有着重要的作用.这也大大 ...
- DM8168 坎坷硬件之路(DDR3)
新做了8168板,调试DDR3的时候EMIF0遇到了个别数据位出错的问题 DDR3 128MB*8=1GB 我为了測试DDR3的所有空间,把地址存到DDR3中,就是*pdata++=(Uint32)p ...
- Qt 学习之路:视图选择 (QItemSelectionModel)
选择是视图中常用的一个操作.在列表.树或者表格中,通过鼠标点击可以选中某一项,被选中项会变成高亮或者反色.在 Qt 中,选择也是使用了一种模型.在 model/view 架构中,这种选择模型提供了一种 ...
- 黑白图像(DFS)
输入一个n*n的黑白图像(1表示黑色,0表示白色),任务是统计其中八连块的个数.如果两个黑格子有公共边或者公共顶点,就说它们属于同一个八连块.如图6-11所示的图形有3个八连块. 图6-11 拥有3 ...
- EXT ajax简单实例
转载:http://www.cnblogs.com/xiepeixing/archive/2012/10/24/2736751.html EXT ajax request是ext中对于ajax请求的实 ...
- (转)DEDECMS 如何让栏目外部链接在新窗口中打开
近遇到一个问题,就是dedecms的导航,是用外部链接的,但是原窗口打开不好看,新窗口打开好点.OK,放狗... 1. 查找模板中的head.htm将<li><a href='[fi ...