基于内容的自适应变长编码[CAVLC]

基于内容自适应的变长编码方式用于编码zigzag顺序扫描的4x4和2x2残差变换系数块。

1、编码系数个数和零序列(coeff_token):

coeff_token = <TotalCoeff, TrailingOnes>;

TotalCoeff = 编码非零系数总数; [0 , 16]

TrailingOnes = 特殊处理的+/-1个数; [0 , 3]

2、编码每个TrailingOne的符号:

倒序，从高频开始向前编码TrailingOne符号，每个符号一位，0为正，1为负，最多为3个。

3、编码余下非零系数的幅值:

编码顺序：倒序，从高频开始向前编码直到DC系数，每个幅值码字level[i]包含一个幅值前缀level_prefix和一个幅值后缀level_suffix。

level[i]: Level为实际系数的幅值。但有个例外：

当TrailingOnes<3时，那么被编码的第一个非T1 幅值肯定不是+/-1（否则将算作T1）。这个幅值如果为负就加1（如果为正就减1），例如+/-2 被映射成+/-1, +/-3映射成+/-2进行编码，这样可以用较短的变长码.

levelCode:

如果level[i]为正, levelCode = (Level[i] << 1) - 2;

如果 level[i]为负, levelCode = -(Level[i] << 1) - 1;

计算level_prefix：

编码时:

level_prefix = levelCode / (1 << suffixLength);

根据level_prefix查标准表9-6得到码字

解码时:

从比特流的当前位置开始读取，计算为0的leading bits数量。0的长度即为level_prefix值，对应关系可察看标准文档中表9-6。

计算suffixLength:

suffixLength为0-6 比特，其长度是自适应变换的。

suffixLength 增长过程：

1、初始化suffixLength = 0 ; 如果有超过10个非零系数，并且少于3个TailingOnes，这时suffixLength = 1；

2、编码最高频的非零系数；

3、如果这个系数的幅值大于一定的阈值，则增长suffixLength

当前suffixLength	增加suffixLength的系数阈值
0	0
1	3
2	6
3	12
4	24
5	48
6	N/A

更新suffixLength函数如下：

if(suffixLength == 0)

++suffixLength;

else if(level[i] > (3<<suffixLength-1) && suffixLength < 6)

++suffixLength;

计算levelSuffixSize: （后缀是长度为levelSuffixSize的无符号整数)

除了以下两种情况levelSuffixSize等于suffixLength：

1、level_prefix == 14 && suffixLength == 0 时, levelSuffixSize = 4;

2、level_prefix >= 15 时，levelSuffixSize = level_prefix – 3;

4、编码最后一个非零系数前零的个数

使用VLC编码最高频非零系数前所有零的个数

total_zeros:既为最高非零系数前所有零的个数;编码表见标准表9-7;表9-8;表9-9

5、编码每个零游程

zerosLeft: 当前系数之前所有的零的个数

run_before: 紧接当前系数前的零个数

CAVLC算法的具体过程(参考Sunrise的总结)

编码过程:

假设有一个4*4数据块

{

0, 3, -1, 0,

0, -1, 1, 0,

1, 0, 0, 0,

0, 0, 0, 0

}

数据重排列:0,3,0,1,-1,-1,0,1,0......

1) 初始值设定:

非零系数的数目(TotalCoeffs) = 5;

拖尾系数的数目(TrailingOnes)= 3;

最后一个非零系数前零的数目(Total_zeros) = 3;

变量NC=1;

(说明:NC值的确定:色度的直流系数NC=-1;其他系数类型NC值是根据当前块左边4*4块的非零系数数目(NA)当前块上面4*4块的非零系数数目(NB)求得的,见毕厚杰书P120表6.10)

suffixLength = 0;

i = TotalCoeffs = 5;

2) 编码coeff_token:

查标准(BS ISO/IEC 14496-10:2003)Table 9-5,可得:

If (TotalCoeffs == 5 && TrailingOnes == 3 && 0 <= NC < 2)

coeff_token = 0000 100;

Code = 0000 100;

3) 编码所有TrailingOnes的符号:

逆序编码,三个拖尾系数的符号依次是+(0),-(1),-(1);

即:

TrailingOne sign[i--] = 0;

TrailingOne sign[i--] = 1;

Code = 0000 1000 11;

4) 编码除了拖尾系数以外非零系数幅值Levels:

过程如下:

(1)将有符号的Level[ i ]转换成无符号的levelCode;

如果Level[ i ]是正的,levelCode = (Level[ i ]<<1) – 2;

如果Level[ i ]是负的,levelCode = - (Level[ i ]<<1) – 1;

(2)计算level_prefix:level_prefix = levelCode / (1<<suffixLength);

查表9-6可得所对应的bit string;

(3)计算level_suffix:level_suffix = levelCode % (1<<suffixLength);

(4)根据suffixLength的值来确定后缀的长度;

(5)suffixLength updata:

If ( suffixLength == 0 )

suffixLength++;

else if ( levelCode > (3<<suffixLength-1) && suffixLength <6)

suffixLength++;

回到例子中,依然按照逆序,Level[i--] = 1;(此时i = 1)

levelCode = 0;level_prefix = 0;

查表9-6,可得level_prefix = 0时对应的bit string = 1;

因为suffixLength初始化为0,故该Level没有后缀;

因为suffixLength = 0,故suffixLength++;

Code = 0000 1000 111;

编码下一个Level:Level[0] = 3;

levelCode = 4;level_prefix = 2;查表得bit string = 001;

level_suffix = 0;suffixLength = 1;故码流为0010;

Code = 0000 1000 1110 010;

i = 0,编码Level结束。

5)编码最后一个非零系数前零的数目(TotalZeros):

查表9-7,当TotalCoeffs = 5,total_zero = 3时,bit string = 111;

Code = 0000 1000 1110 0101 11;

6) 对每个非零系数前零的个数(RunBefore)进行编码:

i = TotalCoeffs = 5;ZerosLeft = Total_zeros = 3;查表9-10:

依然按照逆序编码

ZerosLeft =3, run_before = 1 run_before[4]=10;

ZerosLeft =2, run_before = 0 run_before[3]=1;

ZerosLeft =2, run_before = 0 run_before[2]=1;

ZerosLeft =2, run_before = 1 run_before[1]=01;

ZerosLeft =1, run_before = 1 run_before[0]不需要码流来表示

Code = 0000 1000 1110 0101 1110 1101;

编码完毕。

CAVLC中的前缀和后缀——264小生

H264中的CAVLC在对TrailingOne之后的非零系数编码时,使用了前缀(prefix)和后缀(suffix)的概念,并且用suffixlength来表示后缀的长度。具体编码过程是这样的:

一,将suffixlength初始化为0(如果超过10个非零系数,而且少于3个TrailingOnes,suffixlength初始化为1)

二,将有符号的level(系数的值),转化为无符号数,有三种情况:

(1)如果Level是正的,levelCode = (Level<<1) – 2

(2)如果Level是负的,levelCode = -(Level<<1) – 1

(3)如果TrailingOnes小于3,那么第一个非TrailingOnes的非零系数必不为 +1、-1,为了节省编码比特,将其幅值减1。也就是如果level为正,level=level-1;否则,level=level+1。然后再按(1)

(2)将level转化为levelCode。T264中,此步骤是通过直接对levelcode减2完成的,levelcode=levelcode-2,这和通过对level幅值减1得到的levelcode是一样的。

三,得到level_prefix和level_suffix。

先说明一下,在解码端,levelcode是这样被解码的:

levelcode=(level_prefix<<suffixlength)+level_suffix

知道这一点很重要。从解码levelcode的公式中可以看出,编码端的level_prefix就是将levelcode右移suffixlength位得到的,而level_suffix直接就是levelcode的低suffixlength位。比如levelcode =13,也就是二进制'1101',而且如果此时的suffixlength=1,那么level_prefix=13>>1='110',level_suffix直接就是levelcode的最低位'1';再比如levelcode=13='1101', suffixlength=3,这时level_prefix =13>>3='1', level_suffix 就是 levelcode的低3位'101'。根据level_prefix 的值查表得到输出的码字。

这里还有三种特殊情况,在解码端:

(1)如果此时发现suffixlength=0,level_prefix=14,那么认为level_suffix是4位(而不是0位)。

(2)如果此时发现level_prefix=15,那么认为level_suffix是12位的。

(3)如果此时发现suffixlength=0,level_prefix=15,那么经过使用公式levelcode=

(level_prefix<<suffixlength)+level_suffix得到的levelcode还需要再加上15。

******************************************************************

Golomb 用于运动矢量，模式类型，头信息等编码

CAVLC用于残差编码

CABAC都可以

*******************************************************************

基于内容的自适应变长编码[CAVLC]的更多相关文章

WPF设置DataGrid行内容高度自适应与 TextBox/TextBlock内容高度自适应
WPF设置DataGrid行内容高度自适应 TextBox/TextBlock内容高度自适应参考: DataGrid 控件中的调整大小选项: http://msdn.microsoft.com/ ...
Recommender Systems基于内容的推荐
基于内容的推荐的基本推荐思路是:用户喜欢幻想小说,这本书是幻想小说,则用户有可能喜欢这本小说两方面要求:(1)知道用户的喜好:(2)知道物品的属性基于内容的推荐相比协同过滤方法(个人观点):协同过 ...
Recommending music on Spotify with deep learning 采用深度学习算法为Spotify做基于内容的音乐推荐
本文参考http://blog.csdn.net/zdy0_2004/article/details/43896015译文以及原文file:///F:/%E6%9C%BA%E5%99%A8%E5%AD ...
基于内容的图像检索技（CBIR）术相术介绍
基于内容的图像检索技(CBIR)术相术介绍 kezunhai@gmail.com http://blog.csdn.net/kezunhai 近20年来,计算机与信号处理领域如火如荼地发展着,随着普通 ...
基于内容的图片检索CBIR（Content Based Image Retrieval）简介
传统的图像检索过程,先通过人工对图像进行文字标注,再利用关键字来检索图像,这种依据图像描述的字符匹配程度提供检索结果的方法,简称“以字找图”,既耗时又主观多义.基于内容的图像检索客服“以字找图”方式的 ...
大数据算法->推荐系统常用算法之基于内容的推荐系统算法
港真,自己一直非常希望做算法工程师,所以自己现在开始对现在常用的大数据算法进行不断地学习,今天了解到的算法,就是我们生活中无处不在的推荐系统算法. 其实,向别人推荐商品是一个很常见的现象,比如我用了一 ...
div 内容宽度自适应、超出后换行
div 内容宽度自适应,超出后换行 { max-width:100%;width: fit-content;width: -webkit-fit-content;width: -moz-fit-con ...
基于内容的图片检索CBIR简介
原文地址:http://blog.csdn.net/davebobo/article/details/53171311 传统的图像检索过程,先通过人工对图像进行文字标注,再利用关键字来检索图像,这种依 ...
新闻推荐系统：基于内容的推荐算法（Recommender System：Content-based Recommendation）
https://blog.csdn.net/qq_32690999/article/details/77434381 因为开发了一个新闻推荐系统的模块,在推荐算法这一块涉及到了基于内容的推荐算法(Co ...

随机推荐

状态模式----C++实现
状态模式定义: 允许一个对象在其内部状态改变时改变它的行为.对象看起来似乎修改了它的类. 实用性: 1. 一个对象的行为取决于它的状态,并且它必须在运行时刻根据状态改变它的行为. 2. 一个操作中含 ...
SQL Server 2008 geometry 数据类型
摘自SQL Server 2008帮助平面空间数据类型 geometry 是作为 SQL Server 中的公共语言进行时 (CLR) 数据类型实现的.此类型表示欧几里得(平面)坐标系中的数据. 注 ...
Volley报错！！！No address associated with hostname
年轻人检查你的网络去吧,这是没有网络导致的原因
mssql 判断sql语句的执行效率语句
SET STATISTICS io ONSET STATISTICS time ONgo--========此处为sql代码段=============== select zxbh from t_yr ...
@synthesize
@synthesize 相当于把属性当成成员变量来用,不用再写self.属性@synthesize myButton; 这样写了之后,那么编译器会自动生成myButton的实例变量,以及相应的gett ...
客户端调用web中js方法（C调B）跨域问题
这几天遇到了个棘手问题(c调b),经过排错查出了问题. 一,问题描述如下: 1.客户端需要调用father.html中一个js方法,特殊之处在于这个father.html中有个iframe嵌套了一个 ...
一、Autofac入门
想要将autofac集成到你的应用程序中需要经过如下步骤: 1.使用控制翻转(IoC)的思想架构你的应用程序: 2.添加autofac引用: 3.在应用程序入口...(At application s ...
juqery合成事件toggle方法
当指定元素被点击时,在两个或多个函数之间轮流切换. 如果规定了两个以上的函数,则 toggle() 方法将切换所有函数.例如,如果存在三个函数,则第一次点击将调用第一个函数,第二次点击调用第二个函数, ...
[转]Cocos2d-x建工程时避免copy文件夹和库
原文链接: http://www.cnblogs.com/andyque/archive/2011/09/27/2192920.html 在上一篇教程中,我们演示了如何使用VS2010来新建一个工程 ...
vs2003的代码考到vs2010 会出现（Windows CR LF）
拷贝到VS中,出现各种莫名其妙的编译错误,这个时候需要注意,造成这种情况的原因可能在于,你所拷贝的源代码在换行时并非采用Windows系统的CR LF方式. 下面给出一个简单的方法来将不合要求的文本更 ...

基于内容的自适应变长编码[CAVLC]

基于内容的自适应变长编码[CAVLC]的更多相关文章

随机推荐

热门专题