如何在JM8.6编码端提取QDCT?

毫无疑问，编码端的QDCT和解码端的QDCT完全相同，下面从编码端提取QDCT. 为简便起见，仅提取第一帧第一个宏块第一个4*4块的QDCT.JM8.6编码器最核心的编码函数是encode_one_macroblock,该函数找到了残差并进行了整数DCT变换及量化，然后Zigzag scan和Run-Level编码. 在write_one_macroblock函数中进行了熵编码和写码流, 故在encode_one_macroblock和write_one_macroblock之间便可以提取QDCT.

首先看到变量img->cofAC[][][][],在global.h中是这么定义的：int ****cofAC;//AC coefficients[8x8block][4x4block][level/run][scan_pos]. 下面来具体探讨一下4个中括号里面内容的意思.img->cofAC[][][][]中第一个中括号中的值可为0,1,2,3,4,5,分别与下图红色标记位置（8*8的块）相对应: （下面数据中的像素值不用管，之所以列出来，是为了说明cofAC数组中各[]的对应位置）

====================== Y Data ======================

0 1

+----------------+----------------+----------------+----------------+
| 43,216,254,249,|251,254,254,253,|251,252,254,254,|254,254,254,253,|
| 49,198,193,211,|228,205,213,185,|211,207,186,248,|198,203,208,183,|
| 48,194,177,171,|197,173,185,136,|191,195,138,179,|142,176,177,135,|
| 46,214,225,169,|177,189,198,160,|203,208,177,165,|173,196,191,156,|

+----------------+----------------+----------------+----------------+
|
41,185,208,180,|203,228,226,200,|214,226,225,227,|228,225,224,210,|
| 31,130,173,178,|215,230,221,212,|220,229,227,228,|229,227,226,226,|
| 29,119,194,216,|211,213,219,222,|225,223,220,219,|218,218,218,218,|
| 25,126,219,224,|217,224,227,227,|227,226,225,224,|220,220,221,222,|

2
3
+----------------+----------------+----------------+----------------+
| 26,131,215,223,|226,225,225,225,|225,226,223,219,|221,221,219,220,|
| 30,136,216,226,|223,224,225,225,|224,221,217,221,|222,219,220,226,|
| 30,136,216,227,|224,224,225,223,|221,218,221,216,|211,224,224,211,|
| 29,135,217,225,|222,221,222,222,|221,209,181,155,|186,210,186,164,|
+----------------+----------------+----------------+----------------+
| 29,134,216,224,|226,230,230,227,|206,177,146,113,|149,162,147,150,|
| 29,135,219,231,|225,201,190,185,|163,144,153,140,|127,143,165,184,|
| 30,139,210,192,|165,142,134,133,|143,141,129,138,|150,178,201,207,|
| 30,125,166,145,|144,154,132,111,|118,161,175,180,|204,214,213,209,|
+----------------+----------------+----------------+----------------+

====================== U Data
======================

4
+----------------+----------------+
|131,136,136,137,|137,136,137,137,|
|133,146,146,146,|146,148,147,147,|
|128,131,132,130,|131,130,128,129,|
|127,125,124,123,|123,121,120,121,|
+----------------+----------------+
|128,125,124,123,|122,120,120,119,|
|128,125,124,122,|117,115,116,114,|
|127,123,119,117,|113,115,118,118,|
|125,119,116,116,|119,120,121,118,|
+----------------+----------------+

====================== V Data
======================

5
+----------------+----------------+
|120,106,109,104,|105,107,106,104,|
|115, 80, 81, 78,| 81, 75, 77, 78,|
|125,115,116,115,|116,116,117,115,|
|129,130,131,130,|130,131,131,131,|
+----------------+----------------+
|128,129,130,130,|131,131,131,131,|
|128,129,130,130,|132,132,132,133,|
|128,129,131,131,|133,133,133,133,|
|129,131,132,133,|133,133,133,133,|
+----------------+----------------+

img->cofAC[][][][]中第二个中括号中的值可为0,1,2,3,分别对应每个8*8块中的4个4*4的块，对应顺序为：

0 1

+----------------+----------------+

|
43,216,254,249,|251,254,254,253,|
| 49,198,193,211,|228,205,213,185,|
| 48,194,177,171,|197,173,185,136,|
| 46,214,225,169,|177,189,198,160,|

2 3

+----------------+----------------+

|
41,185,208,180,|203,228,226,200,|
| 31,130,173,178,|215,230,221,212,|
| 29,119,194,216,|211,213,219,222,|
| 25,126,219,224,|217,224,227,227,|

这样通过第一个中括号和第二个中括号的值就可以定位到每一个具体的4*4块. 假设第一个中括号为i,第二个中括号为j,那么下面的循环就能实现对24个4*4块的遍历：

for(i = 0; i < 6; i++)

for(j = 0; j < 4; j++)

接着看img->cofAC[][][][]的第三个中括号，里面的取值可为0,1.当取值为0的时候，这个数组表示的是Run
Level编码中的level,当取值为1的时候，这个数组表示的是Run Level编码中的run.这一部分涉及到游程编码的概念，下面举例说明：

假设这是一个4*4块的QDCT，现在进行zigzag
scan后就形成了：

10 9 0 3 0 1
0 8 2 -1 -3 0 -5 0 0 0

现在进行Run Level编码后得到：

Level:10 9
3 1 8 2 -1 -3 -5 0
0 0 0 0 0 0

Run: 0 0 1 1 1
0 0 0 1 0 0
0 0 0 0 0

接着分析img->cofAC[][][][]的第四个中括号.第一个中括号和第二个中括号确定了具体的4*4块的位置，第三个中括号确定了是RunLevel还是Level，那么第四个中括号便是定位分量的具体位置了，其取值范围是0到15. 这样，所有的都一目了然了。

现在要在encode_one_macroblock和write_one_macroblock之间提取第一帧第一个宏块的第一个4*4块的QDCT.显然这是很容易的，只需给出img->cofAC[0][0][0][k]和img->cofAC[0][0][1][k]即可，代码如下：

[cpp] view
plain copy

encode_one_macroblock ();
if(1 == controlTimes) // controlTimes是static int型的变量，用于记录函数被调用的次数
{
for(i = 0; i < 16; i++)
printf("%-4d", img->cofAC[0][0][0][i]);
printf("\n\n");
for(i = 0; i < 16; i++)
10. printf("%-4d", img->cofAC[0][0][1][i]);
11. printf("\n\n");

12. }

14. write_one_macroblock (1);

提取的数据为：（实验发现，从编码端和解码端提取的数据完全一致）

9   -12 3   3   -3 -11 -5
1   -1 -2 1   0   0
0   0   0

0
0   0   0    0
0    0   0   0   2
1   0   0   0   0   0

其中上一行为Level值，下一行为Run的值，于是可以得到Run Level编码前的zigzag scan的值，即为：

9 -12
3 3 -3 -11 -5 1 -1 0 0
-2 0 1 0 0

进一步可以得到zigzag扫描前的值，即为：

9 -12 -11 -5

3 -3
1 0

3 -1 -2
1

0
0 0 0

这就是最后的QDCT矩阵，为了进一步验证这个QDCT矩阵的正确性，我们可以用matlab来进行一个粗略的仿真：

第一帧的第一个宏块的第一个4*4块的原始像素值为：

| 43,216,254,249,|
| 49,198,193,211,|
| 48,194,177,171,|
| 46,214,225,169,|

下面用matlab计算QDCT,
matlab代码为：

[plain] view
plain copy

clear
clc
org = [43 216 254 249;...
49 198 193 211;...
48 194 177 171;...
46 214 225 169];
res = org - 128; % 残差矩阵
% 下面对残差矩阵进行DCT变换并量化

10. T = [1 1 1 1 ; 2 1 -1 -2; 1 -1 -1 1; 1 -2 2 -1];

11. f = T * res * T';

12. a = 0.5;

13. b = 0.4 ^ 0.5;

14. X = [a*a a*b/2 a*a a*b/2;...

15. a*b/2 b*b/4 a*b/2 b*b/4;...
16. a*a a*b/2 a*a a*b/2;...
17. a*b/2 b*b/4 a*b/2 b*b/4];

18. Y = f .* X / 16 % 从H.264visa查得QP=28，对应的量化步长刚好为16

所得结果为：

Y =

9.5156
-12.4021 -10.7031   -5.5340
    2.7373   -2.9750
1.1167   -0.4563
    2.7344   -1.5713
-1.8594    0.9684
   -0.1383   -0.0813
0.0395    0.0063

而JM8.6编码器得到的结果为：

9 -12
-11 -5

3
-3 1 0

3 -1 -2
1

0
0 0 0

对比结果，不言而喻.

如何在JM8.6编码端提取QDCT?的更多相关文章

会议更流畅，表情更生动！视频生成编码 VS 国际最新 VVC 标准
阿里云视频云的标准与实现团队与香港城市大学联合开发了基于 AI 生成的人脸视频压缩体系,相比于 VVC 标准,两者质量相当时可以取得 40%-65% 的码率节省,旨在用最前沿的技术,普惠视频通话.视频 ...
【视频编解码·学习笔记】8. 熵编码算法：基本算法列举 & 指数哥伦布编码
一.H.264中的熵编码基本方法: 熵编码具有消除数据之间统计冗余的功能,在编码端作为最后一道工序,将语法元素写入输出码流熵解码作为解码过程的第一步,将码流解析出语法元素供后续步骤重建图像使用在H ...
Tomcat 中文乱码设置UTF-8编码问题解决办法
在Java Web开发中,http请求带有中文字符的URI如果不处理容易出现乱码问题:这是因为Tomcat容器默认编码是iso-8859-1引起的,因此要避免出现乱码就要需要做相应的处理.解决办法如下 ...
将RegEx（正则表达式提取器）与JMeter一起使用
JMeter的,最流行的开源性能测试工具,可以工作正则表达式,用正则表达式提取.正则表达式是一种用于通过使用高级操作提取文本的必需部分的工具.正则表达式在测试Web应用程序时很流行,因为它们可用于验证 ...
ffmpeg实时编码解码部分代码
程序分为编码端和解码端,两端通过tcp socket通信,编码端一边编码一边将编码后的数据发送给解码端.解码端一边接收数据一边将解码得到的帧显示出来. 代码中的编码端编码的是实时屏幕截图. 代码调用 ...
Jmeter正则提取请求响应数据
前言在测试时,我们经常需处理请求返回的响应数据,比如很多时候 cookie 或 token 或 Authorization授权码会返回在 Response headers(响应头)中,这时我们便需 ...
URLConnection 和 HttpClients 发送请求范例
. java.net.URLConnection package test; import java.io.BufferedReader; import java.io.IOException; im ...
Keras:基于Theano和TensorFlow的深度学习库
catalogue . 引言 . 一些基本概念 . Sequential模型 . 泛型模型 . 常用层 . 卷积层 . 池化层 . 递归层Recurrent . 嵌入层 Embedding 1. 引言 ...
URLConnection 和 HttpClients 发送请求范例【原】
笔记,未完全标准. java.net.URLConnection package test; import java.io.BufferedReader; import java.io.IOExcep ...

随机推荐

BFC（Block Formatting Context）基础分析
W3C官方对于BFC的描述只有3小段,强烈建议想理解BFC的朋友先去看看,链接见文末. 常见的文档流分为:定位流.浮动流.普通流3种.BFC是普通流中的一种. 本文提出3个问题并给出使用BFC来解决这 ...
c++ 库 boost安装
http://blog.chinaunix.net/uid-12226757-id-3427282.html ubuntu apt-get install libboost-dev 全部: apt-g ...
datetime时间处理
基本数据获取: In [38]: import datetime as dt In [39]: on = dt.datetime.now() #获取当前准确时间 In [40]: on Out[40] ...
LifecycleProcessor not initialized - call 'refresh' before invoking lifecycle methods via the context: --异常记录
升级了JDK之后,启动应用,直接抛出此异常.网上搜罗半天,没有正确的解决方案. 然后想到了是“升级了JDK”,重新检查所有JDK相关的配置的地方,在Debug Configurations里找到启动时 ...
调色盘canvas
//调色盘 function draw8(id){ var canvas = document.getElementById(id); var context = canvas.getContext( ...
sqlserver导入excel的电话号码（身份证）变为科学计数解决方式
如果excel中有一列存的是手机号码或者身份证号码,那么导入到sql中时,会把手机或者身份证当作数字格式对待,因而会以科学记数法的形式存在sqlserver表中,解决方式,先将excel文件另存为文本 ...
官方微信接口（全接口） - 微信摇一摇接口/微信多客服接口/微信支付接口/微信红包接口/微信卡券接口/微信小店接口/JSAPI
微信入口绑定,微信事件处理,微信API全部操作包含在这些文件中.微信支付.微信红包.微信卡券.微信小店. 微信开发探讨群 330393916 <?php /** * Description o ...
sql 中 in 与 exist 的区别
可以通过 where 条件把 null的情况筛选掉,已避免出现上述的情况. 1, exist 返回 true or false: in 返回 true unknow. not之后 not ...
python的正则表达式捕获组命名问题
《Python学习手册》（二）
<Python学习手册>(二) --类型和运算数字十六进制八进制二进制 0x 0o 0b hex() oct() bin() >>>int('10',2) 2 & ...

如何在JM8.6编码端提取QDCT?

如何在JM8.6编码端提取QDCT?的更多相关文章

随机推荐

热门专题