毫无疑问,编码端的QDCT和解码端的QDCT完全相同,下面从编码端提取QDCT. 为简便起见,仅提取第一帧第一个宏块第一个4*4块的QDCT.JM8.6编码器最核心的编码函数是encode_one_macroblock,该函数找到了残差并进行了整数DCT变换及量化,然后Zigzag scan和Run-Level编码. 在write_one_macroblock函数中进行了熵编码和写码流, 故在encode_one_macroblock和write_one_macroblock之间便可以提取QDCT.

首先看到变量img->cofAC[][][][],在global.h中是这么定义的:int ****cofAC;//AC coefficients[8x8block][4x4block][level/run][scan_pos]. 下面来具体探讨一下4个中括号里面内容的意思.img->cofAC[][][][]中第一个中括号中的值可为0,1,2,3,4,5,分别与下图红色标记位置(8*8的块)相对应: (下面数据中的像素值不用管,之所以列出来,是为了说明cofAC数组中各[]的对应位置)

====================== Y Data ======================

0                                                     1

+----------------+----------------+----------------+----------------+
| 43,216,254,249,|251,254,254,253,|251,252,254,254,|254,254,254,253,|
| 49,198,193,211,|228,205,213,185,|211,207,186,248,|198,203,208,183,|
| 48,194,177,171,|197,173,185,136,|191,195,138,179,|142,176,177,135,|
| 46,214,225,169,|177,189,198,160,|203,208,177,165,|173,196,191,156,|

+----------------+----------------+----------------+----------------+
|
41,185,208,180,|203,228,226,200,|214,226,225,227,|228,225,224,210,|
| 31,130,173,178,|215,230,221,212,|220,229,227,228,|229,227,226,226,|
| 29,119,194,216,|211,213,219,222,|225,223,220,219,|218,218,218,218,|
| 25,126,219,224,|217,224,227,227,|227,226,225,224,|220,220,221,222,|

            2                                                    
 3

+----------------+----------------+----------------+----------------+
| 26,131,215,223,|226,225,225,225,|225,226,223,219,|221,221,219,220,|
| 30,136,216,226,|223,224,225,225,|224,221,217,221,|222,219,220,226,|
| 30,136,216,227,|224,224,225,223,|221,218,221,216,|211,224,224,211,|
| 29,135,217,225,|222,221,222,222,|221,209,181,155,|186,210,186,164,|
+----------------+----------------+----------------+----------------+
| 29,134,216,224,|226,230,230,227,|206,177,146,113,|149,162,147,150,|
| 29,135,219,231,|225,201,190,185,|163,144,153,140,|127,143,165,184,|
| 30,139,210,192,|165,142,134,133,|143,141,129,138,|150,178,201,207,|
| 30,125,166,145,|144,154,132,111,|118,161,175,180,|204,214,213,209,|
+----------------+----------------+----------------+----------------+

====================== U Data
======================

4
+----------------+----------------+
|131,136,136,137,|137,136,137,137,|
|133,146,146,146,|146,148,147,147,|
|128,131,132,130,|131,130,128,129,|
|127,125,124,123,|123,121,120,121,|
+----------------+----------------+
|128,125,124,123,|122,120,120,119,|
|128,125,124,122,|117,115,116,114,|
|127,123,119,117,|113,115,118,118,|
|125,119,116,116,|119,120,121,118,|
+----------------+----------------+

====================== V Data
======================

                         
5

+----------------+----------------+
|120,106,109,104,|105,107,106,104,|
|115, 80, 81, 78,| 81, 75, 77, 78,|
|125,115,116,115,|116,116,117,115,|
|129,130,131,130,|130,131,131,131,|
+----------------+----------------+
|128,129,130,130,|131,131,131,131,|
|128,129,130,130,|132,132,132,133,|
|128,129,131,131,|133,133,133,133,|
|129,131,132,133,|133,133,133,133,|
+----------------+----------------+

img->cofAC[][][][]中第二个中括号中的值可为0,1,2,3,分别对应每个8*8块中的4个4*4的块,对应顺序为:

0                            1

+----------------+----------------+

|
43,216,254,249,|251,254,254,253,|
| 49,198,193,211,|228,205,213,185,|
| 48,194,177,171,|197,173,185,136,|
| 46,214,225,169,|177,189,198,160,|

2                           3

+----------------+----------------+

|
41,185,208,180,|203,228,226,200,|
| 31,130,173,178,|215,230,221,212,|
| 29,119,194,216,|211,213,219,222,|
| 25,126,219,224,|217,224,227,227,|

这样通过第一个中括号和第二个中括号的值就可以定位到每一个具体的4*4块. 假设第一个中括号为i,第二个中括号为j,那么下面的循环就能实现对24个4*4块的遍历:

for(i = 0; i < 6; i++)

for(j = 0; j < 4; j++)

接着看img->cofAC[][][][]的第三个中括号,里面的取值可为0,1.当取值为0的时候,这个数组表示的是Run
Level编码中的level,当取值为1的时候,这个数组表示的是Run Level编码中的run.这一部分涉及到游程编码的概念,下面举例说明:

假设这是一个4*4块的QDCT,现在进行zigzag
scan后就形成了:

10  9  0  3  0  1 
0  8  2  -1  -3  0  -5  0  0  0

现在进行Run Level编码后得到:

Level:10  9 
3  1  8  2  -1  -3  -5  0 
0  0  0  0  0  0

Run:   0   0  1  1  1 
0    0   0   1   0  0 
0  0  0  0  0

接着分析img->cofAC[][][][]的第四个中括号.第一个中括号和第二个中括号确定了具体的4*4块的位置,第三个中括号确定了是RunLevel还是Level,那么第四个中括号便是定位分量的具体位置了,其取值范围是0到15. 这样,所有的都一目了然了。

现在要在encode_one_macroblock和write_one_macroblock之间提取第一帧第一个宏块的第一个4*4块的QDCT.显然这是很容易的,只需给出img->cofAC[0][0][0][k]和img->cofAC[0][0][1][k]即可,代码如下:

[cpp] view
plain
 copy

  1. encode_one_macroblock ();
  2. if(1 == controlTimes) // controlTimes是static int型的变量,用于记录函数被调用的次数
  3. {
  4. for(i = 0; i < 16; i++)
  5. printf("%-4d", img->cofAC[0][0][0][i]);
  6. printf("\n\n");
  7. for(i = 0; i < 16; i++)
  8. 10.         printf("%-4d", img->cofAC[0][0][1][i]);
  9. 11.     printf("\n\n");

12. }

  1. 13.

14. write_one_macroblock (1);

提取的数据为:(实验发现,从编码端和解码端提取的数据完全一致)

9   -12 3   3   -3  -11 -5 
1   -1  -2  1   0   0  
0   0   0

0   
0   0   0    0   
0    0   0    0   2  
1   0   0   0   0   0

其中上一行为Level值,下一行为Run的值,于是可以得到Run Level编码前的zigzag scan的值,即为:

9  -12 
3  3  -3  -11  -5  1  -1  0  0 
-2  0  1  0  0

进一步可以得到zigzag扫描前的值,即为:

9   -12   -11   -5

3    -3     
1     0

3    -1     -2    
1

0    
0      0     0

这就是最后的QDCT矩阵, 为了进一步验证这个QDCT矩阵的正确性,我们可以用matlab来进行一个粗略的仿真:

第一帧的第一个宏块的第一个4*4块的原始像素值为:

| 43,216,254,249,|
| 49,198,193,211,|
| 48,194,177,171,|
| 46,214,225,169,|

下面用matlab计算QDCT,
matlab代码为:

[plain] view
plain
 copy

  1. clear
  2. clc
  3. org = [43 216 254 249;...
  4. 49 198 193 211;...
  5. 48 194 177 171;...
  6. 46 214 225 169];
  7. res = org - 128; % 残差矩阵
  8. % 下面对残差矩阵进行DCT变换并量化

10. T = [1 1 1 1 ; 2 1 -1 -2; 1 -1 -1 1; 1 -2 2 -1];

11. f = T * res * T';

12. a = 0.5;

13. b = 0.4 ^ 0.5;

14. X = [a*a a*b/2 a*a a*b/2;...

  1. 15.     a*b/2 b*b/4 a*b/2 b*b/4;...
  2. 16.     a*a a*b/2 a*a a*b/2;...
  3. 17.     a*b/2 b*b/4 a*b/2 b*b/4];

18. Y = f .* X / 16  % 从H.264visa查得QP=28,对应的量化步长刚好为16

所得结果为:

Y =

9.5156 
-12.4021  -10.7031   -5.5340
    2.7373   -2.9750   
1.1167   -0.4563
    2.7344   -1.5713  
-1.8594    0.9684
   -0.1383   -0.0813   
0.0395    0.0063

而JM8.6编码器得到的结果为:

9   -12  
-11   -5

3   
-3      1     0

3    -1     -2    
1

0    
0      0     0

对比结果,不言而喻.

如何在JM8.6编码端提取QDCT?的更多相关文章

  1. 会议更流畅,表情更生动!视频生成编码 VS 国际最新 VVC 标准

    阿里云视频云的标准与实现团队与香港城市大学联合开发了基于 AI 生成的人脸视频压缩体系,相比于 VVC 标准,两者质量相当时可以取得 40%-65% 的码率节省,旨在用最前沿的技术,普惠视频通话.视频 ...

  2. 【视频编解码·学习笔记】8. 熵编码算法:基本算法列举 & 指数哥伦布编码

    一.H.264中的熵编码基本方法: 熵编码具有消除数据之间统计冗余的功能,在编码端作为最后一道工序,将语法元素写入输出码流 熵解码作为解码过程的第一步,将码流解析出语法元素供后续步骤重建图像使用 在H ...

  3. Tomcat 中文乱码 设置UTF-8编码 问题解决办法

    在Java Web开发中,http请求带有中文字符的URI如果不处理容易出现乱码问题:这是因为Tomcat容器默认编码是iso-8859-1引起的,因此要避免出现乱码就要需要做相应的处理.解决办法如下 ...

  4. 将RegEx(正则表达式提取器)与JMeter一起使用

    JMeter的,最流行的开源性能测试工具,可以工作正则表达式,用正则表达式提取.正则表达式是一种用于通过使用高级操作提取文本的必需部分的工具.正则表达式在测试Web应用程序时很流行,因为它们可用于验证 ...

  5. ffmpeg实时编码解码部分代码

    程序分为编码端和解码端,两端通过tcp  socket通信,编码端一边编码一边将编码后的数据发送给解码端.解码端一边接收数据一边将解码得到的帧显示出来. 代码中的编码端编码的是实时屏幕截图. 代码调用 ...

  6. Jmeter正则提取请求响应数据

    前言 在测试时,我们经常需处理请求返回的响应数据,比如很多时候 cookie 或 token 或 Authorization授权码 会返回在 Response headers(响应头)中,这时我们便需 ...

  7. URLConnection 和 HttpClients 发送请求范例

    . java.net.URLConnection package test; import java.io.BufferedReader; import java.io.IOException; im ...

  8. Keras:基于Theano和TensorFlow的深度学习库

    catalogue . 引言 . 一些基本概念 . Sequential模型 . 泛型模型 . 常用层 . 卷积层 . 池化层 . 递归层Recurrent . 嵌入层 Embedding 1. 引言 ...

  9. URLConnection 和 HttpClients 发送请求范例【原】

    笔记,未完全标准. java.net.URLConnection package test; import java.io.BufferedReader; import java.io.IOExcep ...

随机推荐

  1. SSH 公钥检查

    SSH 公钥检查是一个重要的安全机制,可以防范中间人劫持等黑客攻击.但是在特定情况下,严格的 SSH 公钥检查会破坏一些依赖 SSH 协议的自动化任务,就需要一种手段能够绕过 SSH 的公钥检查. 首 ...

  2. appium的初始化准备工作

    文章出处http://blog.csdn.net/jiuzuidongpo/article/details/51790455 Appium在接收到客户端脚本的连接之后的初始化准备工作列表(细节部分详细 ...

  3. UTC和时间相互转换

    // ToLocalTime() UTC时间转换为本地时间 public static DateTime UtcToDateTime(long number) { , , , , , , ).AddS ...

  4. master: Error: JAVA_HOME is not set and could not be found.问题解决

  5. 在 Mac OS 上编译 OBS

    本文转自:在 Mac OS 上编译 OBS | www.samirchen.com 安装环境 第一步,做准备工作,安装编译 OBS 所需要的环境,流程如下: // 给当前用户添加 /usr/local ...

  6. 《React-Native系列》RN与native交互与数据传递

    RN怎么与native交互的呢? 下面我们通过一个简单的Demo来实现:RN页面调起Native页面,Native页面选择电话本数据,将数据回传给RN展示. 首先是 Native侧 1.MainAct ...

  7. asp.net Core 部署到CentOs7上,使用Nginx做代理

    一.CentOs7部署Nginx 1.准备工作 Nginx的安装依赖于以下三个包,意思就是在安装Nginx之前首先必须安装一下的三个包,注意安装顺序如下: 1 SSL功能需要openssl库,直接通过 ...

  8. Oracle索引以及索引碎片

    索引,可以增加查询速度,若没有索引,每次查询都必须是全表查询.例如,搜索某个记录时(如name="gdpuzxs")时,需要全表扫描一下,因为不知道有多少个name="g ...

  9. Hibernate -- Session的主键生成策略

    *缓存:集合--集合放置到内存中       *  只要session存在 session的一级缓存肯定存在.       *当执行查询时,以oid为oid=1条件到session的一级缓存中查找oi ...

  10. PlusOne

    问题描述:一个数组每一位代表一个数字的每一位.数字高位在数组的低位.求数字加1后得到新数组. 算法分析:要从数组的高位到低位进行遍历. public class PlusOne { public in ...