<开源项目分析>Cisco的开源视频加解码器THOR（H.264解码）

原创博客，转载请联系博主！

题外话：自学了快两个月的Perl语言，本来打算写两篇基础介绍的博文来科普一下一些小技巧，但是仔细想想还是没有必要了吧，毕竟现在无论是在用Perl5还是Perl6的人都是小众了，回头写几个中小型的项目再拿出来深入说会更好点，毕竟Perl的学习曲线比较陡峭也不是几篇博文能说完的事儿，好了废话到此为止，下文进入正题！

有关于提到的加解码器THOR的源代码托管在github上：https://github.com/cisco/thor

Github上面这个项目的文档写得不是一般的简洁，我先大概整理下这个编译后的二进制文件大概用法再讨论里面的构造（linux平台下编译）：

build/Thorenc -if input_filename -of output_filename [options...]

build/Thordex input_filename output_filename

虽然编码和解码的参数用法不是很对称，但还是好在比较简明，其实解码器的参数是固定的，但是编码过程的参数比较复杂，如下所示：

static void add_param_to_list(param_list *list, char *name, char *default_string, int type, void *value)
{
  list->params[list->num].name = name;
  list->params[list->num].default_string = default_string;
  list->params[list->num].type = type;
  list->params[list->num].value = value;
  list->num++;
}
.....
  add_param_to_list(&list, "-cf",                   NULL, ARG_FILENAME, NULL);

  add_param_to_list(&list, "-if",                   NULL, ARG_FILENAME, &params->infilestr);

  add_param_to_list(&list, "-ph",                    "0", ARG_INTEGER,  &params->file_headerlen);

  add_param_to_list(&list, "-fh",                    "0", ARG_INTEGER,  &params->frame_headerlen);

  add_param_to_list(&list, "-of",                   NULL, ARG_FILENAME, &params->outfilestr);

  add_param_to_list(&list, "-rf",                   NULL, ARG_FILENAME, &params->reconfilestr);

  add_param_to_list(&list, "-stat",                 NULL, ARG_FILENAME, &params->statfilestr);

  add_param_to_list(&list, "-n",                   "600", ARG_INTEGER,  &params->num_frames);

  add_param_to_list(&list, "-skip",                  "0", ARG_INTEGER,  &params->skip);

  add_param_to_list(&list, "-width",              "1920", ARG_INTEGER,  &params->width);

  add_param_to_list(&list, "-height",             "1080", ARG_INTEGER,  &params->height);

  add_param_to_list(&list, "-qp",                   "32", ARG_INTEGER,  &params->qp);

  add_param_to_list(&list, "-f",                    "60", ARG_FLOAT,    &params->frame_rate);

  add_param_to_list(&list, "-lambda_coeffI",       "1.0", ARG_FLOAT,    &params->lambda_coeffI);

  add_param_to_list(&list, "-lambda_coeffP",       "1.0", ARG_FLOAT,    &params->lambda_coeffP);

  add_param_to_list(&list, "-lambda_coeffB",       "1.0", ARG_FLOAT,    &params->lambda_coeffB);

  add_param_to_list(&list, "-early_skip_thr",      "0.0", ARG_FLOAT,    &params->early_skip_thr);

  add_param_to_list(&list, "-enable_tb_split",       "0", ARG_INTEGER,  &params->enable_tb_split);

  add_param_to_list(&list, "-enable_pb_split",       "0", ARG_INTEGER,  &params->enable_pb_split);

  add_param_to_list(&list, "-max_num_ref",           "1", ARG_INTEGER,  &params->max_num_ref);

  add_param_to_list(&list, "-HQperiod",              "1", ARG_INTEGER,  &params->HQperiod);

  add_param_to_list(&list, "-num_reorder_pics",      "0", ARG_INTEGER,  &params->num_reorder_pics);

  add_param_to_list(&list, "-dqpP",                  "0", ARG_INTEGER,  &params->dqpP);

  add_param_to_list(&list, "-dqpB",                  "0", ARG_INTEGER,  &params->dqpB);

  add_param_to_list(&list, "-mqpP",                "1.0", ARG_FLOAT,    &params->mqpP);

  add_param_to_list(&list, "-mqpB",                "1.0", ARG_FLOAT,    &params->mqpB);

  add_param_to_list(&list, "-dqpI",                  "0", ARG_INTEGER,  &params->dqpI);

  add_param_to_list(&list, "-intra_period",          "0", ARG_INTEGER,  &params->intra_period);

  add_param_to_list(&list, "-intra_rdo",             "0", ARG_INTEGER,  &params->intra_rdo);

  add_param_to_list(&list, "-rdoq",                  "0", ARG_INTEGER,  &params->rdoq);

  add_param_to_list(&list, "-max_delta_qp",          "0", ARG_INTEGER,  &params->max_delta_qp);

  add_param_to_list(&list, "-encoder_speed",         "0", ARG_INTEGER,  &params->encoder_speed);

  add_param_to_list(&list, "-deblocking",            "1", ARG_INTEGER,  &params->deblocking);

  add_param_to_list(&list, "-clpf",                  "1", ARG_INTEGER,  &params->clpf);

  add_param_to_list(&list, "-snrcalc",               "1", ARG_INTEGER,  &params->snrcalc);

  add_param_to_list(&list, "-use_block_contexts",    "0", ARG_INTEGER,  &params->use_block_contexts);

  add_param_to_list(&list, "-enable_bipred",         "0", ARG_INTEGER,  &params->enable_bipred);
...

这些是编码器进入编码循环之前真正的参数，如果并没有在argv里明确指明参数的值，那么就会在这里使参数被赋予默认缺省值，具体来讲：

static int parse_params(int argc, char **argv, enc_params *params, param_list *list)

这个函数是从命令行调用参数中得到参数值的函数

static void add_param_to_list(param_list *list, char *name, char *default_string, int type, void *value)

这个函数是给函数列表赋以默认值和约束参数类型的函数

参数的读取先到这里，下文对参数会有更细的分析和补充。Thorenc可以编码的是一种后缀为.y4m格式的文件，与传统格式的视频文件不同，这里看下.y4m格式文件的具体格式参数：

y4m格式视频文件文件最开头是以一段长度为10的ascii字符串"YUV4MPEG2"作为魔数签名，接着是一个空格(0x20)作为分隔符，接下来的数据流是关于这个视频文件的各种参数信息：

W--视频单画面帧的宽度 e.g.W1080

H--视频单画面帧的高度 e.g.H1920

F--视频单画面帧的频率 e.g.F24:1代表24帧每秒，F25:1代表25帧每秒

C--色彩空间，常见的有4:4:4,4:2:2,4:2:0代表了Y值与UV值的交叉程度，具体差别有很多文章科普篇幅较大这里暂不赘述

A--像素宽高比

在每一个视频的参数之间也都有一个空格作为间隔符（0x20），在最后一个(0x0A)间隔符之后是真正原始的帧数据，大小如下所示：

C444--width*height*3

C422--width*height*2

C420--width*height*3/2

//解析y4m文件参数的switch-case

      while (pos < len && buf[pos] != '\n') {

          switch (buf[pos++]) {

          case 'W':

            params->width = strtol(buf+pos, &end, 10);

            pos = end-buf+1;

            break;

          case 'H':

            params->height = strtol(buf+pos, &end, 10);

            pos = end-buf+1;

            break;

          case 'F':

            den = strtol(buf+pos, &end, 10);

            pos = end-buf+1;

            num = strtol(buf+pos, &end, 10);

            pos = end-buf+1;

            params->frame_rate = (double)den/num;

            break;

          case 'I':

            if (buf[pos] != 'p') {

              fprintf(stderr, "Only progressive input supported\n");

              return NULL;

            }

            break;

          case 'C':

            if (strcmp(buf+pos, "C420")) {

            }

            /* Fallthrough */

          case 'A': /* Ignored */

          case 'X':

          default:

            while (buf[pos] != ' ' && buf[pos] != '\n' && pos < len)

              pos++;

            break;

          }

        }

然后接下来是视频解码过程中必须清楚的几个概念：

SB(Super Block 超级块)：64*64的亮度像素(Luma Pixel)单元组成的块，可以被分解为CB。 ///关于亮度像素和色彩像素(Chroma Pixel)的概念见上文色彩空间C的定义，具体分布下文默认为4:2:0的分布，了解细节见wiki和google.

CB(Coding Block 编码块)：8*8的亮度像素单元组成的块，是超级块的子单元。

PB(Prediction Block 预测块)：是编码块的一种子块，一个编码块可以分为1，2或者4个相同的预测块。

TB(Transform Block 变换块)：是编码块的另一种子块，一个编码块可以分为1或者4个相同的变换块。

边界问题：由于屏幕的分辨率种类繁多，有许多尺寸不能按超级块完整地进行等分，例如1920*1080分辨率的屏幕，在纵向上1080=64*16+56导致最后会剩余一个长方形的不完整超级块：

----------------〉〉〉

　　如上图所示，具体的解决的办法是将64*56的超级块分为两对32*32的块和32*24的块，32*24的块再具体对分再分办直到最后只有8*8块作为编码块，具体实现源码中有完整体现。

　　接下来是分帧和编码循环：

　　在thor中的main函数中所有真正编码文件的过程都体现为以下几段代码：

      /* Read input frame */

      fseek(infile, frame_num*(frame_size+params->frame_headerlen)+params->file_headerlen+params->frame_headerlen, SEEK_SET);

      read_yuv_frame(&orig,width,height,infile);

      orig.frame_num = encoder_info.frame_info.frame_num;

      /* Encode frame */

      start_bits = get_bit_pos(&stream);

      encode_frame(&encoder_info);

      rec_available[rec_buffer_idx]=1;

      end_bits =  get_bit_pos(&stream);

      num_bits = end_bits-start_bits;

      num_encoded_frames++;

　　在thor中一直有一个全局的对象stream，编码解码的过程都是围绕stream而展开的，包括将和编码有关的参数先写入stream中，随后将每一帧编码后的结果都写入stream，在stream使用一个经典的“滑窗”结构来进行二进制数据的读/写，orig是从原始的yuv文件读取得到的帧数据，编码的工作也是以orig为基础进行的。

encode_frame(&encoder_info);

　　其实真正编码的过程是一个非常复杂的过程，也是当前所有H.264行业都在关注的一项庞大的技术，以后会写几篇博文深入探讨相关技术。在thor中最后一步是计算视频的psnr，这是一个评价视频编码标准的重要参数，也是作为考量算法效率的重要反馈结果。

snr_yuv(&psnr,&orig,&rec[rec_buffer_idx],height,width,input_stride_y,input_stride_c);

　　分析完psnr参数，整个函数代码就进入了收尾的阶段：关句柄，收内存，thor的工作基本也就完成了，thor和openh264相比整个项目小了很多，但是也少了一些对OS的区分支持，有一些代码需要优化，和一些测试代码的删减，总的来说，不是做的很结构化的一个项目，用软件工程的说法就是模块耦合度太高了，我想这也是thor至今有些流产了的原因吧，但是作为研究还是非常有价值。

<开源项目分析>Cisco的开源视频加解码器THOR（H.264解码）的更多相关文章

JavaScript判断视频编码是否为h.264
1.视频编码是什么? 现在视频编码主流是h.264,对应着输入格式为AVC H.264/AVC是2003年制定的视频编码压缩标准 ,集中了以往标准的优点,并吸收了以往标准制定中积累的经验,采用简洁设计 ...
H.264开源解码器评测
转自:http://wmnmtm.blog.163.com/blog/static/38245714201142883032575/ 要播放HDTV,就首先要正确地解开封装,然后进行视频音频解码.所以 ...
【图像处理】H.264开源解码器评测
转自:http://wmnmtm.blog.163.com/blog/static/38245714201142883032575/ 要播放HDTV,就首先要正确地解开封装,然后进行视频音频解码.所以 ...
H.264视频在android手机端的解码与播放(转)
随着无线网络和智能手机的发展,智能手机与人们日常生活联系越来越紧密,娱乐.商务应用.金融应用.交通出行各种功能的软件大批涌现,使得人们的生活丰富多彩.快捷便利,也让它成为人们生活中不可取代的一部分.其 ...
FFmpeg的H.264解码器源代码简单分析：解析器（Parser）部分
===================================================== H.264源代码分析文章列表: [编码 - x264] x264源代码简单分析:概述 x26 ...
基于RTP的h.264视频传输系统设计（一）
一.H.264 的层次介绍 H.264 定义三个层次,每一个层次支持一组特定的编码功能.而且按照各个层次指定所指定的功能.基础层次(baselineprofile)支持I 帧和 P 帧[1]的帧内和帧 ...
【H.264/AVC视频编解码技术具体解释】十三、熵编码算法（4）：H.264使用CAVLC解析宏块的残差数据
<H.264/AVC视频编解码技术具体解释>视频教程已经在"CSDN学院"上线,视频中详述了H.264的背景.标准协议和实现,并通过一个实战project的形式对H.2 ...
Android IOS WebRTC 音视频开发总结（七九）-- WebRTC选择H.264的四大理由
本文主要介绍WebRTC选择H.264的理由(我们翻译和整理的,译者:weizhenwei,校验:blacker),最早发表在[编风网] 支持原创,转载必须注明出处,欢迎关注我的微信公众号blacke ...
FFmpeg的H.264解码器源代码简单分析：概述
===================================================== H.264源代码分析文章列表: [编码 - x264] x264源代码简单分析:概述 x26 ...

随机推荐

php代码中使用换行及(\n或\r\n和br)的应用
浏览器识别不了\n或\r\n,这两个换行符是文本换行符,文本文件有效;假设须要将结果输出到浏览器或打印到显示器,代码中使用br;假设仅仅是在源码中换行.则使用\n或\r\n,感兴趣的朋友能够了解下,也 ...
EularProject 39：给周长推断构成直角三角形个数
华电北风吹天津大学认知计算与应用重点实验室完毕日期:2015/7/30 Integer right triangles Problem 39 If p is the perimeter of a ...
lua学习笔记（八）
元表与元方法基本概念 1.lua中每个值都有一个元表 2.table和userdata可以有各自独立的元表 3.其它类型的值共享其类型所属的单一 ...
启动spring boot 异常
再我搭建spring boot工程后,run application的时候抛出下面异常 Exception /slf4j-log4j12-.jar). If you are using WebLogi ...
[译]GLUT教程 - 鼠标
Lighthouse3d.com >> GLUT Tutorial >> Input >> The Mouse 上一节我们讨论了怎么用GLUT的键盘函数跟OpenG ...
nginx 的uri、request_uri 区别
在nginx中有几个关于uri的变量,包括$uri $request_uri $document_uri,下面看一下他们的区别 : $request_uri: /stat.php?id=1585378 ...
ubuntu防火墙 ufw配置
https://www.cnblogs.com/ylan2009/articles/2321136.html
Mac OS X 安装Ruby
安装CocoaPods第一步起因:重装系统后需要重新安装CocoaPods网上搜了下发现很多都过时了,已经不能用了.而且taobao Gems源已经停止服务,现在有ruby-china提供服务 PS ...
android bug archive
console提示: No Launcher activity found! The launch will only sync the application package on the devi ...
一个Lumen多层拆分手记
这个项目除了最基本的MVC,routes和之前讲过的ServiceProvider(服务商)依赖注入,还有Action (动作) .Repositories(仓储)等... 先讲一下仓储吧, 一般JA ...

<开源项目分析>Cisco的开源视频加解码器THOR（H.264解码）

<开源项目分析>Cisco的开源视频加解码器THOR（H.264解码）的更多相关文章

随机推荐

热门专题