【视频编解码·学习笔记】4. H.264的码流封装格式
一、码流封装格式简单介绍:
H.264的语法元素进行编码后,生成的输出数据都封装为NAL Unit进行传递,多个NAL Unit的数据组合在一起形成总的输出码流。对于不同的应用场景,NAL规定了一种通用的格式适应不同的传输封装类型。
通常NAL Unit的传输格式分两大类:字节流格式和RTP包格式
字节流格式:
- 大部分编码器的默认输出格式
- 每个NAL Unit以规定格式的起始码分割
- 起始码:0x 00 00 00 01 或 0x 00 00 01
RTP数据包格式:
- NAL Unit按照RTP数据包的格式封装
- 使用RTP包格式不需要额外的分割识别码,在RTP包的封装信息中有相应的数据长度信息。
- 可以在NAL Unit的起始位置用一个固定长度的长度码表示整个NAL Unit的长度
实际应用中字节流格式更为常用,下面的均以字节流格式来介绍。
通过查阅H.264官方说明文档,了解NAL字节流格式(在附录B)
有用数据前面会加 0x 00 00 00 01 或 0x 00 00 01,作为起始码,两个起始码中间包含的即为有用数据流
如: 00 00 00 01 43 23 56 78 32 1A 59 2D 78 00 00 00 01 C3 E2 …… 中,红色的部分即为有效数据。
本次使用上一篇笔记中生成的test.264
作为例子。
使用Ultra Edit打开此文件,可以看到该文件的数据流:
接下来将写一个小程序,从二进制码流文件中截取实际的NAL数据。
二、C++程序 从码流中提取NAL有效数据:
新建一个VS工程,配置工程属性。将【常规-输出目录】和【调试-工作目录】改为$(SolutionDir)bin\$(Configuration)\
,【调试-命令参数】改为test.264
编译、运行程序。
在 bin\debug 目录下可看到生成的exe执行文件
接下来编写程序的功能:
提取起始码之间的有效数据
程序思路:
从码流中寻找 00 00 00 01 或 00 00 01序列,后面就是有效数据流,将之后的数据保存起来,直到遇到下一个(00) 00 00 01 停止。
下面开始编写程序:
① 打开码流文件
使用下面的代码测试,比较简单,不再解释,最后记得要把文件流关掉。
int _tmain(int argc, _TCHAR* argv[])
{
FILE *pFile_in = NULL;
// 打开刚才导入的二进制码流文件
_tfopen_s(&pFile_in, argv[1], _T("rb"));
// 判断文件是否打开成功
if (!pFile_in)
{
printf("Error: Open File failed. \n");
}
fclose(pFile_in);
return 0;
}
② 寻找起始码
- 使用数据类型
unsigned char
数据类型来存储单个字节码 - 为了减少内存使用,使用数组 refix3,存储连续的三个字节码
- 数组循环使用,新进来的数据放在弹出那位数据的位置上
- 即:数组的存数顺序为 [0][1][2],下一个字符放在[0]的位置上,此时数据顺序为[1][2][0],再下一次[2][0][1]以此类推
- 由于起始码有两种格式00 00 01 和 00 00 00 01,因此需要有两个判断分别对应
代码如下:
typedef unsigned char uint8;
static int find_nal_prefix(FILE **pFileIn)
{
FILE *pFile = *pFileIn;
// 00 00 00 01 x x x x x 00 00 00 01
// 以下方法为了减少内存,及向回移动文件指针的操作
uint8 prefix[3] = { 0 };
/*
依次比较 [0][1][2] = {0 0 0}; 若不是,将下一个字符放到[0]的位置 -> [1][2][0] = {0 0 0} ; 下次放到[1]的位置,以此类推
找到三个连0之后,还需判断下一个字符是否为1, getc() = 1 -> 00 00 00 01
以及判断 [0][1][2] = {0 0 1} -> [1][2][0] = {0 0 1} 等,若出现这种序列则表示找到文件头
*/
// 标记当前文件指针位置
int pos = 0;
// 标记查找的状态
int getPrefix = 0;
// 读取三个字节
for (int idx = 0; idx < 3; idx++)
{
prefix[idx] = getc(pFile);
}
while (!feof(pFile))
{
if ((prefix[pos % 3] == 0) && (prefix[(pos + 1) % 3] == 0) && (prefix[(pos + 2) % 3] == 1))
{
// 0x 00 00 01 found
getPrefix = 1;
break;
}
else if((prefix[pos % 3] == 0) && (prefix[(pos + 1) % 3] == 0) && (prefix[(pos + 2) % 3] == 0))
{
if (1 == getc(pFile))
{
// 0x 00 00 00 01 found
getPrefix = 2;
break;
}
}
else
{
fileByte = getc(pFile);
prefix[(pos++) % 3] = fileByte;
}
}
return getPrefix;
}
③ 提取有效数据
- 使用容器vector 存储有效数据
- 函数find_nal_prefix() 添加参数 vector &nalBytes
- 每次读取的数据都直接push到nalBytes中,若遇到起始码再把起始码pop掉
- 本函数需要重复执行,第一次文件指针移动到有效数据起始位置;第二次提取两段起始码间的有效数据;第三次在移动到下一个起始码后;第四次提取有效数据... 以此类推。
函数调整为:
static int find_nal_prefix(FILE **pFileIn, vector<uint8> &nalBytes)
{
FILE *pFile = *pFileIn;
// 00 00 00 01 x x x x x 00 00 00 01
// 以下方法为了减少内存,及向回移动文件指针的操作
uint8 prefix[3] = { 0 };
// 表示读进来字节的数值
uint8 fileByte;
/*
依次比较 [0][1][2] = {0 0 0}; 若不是,将下一个字符放到[0]的位置 -> [1][2][0] = {0 0 0} ; 下次放到[1]的位置,以此类推
找到三个连0之后,还需判断下一个字符是否为1, getc() = 1 -> 00 00 00 01
以及判断 [0][1][2] = {0 0 1} -> [1][2][0] = {0 0 1} 等,若出现这种序列则表示找到文件头
*/
nalBytes.clear();
// 标记当前文件指针位置
int pos = 0;
// 标记查找的状态
int getPrefix = 0;
// 读取三个字节
for (int idx = 0; idx < 3; idx++)
{
prefix[idx] = getc(pFile);
// 每次读进来的字节 都放入vector中
nalBytes.push_back(prefix[idx]);
}
while (!feof(pFile))
{
if ((prefix[pos % 3] == 0) && (prefix[(pos + 1) % 3] == 0) && (prefix[(pos + 2) % 3] == 1))
{
// 0x 00 00 01 found
getPrefix = 1;
// 这三个字符没用,pop掉
nalBytes.pop_back();
nalBytes.pop_back();
nalBytes.pop_back();
break;
}
else if((prefix[pos % 3] == 0) && (prefix[(pos + 1) % 3] == 0) && (prefix[(pos + 2) % 3] == 0))
{
if (1 == getc(pFile))
{
// 0x 00 00 00 01 found
getPrefix = 2;
// 这三个字符没用,pop掉 (最后那个1没填到vector中,不用pop)
nalBytes.pop_back();
nalBytes.pop_back();
nalBytes.pop_back();
break;
}
}
else
{
fileByte = getc(pFile);
prefix[(pos++) % 3] = fileByte;
nalBytes.push_back(fileByte);
}
}
return getPrefix;
}
主函数调整为:
#include "stdafx.h"
#include <stdio.h>
#include <vector>
typedef unsigned char uint8;
using namespace std;
int _tmain(int argc, _TCHAR* argv[])
{
FILE *pFile_in = NULL;
// 打开刚才导入的二进制码流文件
_tfopen_s(&pFile_in, argv[1], _T("rb"));
// 判断文件是否打开成功
if (!pFile_in)
{
printf("Error: Open File failed. \n");
}
vector<uint8> nalBytes;
find_nal_prefix(&pFile_in, nalBytes);
find_nal_prefix(&pFile_in, nalBytes);
for (int idx = 0; idx < nalBytes.size(); idx++)
{
printf("%x ", nalBytes.at(idx));
}
printf("\n");
find_nal_prefix(&pFile_in, nalBytes);
for (int idx = 0; idx < nalBytes.size(); idx++)
{
printf("%x ", nalBytes.at(idx));
}
printf("\n");
fclose(pFile_in);
return 0;
}
以第一节最后数据流为例,执行以上代码后,程序输出结果如下:
【视频编解码·学习笔记】4. H.264的码流封装格式的更多相关文章
- 【视频编解码·学习笔记】4. H.264的码流封装格式 & 提取NAL有效数据
一.码流封装格式简单介绍: H.264的语法元素进行编码后,生成的输出数据都封装为NAL Unit进行传递,多个NAL Unit的数据组合在一起形成总的输出码流.对于不同的应用场景,NAL规定了一种通 ...
- 视音频编解码学习工程:H.264分析器
=====================================================视音频编解码学习工程系列文章列表: 视音频编解码学习工程:H.264分析器 视音频编解码学习工 ...
- 【视频编解码·学习笔记】8. 熵编码算法:基本算法列举 & 指数哥伦布编码
一.H.264中的熵编码基本方法: 熵编码具有消除数据之间统计冗余的功能,在编码端作为最后一道工序,将语法元素写入输出码流 熵解码作为解码过程的第一步,将码流解析出语法元素供后续步骤重建图像使用 在H ...
- 【视频编解码·学习笔记】11. 提取SPS信息程序
一.准备工作: 回到之前SimpleH264Analyzer程序,找到SPS信息,并对其做解析 调整项目目录结构: 修改Global.h文件中代码,添加新数据类型UINT16,之前编写的工程中,UIN ...
- 【视频编解码·学习笔记】3. H.264视频编解码工程JM的下载与编解码
一.下载JM工程: JM是H.264标准制定团队所认可的官方参考软件.网址如下 http://iphome.hhi.de/suehring/tml/ 从页面中可找到相应的工程源码,本次选择JM 8.6 ...
- 【视频编解码·学习笔记】6. H.264码流分析工程创建
一.准备工作: 新建一个VS工程SimpleH264Analyzer, 修改工程属性参数-> 输出目录:$(SolutionDir)bin\$(Configuration)\,工作目录:$(So ...
- 【视频编解码·学习笔记】2. H.264简介
一.H.264视频编码标准 H.264视频编码标准是ITU-T与MPEG合作产生的又一巨大成果,自颁布之日起就在业界产生了巨大影响.严格地讲,H.264标准是属于MPEG-4家族的一部分,即MPEG- ...
- 【视频编解码·学习笔记】5. NAL Unit 结构分析
在上篇笔记中通过一个小程序,可以提取NAL Unit所包含的的字节数据.H.264码流中的每一个NAL Unit的作用并不是相同的,而是根据不同的类型起不同的作用.下面将对NAL Unit中的数据进行 ...
- 【视频编解码·学习笔记】10. 序列参数集(SPS)介绍
一.SPS 相关概念: SPS即 "Sequence Paramater Set",又称作序列参数集. SPS中保存了一组编码视频序列(Coded video sequence)的 ...
随机推荐
- fastboot模式
快速启动. 在安卓手机中fastboot是一种比recovery更底层的刷机模式. fastboot是一种线刷,就是使用USB数据线连接手机的一种刷机模式. recovery是一种卡刷,就是将刷机包放 ...
- 记录因webpack版本问题导致vue-cli快速搭建的项目运行时报错!
今日突然在群里见到好几个小伙伴说在创建vue项目后不能跑,会报错. 刚开始还不信,花了几分钟时间自己试了下,还真报错了!如下图 小伙伴的报错,如下图! 百思不得其解,看了运行的日志也找不出原因.于 ...
- Python selenium自动化网页抓取器
(开开心心每一天~ ---虫瘾师) 直接入正题---Python selenium自动控制浏览器对网页的数据进行抓取,其中包含按钮点击.跳转页面.搜索框的输入.页面的价值数据存储.mongodb自动i ...
- Effective Java 第三版——22. 接口仅用来定义类型
Tips <Effective Java, Third Edition>一书英文版已经出版,这本书的第二版想必很多人都读过,号称Java四大名著之一,不过第二版2009年出版,到现在已经将 ...
- 【margin和padding的区别】
margin和padding的区别 margin是指从自身边框到另一个容器边框之间的距离,就是容器外距离.(外边距) padding是指自身边框到自身内部另一个容器边框之间的距离,就是容器内距离.(内 ...
- 栈的存储结构的实现(C/C++实现)
存档 #include "iostream.h" #include <stdlib.h> #define max 20 typedef char elemtype; # ...
- hihoCoder #1094 : Lost in the City(枚举,微软苏州校招笔试 12月27日 )
#1094 : Lost in the City 时间限制:10000ms 单点时限:1000ms 内存限制:256MB 描述 Little Hi gets lost in the city. He ...
- 最小生成树&最短路基础算法总结
[最短路问题] 解决最短路问题有以下算法:Dijkstra算法,Bellman-Ford算法,Floyd算法,和SPFA算法和启发式搜索算法A*; 每个算法都有它的特点可以解决某些特定的问题,例如:F ...
- Lytro 光场相机重对焦C++实现以及CUDA实现
前面有几篇博客主要介绍了光场和光场相机相关知识,以及重对焦效果和多视角效果的展示.算是自己学习光场过程的一种总结. 这次贴上自己用OpenCV/C++编写的重对焦算法实现(包含CPU版和CUDA GP ...
- 关于VC++中virtual ~的含义
我知道virtual 的虚函数定义,~CMainFrame( )是析构函数,用来释放内存.C++的继承和派生内容.所有可以被用作基类的类一般都用虚析构函数当基类对象的指针或引用调用派生类对象时,如果基 ...