h264文件分析(纯c解析代码)
参考链接:1. 解析H264的SPS信息 https://blog.csdn.net/lizhijian21/article/details/80982403
2. h.264的POC计算 https://www.cnblogs.com/TaigaCon/p/3551001.html
3. 视音频数据处理入门:H.264视频码流解析 https://blog.csdn.net/leixiaohua1020/article/details/50534369
代码中的注释, 有对SPS,PPS,SLICE的分析,未进行代码分析(有些可能不准确)。
SPS语法
PPS语法
#include <stdio.h>
#include <stdlib.h>
#include <string.h>
#include <arpa/inet.h> #define TAB44 " "
#define PRINTF_DEBUG #define PRTNTF_STR_LEN 10 /************************************************************************************************************
** nalu header: 负责将VCL产生的比特字符串适配到各种各样的网络和多元环境中,
覆盖了所有片级以上的语法级别(NALU的作用, 方便网络传输)
**
-------------------------------------------------------------------------------------------------------------
** 字段名称 | 长度(bits) | 有关描述
-------------------------------------------------------------------------------------------------------------
** forbidden_bit | 1 | 编码中默认值为0, 当网络识别此单元中存在比特错误时, 可将其设为1, 以便接收方丢掉该单元
** nal_reference_idc | 2 | 0~3标识这个NALU的重要级别
** nal_unit_type | 5 | NALU的类型(类型1~12是H.264定义的, 类型24~31是用于H.264以外的,
RTP负荷规范使用这其中的一些值来定义包聚合和分裂, 其他值为H.264保留) ** nal_unit_type:
0 未使用
1 未使用Data Partitioning, 非IDR图像的Slice
2 使用Data Partitioning且为Slice A
3 使用Data Partitioning且为Slice B
4 使用Data Partitioning且为Slice C
5 IDR图像的Slice(立即刷新)
6 补充增强信息(SEI)
7 序列参数集(sequence parameter set, SPS)
8 图像参数集(picture parameter set, PPS)
9 分界符
10 序列结束
11 码流结束
12 填充
13...23 保留
24...31 未使用 ** SPS, PPS. SLICE等信息就不解析了. 为了减少bits, 用了哥伦布编码(自己解析比较麻烦, 但是网上有很多). ** SPS信息说明:
1. 视频宽高, 帧率等信息;
2. seq_parameter_set_id, 指明本序列参数集的id号, 这个id号将被picture参数集引用;
3. pic_width_in_mbs_minus1, 加1指定以宏块(16*16)为单位的每个解码图像的宽度, 即width = (pic_width_in_mbs_minus1 + 1) * 16
4. pic_height_in_map_units_minus1;
5. pic_order_cnt_type, 视频的播放顺序序号叫做POC(picture order count), 取值0,1,2;
6. time_scale, fixed_frame_rate_flag, 计算帧率(fps).
视频帧率信息在SPS的VUI parameters syntax中, 需要根据time_scale, fixed_frame_rate_flag计算得到: fps = time_scale / num_units_in_tick.
但是需要判断参数timing_info_present_flag是否存在, 若不存在表示FPS在信息流中无法获取.
同时还存在另外一种情况: fixed_frame_rate_flag为1时, 两个连续图像的HDR输出时间频率为单位, 获取的fps是实际的2倍. ** PPS信息说明:
1. pic_parameter_set_id, 用以指定本参数集的序号, 该序号在各片的片头被引用;
2. seq_parameter_set_id, 指明本图像参数集所引用的序列参数集的序号;
3. 其他高深的暂时还不理解, 指明参考帧队列等. ** SLICE信息说明:
1. slice_type, 片的类型;
2. pic_parameter_set_id, 引用的图像索引;
3. frame_num, 每个参考帧都有一个连续的frame_num作为它们的标识, 它指明了各图像的解码顺序. 非参考帧也有,但没有意义;
4. least significant bits;
5. 综合三种poc(pic_order_cnt_type), 类型2应该是最省bit的, 因为直接从frame_num获得, 但是序列方式限制最大;
类型1, 只需要一定的bit量在sps标志出一些信息还在slice header中表示poc的变化, 但是比类型0要节省bit, 但是其序列并不是随意的, 要周期变化;
对于类型0因为要对poc的lsb(pic_order_cnt_lsb, last bit)进行编码所以用到的bit最多, 优点是序列可以随意.
** 自我理解, 不一定准确(这边算显示顺序, 要根据SPS中的pic_order_cnt_type, 为2, 意味着码流中没有B帧, frame_num即为显示顺序;
为1, 依赖frame_num求解POC; 为0, 把POC的低位编进码流内, 但这只是低位, 而POC的高位PicOrderCntMsb则要求解码器自行计数,
计数方式依赖于前一编码帧(PrevPicOrderCntMsb与PrevPicOrderCntLsb. ** 一般的码流分析所见(未仔细证实): pic_order_cnt_type=2, 只有frame_num(无B帧);
pic_order_cnt_type=1, 暂未分析到;
pic_order_cnt_type=0, pic_order_cnt_lsb指示显示顺序, 一般为偶数增长(0, 2, 4, 6, 据说是什么场方式和帧方式, 场时其实是0 0 2 2 4 4). ** 编码与显示的原因: 视频编码顺序与视频的播放顺序, 并不完全相同, 视频编码时, 如果采用了B帧编码, 由于B帧很多时候都是双向预测得来的,
这时会先编码B帧的后向预测图像(P帧), 然后再进行B帧编码, 因此会把视频原来的播放顺序打乱, 以新的编码顺序输出码流,
而在解码断接收到码流后, 需要把顺序还原成原本的播放顺序, 以输出正确的视频. 在编解码中, 视频的播放顺序序号叫做POC(picture order count). ** 总结: 1. 码流中有很多SPS(序列), 一个序列中有多个图像, 一个图像中有多个片, 一个片中有多个块;
2. SPS中有seq_parameter_set_id. PPS中有pic_parameter_set_id, 并通过seq_parameter_set_id指明关联的序列.
SLICE中有pic_parameter_set_id, 指明关联的图像;
3. SPS中可计算宽高以及帧率, pic_order_cnt_type(显示顺序的类型);
SLICE HEADER中可算出解码的顺序, 以及根据pic_order_cnt_type算出显示顺序.
************************************************************************************************************/
typedef enum e_h264_nalu_priority
{
NALU_PRIORITY_DISPOSABLE = ,
NALU_PRIORITY_LOW = ,
NALU_PRIORITY_HIGH = ,
NALU_PRIORITY_HIGHEST = ,
} E_H264_NALU_PRIORITY; typedef enum e_h264_nalu_type
{
NALU_TYPE_SLICE = ,
NALU_TYPE_DPA = ,
NALU_TYPE_DPB = ,
NALU_TYPE_DPC = ,
NALU_TYPE_IDR = ,
NALU_TYPE_SEI = ,
NALU_TYPE_SPS = ,
NALU_TYPE_PPS = ,
NALU_TYPE_AUD = ,
NALU_TYPE_EOSEQ = ,
NALU_TYPE_EOSTREAM = ,
NALU_TYPE_FILL = ,
} E_H264_NALU_TYPE; typedef struct t_h264_nalu_header
{
unsigned char forbidden_bit:, nal_reference_idc:, nal_unit_type:;
} T_H264_NALU_HEADER; typedef struct t_h264_nalu
{
int startCodeLen; T_H264_NALU_HEADER h264NaluHeader; unsigned int bodyLen; unsigned char *bodyData;
} T_H264_NALU; /**********************************************************************************
1. h264的起始码: 0x000001(3 Bytes)或0x00000001(4 Bytes);
2. 文件流中用起始码来区分NALU.
***********************************************************************************/
static int FindStartCode3Bytes(unsigned char *scData)
{
int isFind = ; if ((==scData[]) && (==scData[]) && (==scData[]))
{
isFind = ;
} return isFind;
} static int FindStartCode4Bytes(unsigned char *scData)
{
int isFind = ; if ((==scData[]) && (==scData[]) && (==scData[]) && ( == scData[]))
{
isFind = ;
} return isFind;
} static int GetNaluDataLen(int startPos, int h264BitsSize, unsigned char *h264Bits)
{
int parsePos = ; parsePos = startPos; while (parsePos < h264BitsSize)
{
if (FindStartCode3Bytes(&h264Bits[parsePos]))
{
return parsePos - startPos;
}
else if (FindStartCode4Bytes(&h264Bits[parsePos]))
{
return parsePos - startPos;
}
else
{
parsePos++;
}
} return parsePos - startPos; // if file is end
} static void ParseNaluData(const unsigned int naluLen, unsigned char* const nuluData)
{
static int naluNum = ; unsigned char *data = NULL;
unsigned char priorityStr[PRTNTF_STR_LEN+] = {};
unsigned char typeStr[PRTNTF_STR_LEN+] = {}; T_H264_NALU_HEADER h264NaluHeader = {}; data = nuluData; memset(&h264NaluHeader, 0x0, sizeof(T_H264_NALU_HEADER)); h264NaluHeader.nal_reference_idc = data[]>> & 0x3;
h264NaluHeader.nal_unit_type = data[] & 0x1f; naluNum++; #ifdef PRINTF_DEBUG
switch (h264NaluHeader.nal_reference_idc)
{
case NALU_PRIORITY_DISPOSABLE:
sprintf(priorityStr, "DISPOS");
break; case NALU_PRIORITY_LOW:
sprintf(priorityStr, "LOW");
break; case NALU_PRIORITY_HIGH:
sprintf(priorityStr, "HIGH");
break; case NALU_PRIORITY_HIGHEST:
sprintf(priorityStr, "HIGHEST");
break; default:
break;
} switch (h264NaluHeader.nal_unit_type)
{
case NALU_TYPE_SLICE:
sprintf(typeStr, "SLICE");
break; case NALU_TYPE_DPA:
sprintf(typeStr, "DPA");
break; case NALU_TYPE_DPB:
sprintf(typeStr, "DPB");
break; case NALU_TYPE_DPC:
sprintf(typeStr, "DPC");
break; case NALU_TYPE_IDR:
sprintf(typeStr, "IDR");
break; case NALU_TYPE_SEI:
sprintf(typeStr, "SEI");
break; case NALU_TYPE_SPS:
sprintf(typeStr, "SPS");
break; case NALU_TYPE_PPS:
sprintf(typeStr, "PPS");
break; case NALU_TYPE_AUD:
sprintf(typeStr, "AUD");
break; case NALU_TYPE_EOSEQ:
sprintf(typeStr, "EOSEQ");
break; case NALU_TYPE_EOSTREAM:
sprintf(typeStr, "EOSTREAM");
break; case NALU_TYPE_FILL:
sprintf(typeStr, "FILL");
break; default:
break;
} printf("%5d| %7s| %6s| %8d|\n", naluNum, priorityStr, typeStr, naluLen);
#endif
} int main(int argc, char *argv[])
{
int fileLen = ;
int naluLen = ;
int h264BitsPos = ; unsigned char *h264Bits = NULL;
unsigned char *naluData = NULL; FILE *fp = NULL; if ( != argc)
{
printf("Usage: flvparse **.flv\n"); return -;
} fp = fopen(argv[], "rb");
if (!fp)
{
printf("open file[%s] error!\n", argv[]); return -;
} fseek(fp, , SEEK_END); fileLen = ftell(fp); fseek(fp, , SEEK_SET); h264Bits = (unsigned char*)malloc(fileLen);
if (!h264Bits)
{
printf("maybe file is too long, or memery is not enough!\n"); fclose(fp); return -;
} memset(h264Bits, 0x0, fileLen); if (fread(h264Bits, , fileLen, fp) < )
{
printf("read file data to h264Bits error!\n"); fclose(fp);
free(h264Bits); h264Bits = NULL; return -;
} fclose(fp); printf("-----+-------- NALU Table ------+\n");
printf(" NUM | IDC | TYPE | LEN |\n");
printf("-----+--------+-------+---------+\n"); while (h264BitsPos < (fileLen-))
{
if (FindStartCode3Bytes(&h264Bits[h264BitsPos]))
{
naluLen = GetNaluDataLen(h264BitsPos+, fileLen, h264Bits); naluData = (unsigned char*)malloc(naluLen);
if (naluData)
{
memset(naluData, 0x0, naluLen); memcpy(naluData, h264Bits+h264BitsPos+, naluLen); ParseNaluData(naluLen, naluData); free(naluData);
naluData = NULL;
} h264BitsPos += (naluLen+);
}
else if (FindStartCode4Bytes(&h264Bits[h264BitsPos]))
{
naluLen = GetNaluDataLen(h264BitsPos+, fileLen, h264Bits); naluData = (unsigned char*)malloc(naluLen);
if (naluData)
{
memset(naluData, 0x0, naluLen); memcpy(naluData, h264Bits+h264BitsPos+, naluLen); ParseNaluData(naluLen, naluData); free(naluData);
naluData = NULL;
} h264BitsPos += (naluLen+);
}
else
{
h264BitsPos++;
}
} return ;
}
最后如果您觉得本篇对您有帮助,可以打赏下,谢谢!!!
h264文件分析(纯c解析代码)的更多相关文章
- ts文件分析(纯c解析代码)
参考链接: 1. MPEG-2 TS码流分析 https://blog.csdn.net/zhubin215130/article/details/8958567 TS Header PAT PMT ...
- mpeg4文件分析(纯c解析代码)
参考链接: 1. MPEG4码流的帧率计算 https://blog.csdn.net/littlebee90/article/details/68924690 2. M ...
- h265文件分析(纯c解析代码)
参考链接: 1. HEVC码流解析 https://blog.csdn.net/CrystalShaw/article/details/80624804 2. HEVC编码结构:序列参数集SPS. ...
- mpeg2文件分析(纯c解析代码)
参考链接: 1. MPEG-2码流结构分析 https://www.cnblogs.com/CoderTian/p/9246225.html(本文语法采用这里的截图,代码原创) 1. mpeg2的码流 ...
- flv文件解析(纯c解析代码)
参考链接: 1. FLV科普12 FLV脚本数据解析-Metadata Tag解析 https://blog.csdn.net/cabbage2008/article/details/50500021 ...
- mp4文件解析(纯c解析代码)
参考链接:1. mp4文件格式解析 https://www.cnblogs.com/ranson7zop/p/7889272.html 2. MP4文件格式分析及分割实现(附源码) https: ...
- ps文件解析(纯c解析代码)
参考链接:1. PS流的格式和解析总结 http://www.cnblogs.com/lihaiping/p/4181607.html 2. TS科普5 PES包解析 https://blog.cs ...
- 使用ffmpeg将BMP图片编码为x264视频文件,将H264视频保存为BMP图片,yuv视频文件保存为图片的代码
ffmpeg开源库,实现将bmp格式的图片编码成x264文件,并将编码好的H264文件解码保存为BMP文件. 实现将视频文件yuv格式保存的图片格式的測试,图像格式png,jpg, gif等等測试均O ...
- linux内核中链表代码分析---list.h头文件分析(一)【转】
转自:http://blog.chinaunix.net/uid-30254565-id-5637596.html linux内核中链表代码分析---list.h头文件分析(一) 16年2月27日17 ...
随机推荐
- C#Razor模板引擎简单使用
引用 install-package RazorEngine 使用 public class TestDemo { private string name; public int Age { get ...
- 用Tensorflow实现DCGAN
1. GAN简介 最近几年,深度神经网络在图像识别.语音识别以及自然语言处理方面的应用有了爆炸式的增长,并且都达到了极高的准确率,某些方面甚至超过了人类的表现.然而人类的能力远超出图像识别和语音识别的 ...
- Js浮点运算存在精度问题
记得在某一次项目中,运用js进行一系列算数运算,计算中会存在浮点类型,就单纯的进行了计算,最后在测试过程中,主管在核对数据的时候发现计算的结果是有问题的,于是就很纳闷,在网上搜索找到了答案 ,htt ...
- Halcon 标定与准确测量
- [JavaScript] 表单验证不通过不提交的JS写法
主要是本世纪初的写法.<script> function validateForm(f) { if (f.name.value == "") { alert(" ...
- Django中ORM介绍和字段及字段参数
Object Relational Mapping(ORM) 1 ORM介绍 1.1 ORM概念 对象关系映射(Object Relational Mapping,简称ORM)模式是一种为了解决面向对 ...
- redist命令操作(三)--集合Set,有序集合ZSet
1.Redis 集合(Set) 参考菜鸟教程:http://www.runoob.com/redis/redis-sets.html Redis 的 Set 是 String 类型的无序集合.集合成员 ...
- 可迭代对象 TO 迭代器
可迭代对象并不是迭代器,只是支持迭代.可被for循环遍历的对象,比如list,dict ,tuple ,string都是可迭代对象 那既然支持迭代,那要如何用迭代替换for循环呢? 内置函数 iter ...
- sql语句学习及索引学习,未完待续,补充增删改查
1,查询出last_name 为 'Chen' 的 manager 的信息. select * fromwhere employee_id = ( selectfrom employees wher ...
- 转:为什么根据IP地址查询物理所在地,而不是mac地址?
来自 https://mp.weixin.qq.com/s/aOZQGMnMI2nkX4-qcJL4WQ 读者 不是说mac地址是计算机网卡唯一的地址吗?这样不是可以直接定位到某一台机器吗?为什么要用 ...