基于RTP的h.264视频传输系统设计(一)
一、H.264 的层次介绍
H.264 定义三个层次,每一个层次支持一组特定的编码功能。而且按照各个层次指定所指定的功能。基础层次(baselineprofile)支持I
帧和 P 帧【1】的帧内和帧间编码,支持自适应的可变长度的熵编码(CAVLC)。主要层次(main profile)支持隔行扫描视频。B帧【2】的帧内编码。使用加权预測的帧内编码和使用上下文的算术编码(CABAV)。扩展层次(extendedprofile)不支持隔行扫描视频和CABAC,但添加了码流之间高效的转化模式(SP 和 SI 片)和增强了错误码的恢复能力(数据切割)。基础层次的潜在应用主要包含可视电话、视频会议和无线通讯;主要层次的应用在电视广播和视频存储;扩展层次主要应用在流媒体应用程序中。然而,每一个文件有足够的灵活性,支持广泛的应用,这些应用的实例。不应被视为终于固定的。
二、H.264 的分层结构
H264 将其功能主要分为两层,即视频编码层(VCL)和网络提取层(NAL, Network Abstraction Layer)。VCL层负责编码。NAL层负责网络传输。
H.264 的视频提取层 NAL
H.264 的视频编码序列是由一系列的NAL 单元组成的。
我们知道00 00 00 01是NALU的開始标记
1. 网络抽象层单元类型 (NALU)
NALU 头由一个字节组成,它的语法例如以下:
+---------------+
|0|1|2|3|4|5|6|7|
+-+-+-+-+-+-+-+-+
|F|NRI|Type |
+---------------+
F: 1 个比特(bit ).
forbidden_zero_bit.在 H.264规范中规定了这一位必须为 0.
NRI:2 个比特. nal_ref_idc.取 00 ~ 11,似乎指示这个
NALU的重要性,如 00的
NALU解码器能够丢弃它而不影响图像的回放.只是普通情况下不太关心这个属性.
Type:5 个比特.
nal_unit_type.这个 NALU单元的类型.简述例如以下:
0 未定义
1-23NAL单元单个 NAL单元包.
24STAP-A 单一时间的组合包
24STAP-B 单一时间的组合包
26MTAP16 多个时间的组合包
27MTAP24 多个时间的组合包
28FU-A 分片的单元
29FU-B 分片的单元
30-31未定义
2. 打包模式rfc3550
RTP头有下面格式:
0 1 2 3
0 1 2 3 4 5 6 7 8 9 0 1 2 3 4 5 6 7 8 9 0 1 2 3 4 5 6 7 8 9 0 1
+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+
|V=2|P|X| CC |M| PT | sequence number |
+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+
| timestamp |
+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+
| synchronization source (SSRC) identifier |
+=+=+=+=+=+=+=+=+=+=+=+=+=+=+=+=+=+=+=+=+=+=+=+=+=+=+=+=+=+=+=+=+
| contributing source (CSRC) identifiers |
| .... |
+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+
RTP包头格式
前12个字节出如今每一个RTP包中,只在被混合器插入时。才出现CSRC识别符列表。
这些域有下面意义:
版本号(V):2比特 此域定义了RTP的版本号。此协议定义的版本号是2。(值1被RTP草案版本号使用。值0用在最初"vat"语音工具使用的协议中。
)
填充(P):1比特 若填料比特被设置。则此包包括一到多个附加在末端的填充比特,填充比特不算作负载的一部分。
填充的最后一个字节指明能够忽略多少个填充比特。
填充可能用于某些具有固定长度的加密算法,或者用于在底层数据单元中传输多个RTP包。
扩展(X):1比特 若设置扩展比特。固定头(仅)后面尾随一个头扩展。
CSRC计数(CC):4比特 CSRC计数包括了跟在固定头后面CSRC识别符的数目。
标志(M):1比特 标志的解释由详细协议规定。它用来同意在比特流中标记重要的事件,如帧边界。
负载类型(PT):7比特 此域定义了负载的格式,由详细应用决定其解释。协议能够规定负载类型码和负载格式之间一个默认的匹配。其它的负载类型码能够通过非RTP方法动态定义。
RTP发送端在随意给定时间发出一个单独的RTP负载类型;此域不用来复用不同的媒体流。
序列号(sequence number):16比特 每发送一个RTP数据包,序列号加1,接收端能够据此检測丢包和重建包序列。序列号的初始值是随机的(不可预測),以使即便在源本身不加密时(有时包要通过翻译器。它会这样做),对加密算法泛知的普通文本攻击也会更加困难。
时间戳(timestamp) 32比特 时间戳反映了RTP数据包中第一个字节的採样时间。
SSRC:32比特 用以识别同步源。
标识符应该被随机生成,以使在同一个RTP会话期中没有不论什么两个同步源有同样的SSRC识别符。
H.264 Payload 格式定义了三种不同的主要的负载(Payload)结构.接收端可能通过
RTP Payload的第一个字节来识别它们.这一个字节类似 NALU头的格式,而这个头结构的
NAL单元类型字段则指出了代表的是哪一种结构,这个字节的结构例如以下,能够看出它和
H.264的 NALU头结构是一样的.
+---------------+
|0|1|2|3|4|5|6|7|
+-+-+-+-+-+-+-+-+
|F|NRI|Type |
+---------------+
字段 Type:这个 RTP payload中
NAL单元的类型.这个字段和 H.264中类型字段的差别是,当
type
的值为 24 ~ 31表示这是一个特别格式的 NAL单元,而
H.264中,仅仅取 1~23是有效的值.
24STAP-A 单一时间的组合包
24STAP-B 单一时间的组合包
26MTAP16 多个时间的组合包
27MTAP24 多个时间的组合包
28FU-A 分片的单元
29FU-B 分片的单元
30-31未定义
可能的结构类型分别有:
1. 单一 NAL单元模式
即一个 RTP包仅由一个完整的 NALU组成.这样的情况下
RTP NAL头类型字段和原始的 H.264的
NALU 头类型字段是一样的.
2. 组合封包模式
就可以能是由多个 NAL单元组成一个 RTP包.分别有4种组合方式:
STAP-A, STAP-B, MTAP16, MTAP24.
那么这里的类型值各自是 24, 25, 26以及 27.
3. 分片封包模式
用于把一个 NALU单元封装成多个 RTP包.存在两种类型
FU-A和 FU-B.类型值各自是 28和
29.
2.1 单一 NAL单元模式(Single NAL Unit Packet:一个RTP
Payload仅包括一个NAL单元, NALU类型号为1~23,和H264标准码流很接近.)
对于 NALU的长度小于 MTU大小的包,一般採用单一
NAL单元模式.对于一个原始的 H.264 NALU单元常由
[Start Code] [NALU Header][NALU Payload]三部分组成,当中 StartCode用于标示这是一个NALU单元的開始,必须是
"00 00 00 01"或"00 00 01", NALU头仅一个字节,其后都是
NALU单元内容.
打包时去除 "00 00 01"或"00 00 00 01"的開始码,把其它数据封包的
RTP包就可以.
0 1 23
0 1 23 4 5 6 7 8 9 0 1 2 3 4 5 6 7 8 9 0 1 2 3 4 5 6 7 8 9 0 1
+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+
|F|NRI|type | |
+-+-+-+-+-+-+-+-+|
| |
|Bytes 2..n of a Single NAL unit |
| |
|+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+
|:...OPTIONAL RTP padding |
+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+
如有一个 H.264的 NALU是这种:
[0000 00 01 67 42 A0 1E 23 56 0E 2F ... ]
这是一个序列參数集 NAL单元. [00 00 00 01]是四个字节的開始码,
67是 NALU头, 42開始的数据是
NALU内容.
封装成 RTP包将例如以下:
[ RTPHeader ] [ 67 42 A0 1E 23 56 0E 2F ]
即仅仅要去掉 4个字节的開始码就能够了.
2.2 组合封包模式(Aggregation packet:一个RTP Payload包括多个NAL单元.有STAP-A,
STAP-B, MTAP-A,MTAP-B四种类型,编号依次为 24, 25,26, 27.)
其次,
当 NALU的长度特别小时,能够把几个
NALU单元封在一个 RTP包中.
0 1 23
0 1 23 4 5 6 7 8 9 0 1 2 3 4 5 6 7 8 9 0 1 2 3 4 5 6 7 8 9 0 1
+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+
| RTPHeader |
+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+
|STAP-ANAL HDR | NALU 1 Size | NALU 1 HDR |
+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+
|NALU 1 Data |
: :
++-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+
| |NALU 2 Size | NALU 2 HDR |
+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+
|NALU 2 Data |
: :
|+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+
|:...OPTIONAL RTP padding |
+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+
2.3Fragmentation Units (FUs).(Fragmentation unit:一个RTPPayload包括一个NAL单元的一部分.有FU-A,
FU-B两种,分别标记为 28, 29.)
而当 NALU的长度超过 MTU时,就必须对
NALU单元进行分片封包.也称为 Fragmentation Units (FUs).
0 1 23
0 1 23 4 5 6 7 8 9 0 1 2 3 4 5 6 7 8 9 0 1 2 3 4 5 6 7 8 9 0 1
+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+
| FUindicator | FU header | |
+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+|
| |
| FUpayload |
| |
|+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+
|:...OPTIONAL RTP padding |
+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+
Figure14. RTP payload format for FU-A
TheFU indicator octet has the following format:
+---------------+
|0|1|2|3|4|5|6|7|
+-+-+-+-+-+-+-+-+
|F|NRI|Type |
+---------------+
TheFU header has the following format:
+---------------+
|0|1|2|3|4|5|6|7|
+-+-+-+-+-+-+-+-+
|S|E|R|Type |
+---------------+
{
1,将FU-A包依据rtp的包序号和FU-A的header字节,组成完整264帧。
2。推断帧类型假设是idr帧,须要在帧头加上sps和pps,格式为:
起始码(0x00000001)+sps+起始码+pps+起始码+完整帧数据
3。帧末加入帧间分隔符“0x00, 0x00, 0x01, 0x09, 0x10”
4,使用网上精简过的"ff_264_dec_vc"进行解码。
该项目不支持imgconvert,可从最新ff源代码查找
并拷贝yuv420p_to_xxx函数进行合适转码
}
3. SDP 參数【3】
以下描写叙述了怎样在 SDP中表示一个 H.264流:
."m=" 行中的媒体名必须是 "video"
."a=rtpmap" 行中的编码名称必须是 "H264".
."a=rtpmap" 行中的时钟频率必须是 90000.
. 其它參数都包含在 "a=fmtp"行中.
如:
m=video49170 RTP/AVP 98
a=rtpmap:98H264/90000
a=fmtp:98profile-level-id=42A01E; sprop-parameter-sets=Z0IACpZTBYmI,aMljiA==
以下介绍一些经常使用的參数.
3.1packetization-mode:表示支持的封包模式.
当 packetization-mode的值为 0时或不存在时,必须使用单一
NALU单元模式.
当 packetization-mode的值为 1时必须使用非交错(non-interleaved)封包模式.
当 packetization-mode的值为 2时必须使用交错(interleaved)封包模式.
这个參数不能够取其它的值.
3.2sprop-parameter-sets:
这个參数能够用于传输 H.264的序列參数集和图像參数 NAL单元.这个參数的值採用
Base64进行编码.不同的參数集间用","号隔开.
3.3profile-level-id:
这个參数用于指示 H.264流的 profile类型和级别.由
Base16(十六进制)表示的 3个字节.第一个字节表示
H.264的 Profile类型,第
三个字节表示 H.264的 Profile级别:
3.4max-mbps:
这个參数的值是一个整型,指出了每一秒最大的宏块处理速度.
问题一:怎样把h.264的包打包成rtp包?
答:打包时去除H.264的開始码,然后加上rtp头就可以.
RTP打包H.264过程
1.打开.264文件
2.设置初始化套接字
3.从264码流中推断起始码。先读前3个字节,看是不是0x000001,假设不是的话,再多读取一个字节,看前4个字节是不是0x00000001。
(读到156行)
就是和AVI的压缩是一样的。 P是向前搜索的意思。他们都是基于I帧来压缩数据。
I帧表示关键帧,你能够理解为这一帧画面的完整保留;解码时仅仅须要本帧数据就能够完毕(由于包括完整画面)
P帧表示的是这一帧跟之前的一个关键帧(或P帧)的区别。P帧没有完整画面数据,仅仅有与前一帧的画面区别的数据)
【3】会话描写叙述协议(SDP)为会话通知、会话邀请和其他形式的多媒体会话初始化等目的提供了多媒体会话描写叙述。
这里是对网上资料自己的整理和自己加的东西。感谢网上各位的无私分享。
基于RTP的h.264视频传输系统设计(一)的更多相关文章
- H.264视频在android手机端的解码与播放(转)
随着无线网络和智能手机的发展,智能手机与人们日常生活联系越来越紧密,娱乐.商务应用.金融应用.交通出行各种功能的软件大批涌现,使得人们的生活丰富多彩.快捷便利,也让它成为人们生活中不可取代的一部分.其 ...
- 【转】实现RTP协议的H.264视频传输系统
1. 引言 随着信息产业的发展,人们对信息资源的要求已经逐渐由文字和图片过渡到音频和视频,并越来越强调获取资源的实时性和互动性.但人们又面临着另外一种不可避免的尴尬,就是在网络上看到生动 ...
- H.264视频的RTP荷载格式
Status of This Memo This document specifies an Internet standards track protocol for the Internet ...
- H.264 RTPpayload 格式------ H.264 视频 RTP 负载格式
H.264 RTPpayload 格式------ H.264 视频 RTP 负载格式 1. 网络抽象层单元类型 (NALU) NALU 头由一个字节组成, 它的语法如下: +------------ ...
- H.264 RTPpayload 格式------ H.264 视频 RTP 负载格式(包含AAC部分解析)
H.264 RTPpayload 格式------ H.264 视频 RTP 负载格式 1. 网络抽象层单元类型 (NALU) NALU 头由一个字节组成, 它的语法如下: +------------ ...
- 视音频数据处理入门:H.264视频码流解析
===================================================== 视音频数据处理入门系列文章: 视音频数据处理入门:RGB.YUV像素数据处理 视音频数据处理 ...
- 【图像处理】DVR H.264视频编码基本知识
视频编码技术基本是由ISO/IEC制定的MPEG-x和ITU-T制定的H.26x两大系列视频编码国际标准的推出.从H.261视频编码建议,到 H.262/3.MPEG-1/2/4等都有一个共同的不断追 ...
- 获得H.264视频分辨率的方法
转自:http://www.cnblogs.com/likwo/p/3531241.html 在使用ffmpeg解码播放TS流的时候(例如之前写过的UDP组播流),在连接时往往需要耗费大量时间.经过d ...
- H.264视频编解码SoC满足高清DVR设计需求
硬盘录像机(DVR)作为监控系统的核心部件之一,在10年里高速发展,从模拟磁带机的替代品演变成具有自己独特价值的专业监控数字平台,并被市场广泛接受.监控系统伴随DVR这些年的发展向着IP化.智能化发展 ...
随机推荐
- JavaScript操作数组。
1.shift:删除原数组第一项,并返回删除元素的值,原数组为空则返回undefined. 2.unshift:将参数添加到原数组开头,并返回数组的长度. 3.pop:删除原数组最后一项,并返回删除元 ...
- ORA-03113: end-of-file on & ORA-07445
--------------ORA-03113: end-of-file on-------------- SQL> show parameter background_dump; NAME T ...
- [Usaco2009 Nov]lights
题目描述: 给出$n$,$m$,表示有$n$盏灯和$m$条奇怪的电线,按下电线一段的灯后另一端会有影响. 求最少按几次. 题解: 高消解异或方程组,得到一堆自由元后搜索自由元状态,然后不断更新答案. ...
- Openjudge-百练-4013-踩方格
这题目是一道深搜的题目,我们写一个递归函数叫Ways(int i, int j ,int n),i j就是当前所处的坐标,我们设置一个visited数组,简称 V . 对于这个数组,首先初始化为零,然 ...
- c++_加法变乘法
加法变乘法 我们都知道:1+2+3+ ... + 49 = 1225现在要求你把其中两个不相邻的加号变成乘号,使得结果为2015 比如:1+2+3+...+10*11+12+...+27*28+29+ ...
- 杭电 4004 The Frog's Games 青蛙跳水 (二分法,贪心)
Description The annual Games in frogs' kingdom started again. The most famous game is the Ironfrog T ...
- 牛客网暑期ACM多校训练营(第四场) J 贪心
链接: https://www.nowcoder.com/acm/contest/143/J #include<bits/stdc++.h> using namespace std; lo ...
- str内部方法释义
1. __add__:字符串拼接 [示例]:>>> str1=‘good’>>> str1.__add__(‘morning’)>>> ‘good ...
- PTA 02-线性结构3 Reversing Linked List (25分)
题目地址 https://pta.patest.cn/pta/test/16/exam/4/question/664 5-2 Reversing Linked List (25分) Given a ...
- 让你的 CDN 费用省 50% 以上!图片瘦身的正确姿势
七牛云新推出的图片瘦身功能是做什么的? 打开七牛云的「数据处理」中的「图片瘦身」功能,在图片受到访问时,能够实时对图片进行瘦身,在保证分辨率和画质不变的情况下,可以将图片最高缩小 80%.当「图片瘦身 ...