关于 RTSP.

RTSP协议是一个非常类似HTTP协议的流控制协议。它们都使用纯文本来发送信息,而且rtsp协议的语法也和HTTP类似。Rtsp一开始这样设计,也是为了能够兼容使用以前写的HTTP协议分析代码 。这是个好消息。

它们主要的区别是HTTP协议是没有状态的, http协议在发送一个命令后,连接会断开,而且命令之间没有依赖性。不同的是RTSP的命令需要知道现在正处于一个什么状态,也就是说rtsp的命令总是按照顺序来发送,某个命令总在另外一个命令之前要发送。Rtsp不管处于什么状态都不会去断掉连接。

HTTP 协议默认使用80端口,而RTSP 默认使用554端口。如果一些服务器因为某些安全的原因而封掉了这个端口,那代理和防火墙可能不让RTSP消息通过,需要管理员去放开554端口,而使得rtsp协议能通过。

RTSP 并非只是微软在用!

这是一个公开的规范,在这个规范上开发了很多的流服务器。甚至Linux服务提供者和苹果的程序员也使用rtsp协议以及Real Networks流媒体。似乎整个世界的网络流传输都用这个协议。然而,微软并不只在rtsp上有所作为。

微软和RTSP.

在写这个文档的时候,微软正处于从首选MMS协议转换到首选采用RTSP协议的过程中。这个说明在Media Player9.0版本和流媒体服务器2003版本之后,我们会看到微软将rtsp协议作为流媒体传输的主要协议 。

随着时间慢慢的流逝,我们会发现mms协议正逐步走出人们的视野。It is only assumed that this is so MS can say they are being open with their protocols (rtsp is an open standard) while at the same time disregarding the need to publicise their own MMS protocol once its gone from media player. 然而,mms还没有真的死亡,至少在接下来的几年中我们依然可以看到它在流媒体传输中的身影。

是否微软的RTSP协议和标准的开放式RTSP不同?

是的。跟在RFC2326(1998年四月)中定义的原始RTSP协议相比,微软的rtsp协议有一些轻微的改动。我们网站上有本文档(还有后续版本)和一个简单的研究,它们可以帮助你了解这些信息。

区别在哪儿?

微软的rstp规范与标准rtsp协议相比最主要的改动是发送包payloads到客户端的方式,另外还有一些请求命令有一些改动。传输单个媒体包的机制并没有文档(就 我目前所知),这可能是微软要保留的信息。

就像MMS和HTTP 1.0 流协议使用一个媒体数据包头一样,RTSP也有。但是微软的数据包头格式没有在任何的rtsp文档中注明。在企图连接微软的rtsp服务器时,这是主要的问题。

微软RTSP协议的命令采用的语法和标准rtsp协议的命令语法一样,只有一些小的修改和添加,可以通过阅读网上的一些文档,就可以知道怎么去组成这些命令。微软rtsp命令部分已经有文档了。

一次典型的RTSP协议传输过程

这个例子为了简略,没有把发送接收的包放上来

To Server =>                                 NETWORK                         <= To Client

客户端连服务器的554端口

客户端发送“DESCRIBE”命令

服务器返回标准rtsp头

这个rtsp头和数据实体包含ASF文件头信息

以及所有的和媒体文件相关的流bit rate data

客户端发送“SETUP” 音频流媒体建立命令(stream 1)

服务器返回标准rtsp头

客户端发送“SETUP” 视频流媒体建立命令(stream 2)

服务器返回标准rtsp头

客户端发送“PLAY” 命令

服务器返回标准rtsp头

客户端发送 “SET_PARAMETER” 命令

这个命令还包含了一些客户端发送给服务器的信息,比如客户端的操作系统,CPU类型,播放器版本,日期时间等信息。 消息格式是tagged XML.

服务器返回标准rtsp头

#### 服务器即将开始一个流,发送媒体数据包(包含媒体数据包头),请看接下来的 ####

当要断开这个流的时候,服务器会向客户端发送一个EOF指示

服务器断开socket连接

一个典型的发给服务器的RTSP命令

DESCRIBE rtsp://wm.microsoft.com/ms/video/0001-hi.wmv RTSP/1.0

User-Agent: WMPlayer/9.0.0.2980 guid/3300AD50-2C39-46C0-AE0A-81D88F547805

Accept: application/sdp

Accept-Charset: UTF-8, *;q=0.1

X-Accept-Authentication: NTLM, Digest, Basic

Accept-Language: en-GB, *;q=0.1

CSeq: 1

Supported: com.microsoft.wm.srvppair, com.microsoft.wm.sswitch, com.microsoft.wm.eosmsg, com.microsoft.wm.predstrm

注意:

DESCRIBE rtsp://wm.microsoft.com/ms/video/0001-hi.wmv RTSP/1.0

这是要连接的url(服务器域名和流路径),后面跟着RTSP的版本。

User-Agent: WMPlayer/9.0.0.2980 guid/3300AD50-2C39-46C0-AE0A-81D88F547805

这条表示了客户端使用的是什么播放器,以及播放器的版本,再跟着一个独特的GUID。

X-Accept-Authentication: NTLM, Digest, Basic

客户端可以接受的authentication 类型

注意CSeq 要从1开始。服务器针对请求命令的应答也应该有Cseq: 加上数字 ,这样可以知道是针对哪条请求发的应答。

在客户端发送一个请求命令,得到成功的应答后,再发送下一条命令,CSeq的值要加1。

一个典型的RTSP应答消息,它们跟HTTP的消息非常的相似

一个针对客户端发的DESCRIBE命令,服务器的应答例子如下所示:

<<<HEADER START>>>

RTSP/1.0 200 OK

Content-Type: application/sdp

Vary: Accept

X-Playlist-Gen-Id: 27006

X-Broadcast-Id: 0

Content-Length: 3324

Date: Tue, 18 Nov 2003 15:57:05 GMT

CSeq: 1

Server: WMServer/9.0.0.3372

Supported: com.microsoft.wm.srvppair, com.microsoft.wm.sswitch, com.microsoft.wm.eosmsg, com.microsoft.wm.fastcache, com.microsoft.wm.packetpairssrc

Last-Modified: Tue, 18 Jun 2002 21:05:39 GMT

Cache-Control: x-wms-content-size=23180160, max-age=86399, must-revalidate, proxy-revalidate

Etag: "23180160"

<<<BODY START>>> ( 两个“/r/n”指示本SDP数据的开始 ).

<<< 这是Session Description Protocol 协议>>>

v=0

o=- 200311171721060249 200311171721060249 IN IP4 127.0.0.1

s=<No Title>

c=IN IP4 0.0.0.0

b=AS:1091

a=maxps:13632

t=0 0

a=control:rtsp://wm.microsoft.com/ms/video/0001-hi.wmv/

a=etag:{9D7121C3-1A1B-8ED6-6675-CB15D19D1FB7}

a=range:npt=3.100-173.903

a=recvonly

a=pgmpu:data:application/x-wms-contentdesc,8,language,31,0,,5,title,31,0,,6,author,31,0,,9,copyright,31,0,,35,WMS_CONTENT_DESCRIPTION_DESCRIPTION,31,0,,30,WMS_CONTENT_DESCRIPTION_RATING,31,0,,44,WMS_CONTENT_DESCRIPTION_SERVER_BRANDING_INFO,31,12,WMServer/9.0,51,WMS_CONTENT_DESCRIPTION_PLAYLIST_ENTRY_START_OFFSET,3,4,3100,47,WMS_CONTENT_DESCRIPTION_PLAYLIST_ENTRY_DURATION,3,6,170803,58,WMS_CONTENT_DESCRIPTION_COPIED_METADATA_FROM_PLAYLIST_FILE,3,1,1,42,WMS_CONTENT_DESCRIPTION_PLAYLIST_ENTRY_URL,31,17,0001-hi.wmv%0D%0A

a=pgmpu:data:application/vnd.ms.wms-hdr.asfv1;base64,Mcay...dY5mm2QCAQ==

m=audio 0 RTP/AVP 96

b=AS:35

b=RS:0

b=RR:0

a=rtpmap:96 x-asf-pf/1000

a=control:audio

a=stream:1

m=application 0 RTP/AVP 96

b=RS:0

b=RR:0

a=rtpmap:96 x-wms-rtx/1000

a=control:rtx

a=stream:65536

m=video 0 RTP/AVP 96

b=AS:471

b=RS:0

b=RR:0

a=rtpmap:96 x-asf-pf/1000

a=control:stream=2

a=stream:2

以/r/n/r/n结束

看下面这行:

a=pgmpu:data:application/vnd.ms.wms-hdr.asfv1;base64, Mcay..…==

这是真实的ASF文件头数据(被Base64编码过)。在将这部分头数据写到文件之前需要Base64解码成标准的ascii码。

SDP实体数据也告诉我们在媒体数据中都有些什么流
这个文件有2个媒体流:

ID = 1 有一个“audio”标志的音频流

ID = 2 有一个“stream=2”标志的视频流

还有第三个以“rtx”标志的流,这是一个控制流,并不携带任何的媒体内容。这个控制流使用stream ID = 65536.

看下面这行:

a=pgmpu:data:application/x-wms-contentdesc, …..

这表示了紧跟的数据是一个内容描述对象。

标准RTSP 消息的错误代码– 在应答消息的第一行表示

”100” ; Continue (all 100 range)

“200” ; OK

”201” ; Created

”250” ; Low on Storage Space

”300” ; Multiple Choices

”301” ; Moved Permanently

”302” ; Moved Temporarily

”303” ; See Other

”304” ; Not Modified

”305” ; Use Proxy

”350” ; Going Away

”351” ; Load Balancing

”400” ; Bad Request

”401” ; Unauthorized

”402” ; Payment Required

”403” ; Forbidden

”404” ; Not Found

”405” ; Method Not Allowed

”406” ; Not Acceptable

”407” ; Proxy Authentication Required

”408” ; Request Time-out

”410” ; Gone

”411” ; Length Required

”412” ; Precondition Failed

”413” ; Request Entity Too Large

”414” ; Request-URI Too Large

”415” ; Unsupported Media Type

”451” ; Parameter Not Understood

”452” ; reserved

”453” ; Not Enough Bandwidth

”454” ; Session Not Found

”455” ; Method Not Valid in This State

”456” ; Header Field Not Valid for Resource

”457” ; Invalid Range

”458” ; Parameter Is Read-Only

”459” ; Aggregate operation not allowed

”460” ; Only aggregate operation allowed

”461” ; Unsupported transport

”462” ; Destination unreachable

”500” ; Internal Server Error

”501” ; Not Implemented

”502” ; Bad Gateway

”503” ; Service Unavailable

”504” ; Gateway Time-out

”505” ; RTSP Version not supported

”551” ; Option not supported

RTSP数据包头(每一个媒体数据包的开头)

二进制包头数据后面紧跟着媒体数据包(asf/wmv 等等)。

Values are in Big Endian order. (not little endian as in mms and http protocols).

--------这些数据位在公开的RTSP 文档中也指示了-------

BYTE                 “$” or 0x24

BYTE                    Channel id ,一般= 0x00, 你可以看到“P” 或者 0x50 for packet pairs data, 看下面的描述.

WORD               数据包的长度(从接下来的区域算起)

-------- 接下来的数据位表示的含义还没有确定,微软也许会指出-----------

WORD      ???    填充0x80E0

WORD                   序列号。这个值被初始化成一个随即的值,然后在每一个数据包发送时加1。  在这个值达到0xffff时,它将设置成0。跟其他协议相比,这个值得范围比较小(16位),使得它不能在写媒体数据到文件中时做为有指导性的序列号使用。大的流媒体文件有很多的数据包,包的数量超过了他的范围,所以可能会发生相同序列号的包。只使用这个序列号来作错误检验——缺少了某一个序列号的包意味着发生了丢包错误。

DWORD                发送时间。This is stated in milliseconds and shows the time that this media packet should be presented. 预先录制的文件设置T = 0 ,实况流设置一个不同于0的值。

DWORD                ??? 固定的一个值. 它是一个随即值,但是一旦一个rtsp会话建立,这个值就一直保持不变,所有的数据包都是这个值。可以使用这个值作为每次会话的一个ID,新的rtsp会话会有新的值。

BYTE                     标志位, 看下面:

Bit 0 (lsb)      ? = 0

Bit 1               ? = 0

Bit 2               ? = 0

Bit 3               ? = 0

Bit 4               Duration field present in pre header if set (see below)

Bit 5               ? = 0

Bit 6               ? = 1 (总是1)

Bit 7 (msb)    被设置成1,表示数据包含有一个关键桢

BYTE                     ??? 总是设置成0

WORD                   包长度。此16位表示从上面标志位域开始的包长度。

DWORD                [可选的] 持续时间。只有上面的标志位的Bit4 被设置了才会有这个域,否则就没有这个域。表示为多少毫秒,指出了传输的媒体包的总持续时间。

<<< 下面跟着媒体数据, like 82 00 00 ….. >>>

在RTSP请求和应答中使用的有用的标签值:

CSeq:                                    命令的序列号,逐1增加。

所有的请求和应答都用得到。

Content-Length:                                  这个标记的存在说明后面有实体数据,而且给出了这个数据块的大小,单位是byte

X-Playlist-Gen-Id:                               用来检查播放列表是否有效。这个标记最初在客户端发送DESCRIBE命令后使用。

客户端在发送“SETUP”命令给服务器时必须回应一样的值

X-Playlist-Seek-Id:                              值必须和X-Playlist-Gen-Id 域的值相同,在PLAY请求命令中使用.

Blocksize:                                             媒体包的总长度,单位是byte

Session:                                                 Session ID是用作客户端和服务器之间是否是正确的连接。在客户端发送SETUP命令,服务器会在应答消息头里面发送这个值给客户端。 We only see the Session value on the first stream selected (usually this is the audio stream)。 Session 值相当的长,一共有20个阿拉伯数字。

紧跟着Session值, 你可以看到一个值:       “timeout= xxxx”。. 这是服务器需要得到回应或者ACK回应(为了保持连接)的时间。客户端必须在这个时段内发送一个ACK ,要不然连接就要被强制中断。一个ACK就是发送一条GET_PARAMETER命令到服务器。

X-Accept-Authentication:                 允许的authentication 方法

NTLM, Digest 和 Basic 是标准的

X-Broadcast-Id:                                  是否是实况或者是先期录制的流。

0 表示先期录制,其他的值表示是实况。

Range:                                                   Range is the offset and end time positions to stream the media. For a zero start and full file stream, this value is set to:   npt=0.000-

where 0.000 is the offset and –0.000 (optional) is the ending time. Values are stated in seconds.

Speed:                                                    用来调整传输到客户端的流得速度。假如你的带宽可以接受更高速的数据传送,这个域的值可以设置大于1来加速下载数据

普通情况  Speed: 1.0       i.e. x1 rate

Media player 使用 :     Speed: 1.294

这个主要取决于你的网络连接速度。

Server:                                                   服务器类型和软件版本

EOF:                                                       文件结束标记,也是流的结束标记

Date:                                                      日期时间,下面举个例子:

Tue, 18 Nov 2003 15:57:07 GMT

Bandwidth:                                           流需要的最大带宽,bits/秒

Transport:                                             使用什么协议来传输数据,比如TCP或者UDP等

Etag:                                                      实体标记Entity tag,是一个分配给会话的值,就像"23180160"

Supported:                                            支持的COM modules , 有的是可选的.

com.microsoft.wm.srvppair       - packet pairs at server

com.microsoft.wm.sswitch         - stream ID selection com.microsoft.wm.eosmsg       - end of stream message com.microsoft.wm.fastcache       - fast cache for buffering com.microsoft.wm.packetpairssrc.  - packet pairs

Content-Type:                                     此域用来表示命令或者应答的用意

下面是常用的几种类型:

application/x-wms-Logconnectstats

这个在SET_PARAMETER命令中用到,表示将客户端的信息登记到服务器上。

application/sdp

这个表示接下来数据包里面的是sdp数据,它是在服务器对DESCRIBE命令的应答包中。

application/x-wms-contentdesc

表示紧跟的数据是一个内容描述对象,它设置the layout of the dialog.

application/vnd.ms.wms-hdr.asfv1

表示跟着一个流媒体头信息(ASF header),

可以用BASIC 或者DIGEST来解码。

application/x-rtsp-packetpair

Packet Pair data is random non-compressible data and is sent to the client and timed for response times. 它被用来确定连接的可用带宽。Packet pair data 是可选的,你不必经常去请求这个数据。 这个是在发送GET_PARAMATER命令到服务器时,用到的。.

RTSP详解的更多相关文章

  1. 流媒体协议之RTSP详解20170922

    一.RTSP协议介绍 1.什么是rtsp? RTSP协议以客户服务器方式工作,,如:暂停/继续.后退.前进等.它是一个多媒体播放控制协议,用来使用户在播放从因特网下载的实时数据时能够进行控制, 因此 ...

  2. javaCV开发详解之4:转流器实现(也可作为本地收流器、推流器,新增添加图片及文字水印,视频图像帧保存),实现rtsp/rtmp/本地文件转发到rtmp流媒体服务器(基于javaCV-FFMPEG)

    javaCV系列文章: javacv开发详解之1:调用本机摄像头视频 javaCV开发详解之2:推流器实现,推本地摄像头视频到流媒体服务器以及摄像头录制视频功能实现(基于javaCV-FFMPEG.j ...

  3. javaCV开发详解之3:收流器实现,录制流媒体服务器的rtsp/rtmp视频文件(基于javaCV-FFMPEG)

    javaCV系列文章: javacv开发详解之1:调用本机摄像头视频 javaCV开发详解之2:推流器实现,推本地摄像头视频到流媒体服务器以及摄像头录制视频功能实现(基于javaCV-FFMPEG.j ...

  4. javaCV开发详解之8:转封装在rtsp转rtmp流中的应用(无须转码,更低的资源消耗)

    javaCV系列文章: javacv开发详解之1:调用本机摄像头视频 javaCV开发详解之2:推流器实现,推本地摄像头视频到流媒体服务器以及摄像头录制视频功能实现(基于javaCV-FFMPEG.j ...

  5. linux查看端口及端口详解

    今天现场查看了TCP端口的占用情况,如下图   红色部分是IP,现场那边问我是不是我的程序占用了tcp的链接,,我远程登陆现场查看了一下,这种类型的tcp链接占用了400多个,,后边查了一下资料,说E ...

  6. CDN学习笔记二(技术详解)

    一本好的入门书是带你进入陌生领域的明灯,<CDN技术详解>绝对是带你进入CDN行业的那盏最亮的明灯.因此,虽然只是纯粹的重点抄录,我也要把<CDN技术详解>的精华放上网.公诸同 ...

  7. CDN技术详解及实现原理

    CDN技术详解 一本好的入门书是带你进入陌生领域的明灯,<CDN技术详解>绝对是带你进入CDN行业的那盏最亮的明灯.因此,虽然只是纯粹的重点抄录,我也要把<CDN技术详解>的精 ...

  8. javaCV开发详解之技术杂烩:javaCV能帮我们做什么?能实现什么功能?ffmpeg和openCV能实现功能,javaCV如何做到更快、更简单的实现相应的功能?等等一堆实用话题

    前言: 该篇文章旨在帮助刚接触javaCV的盆友系统的认识音视频.javaCV.图像处理相关的体系知识和一些实用的知识. 序: javaCV早期因为内置了openCV库,所以常用来做图像识别应用,现在 ...

  9. javaCV开发详解之7:让音频转换更加简单,实现通用音频编码格式转换、重采样等音频参数的转换功能(以pcm16le编码的wav转mp3为例)

    javaCV系列文章: javacv开发详解之1:调用本机摄像头视频 javaCV开发详解之2:推流器实现,推本地摄像头视频到流媒体服务器以及摄像头录制视频功能实现(基于javaCV-FFMPEG.j ...

随机推荐

  1. 简析hotjar录屏功能实现原理

    简析hotjar录屏功能实现原理 众所周知,hotjar中录屏功能是其重要的一个卖点,看着很牛X酷炫的样子,今天就简单的分析一下其可能实现(这里只根据其请求加上个人理解分析,并不代表hotjar中真实 ...

  2. 洛谷 - P1337 - 平衡点/吊打XXX

    一眼看过去以为是模拟退火/随机增量之类的.感觉先跑个凸包,然后在凸包内随机转移. 根据力臂长度*重量计算每个方向的分力?判断一个点比原来的点更平衡,是指他们的合力更接近0?每次判断要遍历一次,使用n的 ...

  3. CF487E Tourists【圆方树+tarjan+multiset+树剖+线段树】

    圆方树不仅能解决仙人掌问题(虽然我仙人掌问题也没用过圆方树都是瞎搞过去的),还可以解决一般图的问题 一般图问题在于缩完环不是一棵树,所以就缩点双(包括双向边) 每个方点存他所在点双内除根以外的点的最小 ...

  4. bzoj 3261 最大异或和【可持久化trie】

    因为在后面加数字又求后缀和太麻烦,所以xor[p...n]=xor[1...n]^xor[p-1...n]. 首先处理出来区间异或前缀和,对前缀和建trie树(在最前面放一棵0表示最开始的前缀和 然后 ...

  5. IT兄弟连 Java Web教程 经典面试题2

    1.Servlet的工作流程? Servlet是运行在Servlet容器中的,由Servlet容器来负责Servlet实例的查找.创建以及整个生命周期的管理,Servlet整个生命周期可以分为四个阶段 ...

  6. GitHub笔记---邮箱访问错误

    GitHub地址太长,所以需要一个变量来保存 把远程仓库赋值给一个变量,以后就用就这变量代表这个地址 GitHub推送push 推送过程中发生一个小插曲,出现了错误,错误提示我复制过来吧 remote ...

  7. python 处理时间和日期

    转自: https://www.cnblogs.com/65702708/archive/2011/04/17/2018936.html Python格式化日期时间的函数为datetime.datet ...

  8. AtCoder Grand Contest 011 F - Train Service Planning

    题目传送门:https://agc011.contest.atcoder.jp/tasks/agc011_f 题目大意: 现有一条铁路,铁路分为\(1\sim n\)个区间和\(0\sim n\)个站 ...

  9. MyEclipse常用快捷键及快捷键大全

    MyEclipse常用快捷键:alt+/     代码提示ctrl+shift+F   代码排版ctrl + /     注释当前行 ctrl+D      删除当前行 Alt+C       拷贝当 ...

  10. JAVA平台的理解

    主题:  JAVA是解释执行还是编译执行? 我的答案 : 混合模式 闲谈 : 1. JAVA(write once,run anywhere): 2. GC(Garbagae Collection), ...