什么是WebSokcet?

WebSocket是一种协议,并且是各大主流浏览器作为客户端支持的协议。它的目标就是用来替代基于 XMLHTTPRequest和长轮询的解决方案。应用在时时弹幕,消息推送,棋牌游戏等需要及时通讯的业务场景。

握手

WebSocket连接有两个阶段:握手(handshake)和数据传输(data transfer)。此握手非TCP三次握手,但是目的差不多,就是客户端告诉浏览器我想要使用WebSocket协议进行通讯。客户端需要发送如下请求,它是一个 HTTP Upgrade 请求:

  1. GET /chat HTTP/1.1
  2. Host: server.example.com
  3. Upgrade: websocket
  4. Connection: Upgrade
  5. Sec-WebSocket-Key: dGhlIHNhbXBsZSBub25jZQ==
  6. Origin: http://example.com
  7. Sec-WebSocket-Protocol: chat, superchat
  8. Sec-WebSocket-Version: 13

那么如果握手成功的话,服务器响应:

  1. HTTP/1.1 101 Switching Protocols
  2. Upgrade: websocket
  3. Connection: Upgrade
  4. Sec-WebSocket-Accept: s3pPLMBiTxaQ9kYGzzhZRbK+xOo=
  5. Sec-WebSocket-Protocol: chat

客户端发送握手请求

  1. Uri要满足如下格式:
  1. ws-URI = "ws:" "//" host [ ":" port ] path [ "?" query ]
  2. wss-URI = "wss:" "//" host [ ":" port ] path [ "?" query ]
  1. 在与服务端建立连接时,客户端必须方发送握手请求,请求是一个HTTP的升级协议(Upgrade)请求。并且该请求必须满足

    • 握手请求必须是一个正常的HTTP请求。
    • 请求方法必须为GET,并且HTTP协议最低为1.1
    • 请求头必须包含Host
    • 请求头必须包含Upgrade,并且值为websocket
    • 请求头必须包含Connection,并且值为Upgrade
    • 请求头必须包含Sec-WebSocket-Key,值为经过Base64转换的长度为16字节的一组数据
    • 请求头必须包含Origin,如果客户端是浏览器这个值肯定是有的,如果非浏览器的客户端,这个值可以随意改。
    • 请求头必须包含Sec-WebSocket-Version,并且值为13
    • 请求头可以带一个Sec-WebSocket-Protocol,这个值告诉服务端客户端想用的子协议,多个用逗号分开
    • 请求头可以带一个Sec-WebSocket-Extensions,这个值告诉服务端客户端支持的协议级别的扩展。
    • 请求头可以带一个和权限校验相关的头,例如Cookie,Authentication等

当客户端将握手请求发出去之后,就要等待服务端的响应了。当服务端成功响应之后,客户端还需要做如下校验:

  1. 返回的响应码非101,例如401,500,403,503 等等,客户端连接失败
  2. 返回的响应头部不包含Upgrade或者Upgrade的值不是websocket,客户端连接失败
  3. 返回的响应头部不包含Connection或者Connection的值不是Upgrade,客户端连接失败
  4. 返回的响应头部不包含Sec-WebSocket-Accept或者Sec-WebSocket-Accept的值并不是Base64(SHA1(Sec-WebSocket-Key+"258EAFA5-E914-47DA-95CA-C5AB0DC85B11")),客户端连接失败
  5. 返回的响应头部Sec-WebSocket-Extensions中的值并不是客户端发送的Sec-WebSocket-Extensions中的值,客户端连接失败
  6. 返回的响应头部Sec-WebSocket-Protocol中的值并不是客户端发送的Sec-WebSocket-Protocol中的值,客户端连接失败

服务端接收握手请求

如果服务端在处理请求过程中不满足一下任何一点,服务端都会终止处理该请求

  1. 必须是HTTP1.1+的GET请求
  2. 包含Host请求头
  3. 包含Upgrade值为WebSocket的请求头
  4. 包含Connection值为Upgrade的请求头
  5. 包含Sec-WebSocket-Key值为16字节长度的Base64字符串
  6. 包含Sec-WebSocket-Version值为13的请求头
  7. 非必须:Origin
  8. 非必须:Sec-WebSocket-Protocol
  9. 非必须:Sec-WebSocket-Extensions

当服务端确定这是一个正常的握手请求并且愿意处理此请求,那么服务端需要回应一个HTTP响应:

  1. 状态码必须为 101 Switching Protocol
  2. Upgrade:WebSocket
  3. Connection:Upgrade
  4. Sec-WebSocket-Accept,如上文所说,值为:Base64(SHA1(Sec-WebSocket-Key+"258EAFA5-E914-47DA-95CA-C5AB0DC85B11"))
  5. Sec-WebSocket-Protocol,根据客户端传的值
  6. Sec-WebSocket-Extensions,根据客户端传的值

至此,握手结束。连接状态由CONNECTING进入OPEN状态

协议帧

WebSocket的协议帧格式如下:

  • FIN 1bit

    包结束标志,1 代表最后一个消息包,0代表某一段消息包
  • RSV1, RSV2, RSV3: 每个1bit,共3bit

    值为0,除非协议扩展(Extensions)声明了非0的值的含义。如果服务端收到非0的值,并且没有相应的定义,那么服务端将直接终止连接。
  • Opcode 4bit

    x0 后续帧

    x1 文本帧

    x2 二进制帧

    x3-X7 非控制帧预留

    x8 关闭连接

    x9 PING

    xA PONG

    xB-xF 控制帧预留
  • Mask 1 bit 是否掩码。客户端向服务器发送,必须掩码。服务端向客户端发送不需掩码
  • PayLoad Length 7bits,7+16bits,7+64bits,如果值为 0-125,则数据包长度为0-125.如果值为126,则后2个字节为数据包长度:16bit。如果值为127,则后8个字节为数据包长度:64bit。
  • Masking-Key, 0-4bits.是否有值取决于 Mask 标识位是否为1.
  • Extension data X bytes 如果在握手时协商了扩展,会有值,否则为0
  • Application data y bytes 剩余消息包
  • PayLoad data (x+y)bytes 总消息包=Extension data + Application data.如果有掩码,解码公式如下:
  1. body[i] = body[i] ^ body[i % 4]

代码解析

下面我用tio网络通讯框架代码来解释一下上文中的内容,不必纠结具体代码,只要大概理解代码功能即可。



具体协议升级代码如下:



以上就是握手部分Http协议升级过程的代码部分。没有什么难理解的地方,只要对着文档要求去实现即可。不过要注意的是,这里是升级协议的过程,如果有其他业务处理,比如访问权限校验失败等,可以直接返回 HttpStatusCode 401.

协议帧解析:



总结

大致过了一遍RFC-6455文档,发现还是官方文档中解释的更详细的也更清楚一些,但是苦于英语水平不过关,有些部分理解起来比较困难。

参考资料

RFC-6455

RFC-6455 The WebSocket Protocol 浅读的更多相关文章

  1. The WebSocket Protocol

      [Docs] [txt|pdf] [draft-ietf-hybi-t...] [Diff1] [Diff2] [Errata] Updated by: 7936 PROPOSED STANDAR ...

  2. Supporting Multiple Versions of WebSocket Protocol 支持多版本WebSocket协议

    https://tools.ietf.org/html/rfc6455#section-4.4 4.4. Supporting Multiple Versions of WebSocket Proto ...

  3. The WebSocket Protocol 1000

    https://tools.ietf.org/html/rfc6455 https://tools.ietf.org/html/rfc6455 7.4.1. Defined Status Codes ...

  4. 小王子浅读Effective javascript(一)了解javascript版本

    哈哈,各位园友新年快乐!愚安好久没在园子里写东西了,这次决定针对javascript做一个系列,叫做<小王子浅读Effective javascript>,主要是按照David Herma ...

  5. Handlebars模板引擎中的each嵌套及源码浅读

    若显示效果不佳,可移步到愚安的小窝 Handlebars模板引擎作为时下最流行的模板引擎之一,已然在开发中为我们提供了无数便利.作为一款无语义的模板引擎,Handlebars只提供极少的helper函 ...

  6. Spark 源码浅读-SparkSubmit

    Spark 源码浅读-任务提交SparkSubmit main方法 main方法主要用于初始化日志,然后接着调用doSubmit方法. override def main(args: Array[St ...

  7. 浅读tomcat架构设计之tomcat生命周期(2)

    浅读tomcat架构设计和tomcat启动过程(1) https://www.cnblogs.com/piaomiaohongchen/p/14977272.html tomcat通过org.apac ...

  8. 浅读tomcat架构设计之tomcat容器Container(3)

    浅读tomcat架构设计和tomcat启动过程(1) https://www.cnblogs.com/piaomiaohongchen/p/14977272.html 浅读tomcat架构设计之tom ...

  9. learning websocket protocol

    websocket的产生背景: 众所周知,Web应用的通信过程通常是客户端通过浏览器发出一个请求,服务器端接收请求后进行处理并返回结果给客户端,客户端浏览器将信息呈现.这种机制对于信息变化不是特别频繁 ...

随机推荐

  1. 好用的随查工具Dash

    1. 好用的随查工具Dash 1.1. mac版本推荐 推荐一个很好用的工具,名字就叫Dash,当然缺点就是只有英文版,中文版可能也有但更新肯定不如英文及时 可以自由下载各种文档,比如下面的这图,左侧 ...

  2. 回调、Promise、async-await

    第一章 异步:现在与将来 程序中现在运行的部分和将来运行的部分之间的关系就是异步编程的核心. 场景:等待用户输入.从数据库或文件系统中请求数据.通过网络 发送数据并等待响应,或者是在以固定时间间隔执行 ...

  3. 在Node.js中使用ejsexcel输出EXCEL文件

    1.背景 在Nodejs应用程序中输出Excel,第一印象想到的一般是node-xlsx,这类插件不仅需要我们通过JS写入数据,还需要通过JS进行EXCEL显示样式的管理. 这是个大问题,不仅代码冗余 ...

  4. 【Python】生成器

    生成器是一种特殊的迭代器 # 斐波那契数列 10 def create_num(all_num): a, b = 0, 1 current_num = 0 while current_num < ...

  5. spring注入注解@Resource和@Autowired

    一.@Autowired和@Qualifier @Autowired是自动注入的注解,写在属性.方法.构造方法上,会按照类型自动装配属性或参数.该注解,可以自动装配接口的实现类,但前提是spring容 ...

  6. Oracle数据库主外键 级联删除记录

    /** * 1. NO ACTION :指当删除主表中被引用列的数据时,如果子表的引用列中包含该值,则禁止该操作执行. * * 2. SET NULL :指当删除主表中被引用列的数据时,将子表中相应引 ...

  7. Ecshop 2.x-3.x RCE漏洞复现

    说是复现,其实来源于一道CTF题目(Ecshop3.x RCE) 链接:http://www.whalwl.cn:8030 1. 漏洞概述 ECShop的user.php文件中的display函数的模 ...

  8. SRVCC B1,B2事件总结

    何为SRVCC? SRVCC(Single Radio Voice Call Continuity)是3GPP提出的一种VoLTE语音业务连续性方案,主要是为了解决当单射频UE 在LTE网络和2G/3 ...

  9. 浅析数据库(DB)、操作数据存储(ODS)和数据仓库(DW)的区别与联系

    文章背景: 相信大部分刚接触上面三个概念的同学,都多多少少会有些迷惑,现在我就给大家简单分析下这三者的关系,希望大家对这三者的概念理解有所帮助吧. 本文主要从下面两类关系来叙述上面三者的关系: 数据库 ...

  10. Java动态代理-JDK自带实现

    上篇文章讲解了什么是静态代理,但是静态代理有一个问题就是需要建立很多的代理类,这样我们需要修改代理的方法的时候,需要在每个类中都要修改,这对于我们来说:当代理类很多的时候工作量就会成倍的增加. 于是针 ...