摘要:

WebSocket用于在Web浏览器和服务器之间进行任意的双向数据传输的一种技术。WebSocket协议基于TCP协议实现,包含初始的握手过程,以及后续的多次数据帧双向传输过程。其目的是在WebSocket应用和WebSocket服务器进行频繁双向通信时,可以使服务器避免打开多个HTTP连接进行工作来节约资源,提高了工作效率和资源利用率。

一、WebSocket诞生需求

互联网发展的早期,网站上只是一些静态展示页面。用户请求(Request)网站页面,网站回复(Response)页面内容给用户浏览器。因为需求简单,所以也没有很复杂的协议过程。这种形式的Request/Response交互流程如下图所示:

随着互联网技术的发展,带宽逐步提高,用户数也越来越庞大。对互联网的呈现内容提出了要求,随之出现了动态页面技术,对同一个页面,页面的某些部分对不同的访问用户,呈现的内容不同。相关的实现技术有CGI、ASP、PHP、JSP等。由于访问量的增加,WEB服务器同时处理的用户数也达到了万(10K)以上级别,这就是C10K问题:"The C10K problem"。为了缓解服务器压力,每次Request/Response后连接(TCP连接)继续保持,以及对同一个TCP连接,多次复用Request/Response的方法(也称为Pipeline)也提了出来。这就是HTTP/1.1协议中长连接的主要内容。

伴随移动互联网的发展,大量移动终端和其上的APP应用接入网络,HTML5技术也提了出来,以便支持WEB上的音视频播放、实时游戏、实时聊天等。催生了这样一个需求,当服务器有更新时,需要立即将数据发送给客户端,这就是基于服务器端的推送技术。

WEBSOCKET之前的解决方法大概这么几种: 1)轮询:客户端设置一个时间间隔,时间到以后,向服务器发送request询问有无新数据,服务器立即返回response,如果有更新则携带更新的数据。2)长连接(long poll): 和轮询相似,但是为阻塞模式的轮询,客户端请求新的数据request, 服务器会阻塞请求,直到有新数据后才返回response给客户端;然后客户端再重复此过程。这两种方式的特点,不断的建立HTTP连接,然后发送请求request,之后服务器等待处理。服务端体现的是一种被动性,同时这种处理方式,非常耗费网络带宽和服务器资源。

服务器向客户端推送更新时,因为被动性,对低延迟的应用体验不好;因为request/response的交互方式,对网络带宽和服务器带来了额外的负担(例如多次请求的HTTP头部, TCP连接复用会导致的Head-of-Line Blocking线头阻塞[2]等)。如果在单一的TCP连接中,使用双向通信(全双工通信)就能很好的解决此问题。这就是WebSocket技术的缘由。

二、WebSocket技术及协议

(一)WebSocket技术的优点有:

1)通过第一次HTTP Request建立了连接之后,后续的数据交换都不用再重新发送HTTP Request,节省了带宽资源;

2) WebSocket的连接是双向通信的连接,在同一个TCP连接上,既可以发送,也可以接收;

3)具有多路复用的功能(multiplexing),也即几个不同的URI可以复用同一个WebSocket连接。这些特点非常类似TCP连接,但是因为它借用了HTTP协议的一些概念,所以被称为了WebSocket。

(二)WebSocket协议

WebSocket看成是一种类似TCP/IP的socket技术;此socket在Web应用中实现,并获得了和TCP/IP通信一样灵活方便的全双向通信功能。

WebSocket协议由RFC 6455定义。协议分为两个部分: 握手阶段和数据通信阶段。

WebSocket为应用层协议,其定义在TCP/IP协议栈之上。WebSocket连接服务器的URI以"ws"或者"wss"开头。ws开头的默认TCP端口为80,wss开头的默认端口为443。

1、握手阶段

客户端和服务器建立TCP连接之后,客户端发送握手请求,随后服务器发送握手响应即完成握手阶段。如下图所示:

客户端握手请求类似如下:

  1. #首先看一个标准的websocket请求头
  2.  
  3. GET /chat HTTP/1.1
  4. Upgrade: websocket
  5. Connection: Upgrade
  6. Host: 127.0.0.1:8001
  7. Origin: http://127.0.0.1:8001
  8. Sec-WebSocket-Key: hj0eNqbhE/A0GkBXDRrYYw==
  9. Sec-WebSocket-Version: 13

可以看到使用http1.1 协议上面是标准的http的请求信息

但是熟悉http的小伙伴可以明显看出这里多出了一些信息。用于实现协议升级

  1. Upgrade: websocket
  2. Connection: Upgrade
  3. origin:xxxx
  4. Sec-WebSocket-Key: hj0eNqbhE/A0GkBXDRrYYw==
  5. Sec-WebSocket-Version: 13

upgrade websocket用于告诉服务器此连接需要升级到websocket。

而下面的Sec-WebSocket-Key是客户端也就是浏览器或者其他终端随机生成一组16位的随机base64编码的字节串。

最后Sec-WebSocket-Version就是当前使用协议的版本号了。

服务器在接受到上面的请求之后,会返回一个response 头包完成握手。

  1. HTTP/1.1 101 Switching Protocols
  2. Content-Length: 0
  3. Upgrade: websocket
  4. Sec-Websocket-Accept: ZEs+c+VBk8Aj01+wJGN7Y15796g=
  5. Server: TornadoServer/4.5.1
  6. Connection: Upgrade
  7. Date: Wed, 21 Jun 2017 03:29:14 GMT

由Sec-Websocket-Accept的key完成校验。 我贴一个生成的Sec-Websocket-Accept的代码大家感受一下

  1. import socket, base64, hashlib
  2.  
  3. sock = socket.socket(socket.AF_INET, socket.SOCK_STREAM)
  4. sock.setsockopt(socket.SOL_SOCKET, socket.SO_REUSEADDR, 1)
  5. sock.bind(('127.0.0.1', 9527))
  6. sock.listen(5)
  7. # 获取客户端socket对象
  8. conn, address = sock.accept()
  9. # 获取客户端的【握手】信息
  10. data = conn.recv(1024)
  11. print(data)
  12. """
  13. GET /ws HTTP/1.1\r\n
  14. Host: 127.0.0.1:9527\r\n
  15. Connection: Upgrade\r\n
  16. Pragma: no-cache\r\n
  17. Cache-Control: no-cache\r\n
  18. User-Agent: Mozilla/5.0 (Windows NT 6.1; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/71.0.3578.98 Safari/537.36\r\n
  19. Upgrade: websocket\r\n
  20. Origin: http://localhost:63342\r\n
  21. Sec-WebSocket-Version: 13\r\n
  22. Accept-Encoding: gzip, deflate, br\r\n
  23. Accept-Language: zh-CN,zh;q=0.9\r\n
  24. Cookie: session=a6f96c20-c59e-4f33-84d9-c664a2f29dfc\r\n
  25. Sec-WebSocket-Key: MAZZU5DPIxWmhk/UWL2+BA==\r\n
  26. Sec-WebSocket-Extensions: permessage-deflate; client_max_window_bits\r\n\r\n
  27. """
  28. # 以下动作是有websockethandler完成的
  29. # magic string为:258EAFA5-E914-47DA-95CA-C5AB0DC85B11
  30.  
  31. def get_headers(data):
  32. header_dict = {}
  33. header_str = data.decode("utf8")
  34. for i in header_str.split("\r\n"):
  35. if str(i).startswith("Sec-WebSocket-Key"):
  36. header_dict["Sec-WebSocket-Key"] = i.split(":")[1].strip()
  37.  
  38. return header_dict
  39.  
  40. headers = get_headers(data) # 提取请求头信息
  41.  
  42. magic_string = '258EAFA5-E914-47DA-95CA-C5AB0DC85B11'
  43. #Sec-WebSocket-Key: MAZZU5DPIxWmhk/UWL2+BA==
  44. value = headers['Sec-WebSocket-Key'] + magic_string #字符串类型
  45. ac = base64.b64encode(hashlib.sha1(value.encode('utf-8')).digest())
  46.  
  47. # 对请求头中的sec-websocket-key进行加密
  48. response_tpl = "HTTP/1.1 101 Switching Protocols\r\n" \
  49. "Upgrade:websocket\r\n" \
  50. "Connection: Upgrade\r\n" \
  51. "Sec-WebSocket-Accept: %s\r\n" \
  52. "WebSocket-Location: ws://127.0.0.1:9527\r\n\r\n"
  53. print(ac.decode('utf-8'))
  54. response_str = response_tpl % (ac.decode('utf-8'))
  55. # 响应【握手】信息
  56. conn.send(response_str.encode("utf8"))
  57. #
  58. while True:
  59. msg = conn.recv(8096)
  60. print(msg)

WebSocket原理及技术简介的更多相关文章

  1. CSS border三角、圆角图形生成技术简介

    http://www.zhangxinxu.com/wordpress/?p=794 一.前言 利用CSS的border属性可以生成一些图形,例如三角或是圆角.纯粹的CSS2的内容,没有兼容性的问题, ...

  2. python全栈开发day115、116-websocket、websocket原理、websocket加解密、简单问答机器人实现

    1.websocket 1.websocket 与轮询 轮询: 不断向服务器发起询问,服务器还不断的回复 浪费带宽,浪费前后端资源 保证数据的实时性 长轮询: 1.客户端向服务器发起消息,服务端轮询, ...

  3. WebSocket原理与实践(一)---基本原理

    WebSocket原理与实践(一)---基本原理 一:为什么要使用WebSocket?1. 了解现有的HTTP的架构模式:Http是客户端/服务器模式中请求-响应所用的协议,在这种模式中,客户端(一般 ...

  4. 常见爬虫/BOT 对抗技术简介(二)

    上一篇文章分别从网络协议,Robots文件,JS渲染,行为分析等多方面讲了些“反爬虫”,“反-反爬虫”技术. 点击查看:<常见爬虫/BOT 对抗技术简介(一)> 本文将主要介绍各种IP地址 ...

  5. websocket 原理

    自己写一个websocket import socket, hashlib, base64 sock = socket.socket() sock.bind(('127.0.0.1', 9000)) ...

  6. 浅析WebSocket 原理

    浅析WebSocket 原理 长恨此身非我有,何时忘却营营. 简介:先简单了解下WebSocket 原理,日后的使用中再进一步深入研究~ 一.什么是WebSocket WebSocket 是HTML5 ...

  7. websocket原理和基于c/c++实现的websocket协议栈(更新中)

    参考: 博客1:http://blog.sina.com.cn/s/blog_bf397e780102w25k.html https://www.cnblogs.com/barrywxx/p/7412 ...

  8. Java Servlet 技术简介

    Java Servlet 技术简介 Java 开发人员兼培训师 Roy Miller 将我们现有的 servlet 介绍资料修改成了这篇易于学习的实用教程.Roy 将介绍并解释 servlet 是什么 ...

  9. 【转】Android 防破解技术简介

    http://www.cnblogs.com/likeandroid/p/4888808.html Android 防破解技术简介 这几年随着互联网的不断发展,Android App 也越来越多!但是 ...

随机推荐

  1. Maven 梳理-自动创建Maven项目(非web)

    mvn archetype:create和mvn archetype:generate create is deprecated in maven 3.0.5 and beyond,在maven3.0 ...

  2. Spring 梳理-运行时动态注入bean

    动态注入的方法 使用占位符 使用Spring表达式

  3. IDEA新建一个多maven模块工程(有图)

    对于一些大型的项目来说,将项目的各个模块理清并进行管理,便于后续项目的维护,使用maven管理是很方便的,它可以很好的构建模块来设计项目的整体结构,对一些小型的项目不建议使用 1.新建父maven模块 ...

  4. 阿里云ECS服务器提示需要修复的漏洞问题

    1.漏洞: RHSA-2018:1842: kernel security, bug fix, and enhancement updateRHSA-2018:2299: NetworkManager ...

  5. Zookeeper监控(Zabbix)

      一直在弄监控,这些个中间件Zookeeper.Kafka......,平时也只知道一点皮毛,也就搭建部署过,没有真正的用过,一般都是大数据的同学在用,作为运维人员我需要对他做一个监控,由于对他不是 ...

  6. [Note] Visual Studio Team Service 中的项目 转到 Git

    Git-tf是微软发布的一个Git工具集的补充,用来让开发人员使用git命令与TFS交互,当然现在VSTS已经直接支持git了,现在讲讲以前用了VSTS的老项目如何转到git,保留所有的change ...

  7. c++ 对特定进程的内存监控

    在工具实现的过程中,遇到了内存爆了的问题,部分模型的规模可以达到10的100次方方甚至1000次方.(工具的主要算法涉及到了递归,递归深度会很深,所以也用到了ulimit修改栈空间来缓解爆栈的问题,治 ...

  8. 【Java】JDK安装及环境变量配置

    第一步:下载所需jdk(本次下载Win64位 java1.8...版本) 第二步:点击文件安装,直接下一步到底,成功安装,点击关闭. 第三步:安装完JDK后配置环境变量  计算机→属性→高级系统设置→ ...

  9. JavaScript中闭包的使用和各种继承介绍

    一.什么是闭包?     (1)闭包的概念:a.闭包就是函数嵌套时,让局部变量变成自由变量的环境,是一种让局部变量进化的方式.                 b.定义在一个函数内部的函数.      ...

  10. UnicodeDecodeError: 'gbk' codec can't decode byte 0xae in position 357: illegal multibyte sequence 错误解决方法(已解决)

    今天在搭建数据驱动测试框架的时候遇到这个错误: 好在我英语水平还不错(也就六级水平吧),根据英文提示说是多字节数据顺序是非法的 顺着错误往上找发现 File "C:\Users\Mr雷的电脑 ...