1.HTTP请求的过程

世界上几乎所有的HTTP通信都是由TCP/IP承载的,当发生HTTP请求时,实际上经过了以下几个步骤:

①浏览器从请求的URL中解析主机名

②浏览器查询这个主机名的IP地址

③浏览器获得端口号

④浏览器发起到IP:端口的连接(TCP连接)

⑤浏览器向服务器发送一条请求报文

⑥浏览器从服务器读取响应报文

⑦浏览器关闭连接(TCP连接)

图解:

2.TCP性能聚焦点

2.1TCP连接的握手时延

建立TCP连接甚至是发送任意数据之前,TCP软件之间都会交换一系列的IP分组,对连接参数进行沟通

所以,如果每次都只传输少量的数据,导致最终建立连接的次数增加,那么这些交换过程就会严重降低HTTP性能

2.2TCP段中的标记和首部

每个TCP段中都会至少装载40个字节的标记和首部,那么举个例子:

1000个字节的数据传输量,用10个TCP段装载,那么至少在原数据量的基础上增加40X10=400个字节的数据量;

如果用100个TCP段装载,那么至少在原数据量的基础上增加40X100=4000个字节的数据量;

如此一来,平白无故多了3600个字节的传输量,自然性能就严重下降了。

2.3TCP慢启动

TCP慢启动限制了每一个TCP端点在任意时刻可以传输的分组数,每成功接收一个分组,就会拥有发送另外两个分组

的权限,接收了两个分组,就会有发送另外四个分组的权限,以此类推。如果一个HTTP事务有大量数据要发送,必

须要依据以上的规则,此种方式被称为“打开拥塞窗口”。

由于这种特性,新连接的传输速度会比已经交换过一定数据量的“已调谐”的连接慢一点,因为后来的TCP连接单次能发

送的分组数比前者少,所以HTTP中有一些可以重用现存TCP连接(旧连接)的工具,这就是“持久连接”。

3.TCP连接性能提升解决方案

3.1Nagle算法

这个算法是为了解决2.2中TCP段多导致多出的标记和首部数据问题;

该算法鼓励发送全尺寸的TCP段(LAN上最大分组大约是1500字节,在因特网上是几百字节),只有当所有其他分组

都被确认之后,该算法才允许发送非全尺寸的分组;如果其他分组仍在传输,那就将数据缓存起来,只有当挂起分组

被确认或者缓存中积累了足够发送一个全尺寸分组的数据时,才会将缓存数据发送出去。

3.2串行事务时延问题(该栏目下每个灰框表示一个TCP连接,黑线表示HTTP事务)

所谓串行事务,打个比方,如果一个web页面有三张图片,那么浏览器就需要发起4个HTTP事务来显示此页面(HTML

+3张嵌入的图片),倘若每个事务都需要一条新的TCP连接,那么每条连接的连接时延和慢启动时延就会叠加起来,造

成最终加载页面的总时间增加,为此,有几种现存或者新兴的方法可以针对此问题进行处理从而提高HTTP连接性能。

3.2.1并行连接

所谓并行连接呢,顾名思义了,就是同时打开多条TCP连接,并行地执行多个HTTP事务,就上面的例子来讲,同时打开

4条TCP连接,相比串行事务而言,性能上有一定提升。

为什么说只是有一定的提升呢,因为并行连接的速度受限于网络带宽,先后打开了4条TCP连接,因为是并行地,他们会去

竞争这有限的带宽,可能之前串行的时候事务1只要花费100ms完成,因为此时没有其他的事务与之竞争带宽,并行之后,

可能需要300ms才能执行完这个事务,因为争夺到的带宽不足以使事务1的速度最大化。

那么,可能有人就会说了,我家的网是200M光纤的,为什么访问百度的时候和别人20M的网速差不多呢,首先,网页数据

量小差异不容易体现,其次服务器不会任由某个客户端并行地发起任意数量个TCP连接,倘若一个浏览器并行地打开100个

连接,那100个浏览器就是并行地打开10000个连接啊,服务器可吃不消,实际上呢,浏览器确实使用了并行连接,但不是

100个,通常是4个,并且服务器可以随意关闭来自特定客户端的超量连接(这或许就是之前我数据采集的时候下载10000+

数据之后访问网站受限的原因了)

但总的来说,并行连接,给人感觉还是比串行事务的处理方式快一点,4张图同时慢速地加载,和4张图分先后一次加载给人

感觉上是不同的。

3.2.2 持久连接

我们知道,TCP连接的连接建立阶段以及慢启动是很耗时的,那么我为什么一次又一次地在这个阶段反复花时间呢,于是持

久连接就出现了,打开TCP连接后,不关闭连接,等待下一个事务的进入,还是就之前的例子来说,建立第一次TCP连接之

后,不关闭连接,事务2、3、4陆续进入这个连接直到事务结束才关闭连接,于是:

相较之前的4个事务4次连接来说,这里少了3次TCP连接的步骤,自然时间上也就减少了,性能也就提升了。

3.2.3持久连接+并行连接

现在,很多web应用程序都会打开少量的并行连接,其中的每一个都是持久连接。

持久连接有两种类型:HTTP/1.0+ "keep-alive"连接、HTTP/1.1 "persistent"

Http权威指南(TCP连接)的更多相关文章

  1. HTTP权威指南之连接管理

    TCP连接世界上几乎所有的 HTTP 通信都是由 TCP/IP 承载的, TCP/IP 是全球计算机及网络设备都在使用的一种常用的分组交换网络分层协议集. 客户端应用程序可以打开一条 TCP/IP 连 ...

  2. 和我一起学《HTTP权威指南》——连接管理

    连接管理 1.TCP连接 几乎所有的HTTP通信都是由TCP/IP承载的. 浏览网页时客户端执行的操作: 如浏览http://www.joes-hardware.com:80/power-tools. ...

  3. 4.nodejs权威指南--TCP和UDP

    1. TCP和UDP 1.1 TCP服务端 var net = require('net'); var server = net.createServer(); server.on('connecti ...

  4. HTTP权威指南读书笔记

    HTTP权威指南笔记 读书有两种境界,第一种境界是将书读薄,另一种是读厚.本篇文章就是HTTP权威指南的读书笔记,算是读书的第一重境界,将厚书读薄.文章对HTTP的一些关键概念做了比较详细的概述,通读 ...

  5. 《HTTP权威指南》之HTTP连接管理及对TCP性能的考虑

    在上一篇博客中(<HTTP权威指南>之HTTP相关概念详解)我们简单对HTTP相关的基本概念做了一些简单的了解,但未对HTTP连接管理的内容做一些详细的介绍.本篇博客我们就一起来看一下HT ...

  6. HTTP权威指南阅读笔记四:连接管理

    HTTP通信是由TCP/IP承载的,HTTP紧挨着TCP,位于其上层,所以HTTP事务的性能很大程度上取决于底层TCP通道的性能. HTTP事务的时延 如图: HTTP事务的时延有以下几种主要原因. ...

  7. HTTP权威指南-连接管理

    现在已经开始学习到第四章咯,坚持就是胜利哟~!ok,废话少说,继续写笔记. 本章中我们要介绍到HTTP的连接.好,现在有几个问题,我列出来了,带着这几个问题,我们进入本章的学习. 1.HTTP是如何使 ...

  8. 图解HTTP权威指南(二)| 连接管理

    一.两个问题 1.HTTP是如何使用TCP连接的 2.HTTP的连接,并行连接.keep-alive(持久连接)和管道化连接   二.TCP连接 1.什么是TCP   TCP/IP是全球计算机及网络设 ...

  9. Netty权威指南

    Netty权威指南(异步非阻塞通信领域的经典之作,国内首本深入剖析Netty的著作,全面系统讲解原理.实战和源码,带你完美进阶Netty工程师.) 李林锋 著   ISBN 978-7-121-233 ...

随机推荐

  1. .net:easyui-datagrid清空表中原有数据

    $("#StudentTable").datagrid("loadData", { total: 0, rows: [] });

  2. HTML5之概述

    HTML5是万维网的核心语言.标准通用标记语言下的一个应用超文本标记语言(HTML)的第五次重大修改,是继HTML4.01和XHTML1.0之后的超文本标记语言的最新版本.它是由一群自由思想者组成的团 ...

  3. java springboot整合zookeeper入门教程(增删改查)

    java springboot整合zookeeper增删改查入门教程 zookeeper的安装与集群搭建参考:https://www.cnblogs.com/zwcry/p/10272506.html ...

  4. 动态背景的CSS3登录表单

    在线演示 本地下载

  5. mysql数据库导入、导出、数据传输

    Navicat数据库之间导入导出1.双击要导出的数据库,右键选转储SQL文件...,选择要保存的文件夹. 2.点击开始后,开始导出. 数据库导入1.新建数据库,数据库的名字必须和导入的数据库文件一致. ...

  6. Linux中显示空闲内存空间的free命令的基本用法

    free 命令显示系统使用和空闲的内存情况,包括物理内存.交互区内存(swap)和内核缓冲区内存 参数 -b 显示内存的单位为字节-k 显示内存的单位为 KB-m 显示内存的单位为 M-o 忽略缓冲区 ...

  7. IE开发人员工具手册

    The DOM Explorer tool (CTRL + 1) The The DOM Explorer tool shows the structure of your webpage as it ...

  8. 关于使用JAVA正则表达式报java.lang.StackOverflowError错误问题

    最近在使用hadoop做apache日志分析,发现测试数据没问题,但数据一多就出问题,报 java.lang.StackOverflowError错误,最后定位为正则表达式栈溢出,发现某些行的日志数据 ...

  9. Android -- 工程架构,电话拨号器, 点击事件的4中写法

    (该系列整理自张泽华android视频教程) 1. android工程 各个文件夹的作用 src/  java原代码存放目录 gen/ 自动生成目录 gen 目录中存放所有由Android开发工具自动 ...

  10. Java中的赋值运算符

    赋值运算符是指为变量或常量指定数值的符号.如可以使用 “=” 将右边的表达式结果赋给左边的操作数. Java 支持的常用赋值运算符,如下表所示: public class HelloWorld{ pu ...