第三章、HTTP报文
1 报文流
HTTP 报文是在 HTTP 应用程序之间发送的数据块。这些数据块以一些文本形式的元信息(meta-information)开头。这些报文在客户端、服务器和代理之间流动。术语“流入”、“流出”、“上游”及“下游”都是用来描述报文方向的。
HTTP 报文会像河水一样流动。不管是请求报文还是响应报文,所有报文都会向下游(downstream)流动。所有报文的发送者都在接收者的上游(upstream)
2 报文组成部分
一条HTTP报文一般由三部分组成:对报文进行描述的起始行(start line)、包含属性的首部(header)块,以及可选的、包含数据的主体(body)部分。示例如图:
如上图所示,start line和header一般都有ASCII码组成,每行都由CRLF标识作为结束终止,但是有些程序也会用单个换行符作为结束标志。body部分另外两个组成部分不太一样,除了可以包含文本外,还可以包含一些二进制数据。
2.1 报文的语法
HTTP报文分为两类:请求报文和响应报文。两类报文的格式如下:
请求报文格式:
<method> <request-URL> <version>
<headers> <entity-body>
响应报文格式:
<version> <status> <reason-phrase>
<headers> <entity-body>
每个部分简要介绍如下:
- 方法(method):客户端希望对服务器进行的操作动作,如:GET, POST、HEAD
- 请求URL(request-URL):命名了所请求资源,或者 URL 路径组件的完整 URL。
- 版本(version):报文所使用的HTTP版本,格式:HTTP/<major>.<minor> ,主版本号和次版本号都是整数
- 状态码(status-code):三位数字描述了请求过程中所发生的情况。
- 原因短语(reason-phase):用用户对前面状态码的简短描述,主要用于给用户看的。
- 首部(header):可以有零个或多个首部,每个首部都包含一个名字,后面跟着一个冒号(:),然后是一个可选的空格,接着是一个值,最后是一个 CRLF。
- 实体部分(entity-body):实体的主体部分包含一个由任意数据组成的数据块。
2.2 起始行
所有的 HTTP 报文都以一个起始行作为开始。分为请求行和向应行。
- 请求行:包含了一个方法和一个请求URL,还有HTTP版本。这些字段都有空格分开。说明了要做些什么
- 请求报文的起始行,或称为请求行
- 响应行:包含了响应报文使用的HTTP版本,数字状态,以及描述状态码的原因短语。说明发生了什么
- 响应报文的起始行,或称为响应行
2.2.1 方法
请求的起始行以方法作为开始,方法用来告知服务器需要做什么,HTTP规范中定义了常用的方法如下:
除了这些方法外,我们还可以自定义一些扩展方法。
2.2.2 状态码
方法是用来告诉服务器做什么事情的,状态码则用来告诉客户端,发生了什么事情。状态码位于响应行中,如:HTTP/1.0 200 OK中,200即为状态码。HTTP中状态码分类如下:
常见状态码如下:
2.2.3 原因短语
原因短语是响应起始行中的最后一个组件。它为状态码提供了文本形式的解释。比如,在行 HTTP/1.0 200 OK 中,OK 就是原因短语。
原因短句和状态码是成对出现。原因短句是状态码的可读版本,应用程序开发者将其传送给用户,用以说明在请求期间发生了什么情况。
2.2.4 版本号
版本号会以 HTTP/x.y 的形式出现在请求和响应报文的起始行中。版本号说明了应用程序支持的最高 HTTP 版本。
有个注意的地方,版本号不会被当作小数来处理。版本中的每个数字(比如 HTTP/1.0 中的 1 和 0)都会被当作一个单独的数字来处理。比如,HTTP/2.22 就比 HTTP/2.3 的版本要高,因为 22 比 3 大。
2.3 首部
HTTP 首部字段向请求和响应报文中添加了一些附加信息。本质上来说,它们只是一些键值对的列表。首部一般分为以下几类:通用首部、请求首部、响应首部、实体首部、扩展首部。
每个 HTTP 首部都有一种简单的语法:名字后面跟着冒号( :),然后跟上可选的空格,再跟上字段值,最后是一个 CRLF。
常见首部示例如下:
首部一个键可以对应多个值,如果出现此种情况,为了提高可读性,多出来的行每行前面至少要有一个空格或制表符,此处是server首部,如:
HTTP/1.0 OK
Content-Type: image/gif
Content-Length:
Server: Test Server
Version 1.0
2.4 实体部分(body)
HTTP 报文的第三部分是可选的实体主体部分。实体的主体是 HTTP 报文的负荷。就是 HTTP 要传输的内容。
HTTP 报文可以承载很多类型的数字数据:图片、视频、HTML 文档、软件应用程序、信用卡事务、电子邮件等。
3 方法
HTTP1.1要求,每台服务器必须要实现GET和HEAD方法,其他方法可以选择实现,也可以选择不实现。同时HEAD和GET也被称为安全方法,因为这两个方法不会对请求的资源产生任何动作。
3.1 GET
GET 是最常用的方法。通常用于请求服务器发送某个资源。HTTP/1.1 要求服务器实现此方法。一个示例如下:
3.2 HEAD
HEAD 方法与 GET 方法的行为很类似,但服务器在响应中只返回首部。使用HEAD方法,可以达到如下效果:
- 在不获取资源的情况下了解资源的情况(如:判断内容类型);
- 通过查看响应码,了解该资源是否存在;
- 通过查看首部,检验资源是否被修改了
3.3 PUT
与 GET 从服务器读取文档相反,PUT 方法会向服务器写入文档。PUT方法会让服务器创建一个所请求URL命名的新文档,如果该文档已经存在,则会更新。
一个PUT请求示例如下:
3.4 POST
POST 方法起初是用来向服务器输入数据的 。实际上,通常会用它来支持 HTML 的表单。这里注意其与PUT方法的区别是POST仅仅是用来给服务器发送数据,至于数据怎么处理完全由服务器自己决定,而PUT方法是让服务器存储数据的。
3.5 TRACE
客户端发起一个请求时,这个请求可能要穿过防火墙、代理、网关或其他一些应用程序。每个中间节点都可能会修改原始的 HTTP 请求。
TRACE 方法允许客户端在最终将请求发送给服务器时,看看它变成了什么样子。其一般用于诊断请求过程中是否被修改或者毁坏。TRACE 请求中不能带有实体的主体部分。
TRACE请求会在目的服务器端发起一个“环回”诊断,用于验证请求是否如愿穿过了请求/响应链
一个TRACE请求如下:
3.6 OPTIONS
OPTIONS 方法请求 Web 服务器告知其支持的各种功能。可以询问服务器通常支持哪些方法,或者对某些特殊资源支持哪些方法。
3.7 DELETE
顾名思义,DELETE 方法所做的事情就是请服务器删除请求 URL 所指定的资源。但是,客户端应用程序无法保证删除操作一定会被执行。因为 HTTP 规范允许服务器在不通知客户端的情况下撤销请求。
3.8 扩展方法
HTTP 被设计成字段可扩展的,这样新的特性就不会使老的软件失效了。扩展方法指的就是没有在 HTTP/1.1 规范中定义的方法。服务器会为它所管理的资源实现一些 HTTP 服务,这些方法为开发者提供了一种扩展这些 HTTP 服务能力的手段。
4 状态码
状态码总体被分为5大类。这里我们针对没类做一些介绍。
4.1 100~199信息状态码
4.2 200~299成功状态码
客户端发起请求时,这些请求通常都是成功的。服务器有一组用来表示成功的状态码。
4.3 300~399重定向状态码
重定向状态码要么告知客户端使用替代位置来访问他们所感兴趣的资源,要么就提供一个替代的响应而不是资源的内容。如果资源已被移动,可发送一个重定向状态码和一个可选的 Location 首部来告知客户端资源已被移走,以及现在可以在哪里找到它。请求示例如下:
常见的重定向状态码如下:
其中302,303,307的区别如下:
- 302 主要是HTTP1.0的状态码,本身规定是除非是HEAD或者GET请求,否则必须经过用户同意才能重定向,但是一般浏览器处理是直接重定向到新的URL了。
- 303 HTTP1.1新添加的。由于之前浏览器对302的处理大部分都是直接重定向了,所以新的HTTP协议细分出了303和307,303是允许浏览器自动重定向的。
- 307 HTTP1.1新添加。除非是GET或者HEAD请求,否则需要用户同意才能重定向。
- 这几个状态码总的说来关系就是,HTTP1.0的时候只有302,要求非GET或HEAD请求必须经用户同意才能重定向,但是大部分浏览器并没有这样做,所以在HTTP1.1的时候,将302细分出了303和307。303是可以自动重定向,307要求非GET或者HEAD必须经用户同意,保留302是为了和1.0版本兼容。
4.4 400~499客户端错误状态码
有时客户端会发送一些服务器无法处理的东西,比如格式错误的请求报文,这时服务器就会返回400系列错误码告知客户端。
常用错误码如下:
状态码 原因短语 含 义
400 Bad Request 用于告知客户端它发送了一个错误的请求
Unauthorized 与适当的首部一同返回,在这些首部中请求客户端在获取对资源的访问权之前,对自己进行认证。
Payment Required 现在这个状态码还未使用,但已经被保留,以作未来之用
Forbidden 用于说明请求被服务器拒绝了。如果服务器想说明为什么拒绝请求,可以包含实体的主体部分来对原因进行描述。但这个状态码通常是在服务器不想说明拒绝原因的时候使用的
Not Found 用于说明服务器无法找到所请求的URL。通常会包含一个实体,以便客户端应用程序显示给用户看
Method Not Allowed 发起的请求中带有所请求的URL不支持的方法时,使用此状态码。应该在响应中包含Allow首部,以告知客户端对所请求的资源可以使用哪些方法。
Not Acceptable 客户端可以指定参数来说明它们愿意接收什么类型的实体。服务器没有与客户端可接受的URL相匹配的资源时,使用此代码。通常,服务器会包含一些首部,以便客户端弄清楚为什么请求无法满足。更多信息请参见第17章
Proxy Authentication Required 与401状态码类似,但用于要求对资源进行认证的代理服务器
Request Timeout 如果客户端完成请求所花的时间太长,服务器可以回送此状态码,并关闭连接。超时时长随服务器的不同有所不同,但通常对所有的合法请求来说,都是够长的
Conflict 用于说明请求可能在资源上引发的一些冲突。服务器担心请求会引发冲突时,可以发送此状态码。响应中应该包含描述冲突的主体
Gone 与404类似,只是服务器曾经拥有过此资源。主要用于Web站点的维护,这样服务器的管理者就可以在资源被移除的情况下通知客户端了
Length Required 服务器要求在请求报文中包含Content-Length首部时使用。
Precondition Failed 客户端发起了条件请求,且其中一个条件失败了的时候使用。客户端包含了Expect首部时发起的就是条件请求。
Request Entity Too Large 客户端发送的实体主体部分比服务器能够或者希望处理的要大时,使用此状态码
Request URI Too Long 客户端所发请求中的请求URL比服务器能够或者希望处理的要长时,使用此状态码
Unsupported Media Type 服务器无法理解或无法支持客户端所发实体的内容类型时,使用此状态码
Requested Range Not Satisfiable 请求报文所请求的是指定资源的某个范围,而此范围无效或无法满足时,使用此状态码
Expectation Failed 请求的Expect请求首部包含了一个期望,但服务器无法满足此期望时,使用此状态码。如果代理或其他中间应用程序有确切证据说明源端服务器会为某请求产生一个失败的期望,就可以发送这个响应状
4.5 500~599服务器错误状态码
如果客户端发出了正确的请求,但是服务器由于自身的原因无法正确处理,或者内部出现错误,这个时候就会返回该系列错误码用于说明具体是什么错误。
常见的错误码如下:
5 首部(Header)
首部和方法配合工作,共同决定了客户端和服务器能做什么事情。
5.1 通用首部
所谓通用首部,就是不区分是请求首部还是响应首部,都可以使用的首部,一般用于提供报文的基本信息。
5.2 请求首部
请求首部是指只能用在请求当中的首部信息。常用请求首部如下:
5.2.1 Accept首部
该首部告诉服务器客户端可以接收哪些条件的响应数据,具体如下:
5.2.2 条件请求首部
客户端在某些情况下会对请求加上一部分条件限制,比如我们已经在本地缓存了一份文档的数据,通过 If-Modified-Since 条件首部就可以判断我们的缓存是否还有效,是否需要重新从服务器获取新的文档。常见的条件首部如下:
5.2.3 安全请求首部
HTTP 本身就支持一种简单的机制,可以对请求进行质询 / 响应认证。这种机制要求客户端在获取特定的资源之前,先对自身进行认证,这样就可以使事务稍微安全一些。常用的安全首部如下:
5.2.4 代理请求首部
随着因特网上代理的普遍应用,人们定义了几个首部来协助其更好地工作。
5.3 响应首部
响应首部是指用在响应的首部信息,常用的响应首部如下:
5.3.1 协商首部
协商首部是用于一些可协商资源的情况。如:同样一份稳定,有中文,英文等几种语言。这个时候,就可以通过协商首部确定是哪种语言的资源。
首 部 描 述
Accept-Ranges 对此资源来说,服务器可接受的范围类型
Vary 服务器查看的其他首部的列表,可能会使响应发生变化;也就是说,这是一个首部列表,服务器会根据这些首部的内容挑选出最适合的资源版本发送给客户端
5.3.2 安全响应首部
其意义同安全请求首部,只是用于响应而已,常用的首部如下:
5.4 实体首部
有部分首部是用于描述实体(body)部分数据的信息的,这个部分首部被称为实体首部,由于请求和响应报文都可携带实体数据,所以该部分首部并不一定区分是请求首部还是响应首部。
5.4.1 内容首部
该部分内容主要用于描述实体内容的信息,常见的如下表:
5.4.2 实体缓存首部
通用的缓存首部说明了如何或什么时候进行缓存--------该部分首部主要用于描述缓存相关信息,常见如下:
第三章、HTTP报文的更多相关文章
- 《HTTP 权威指南》笔记:第三章 HTTP 报文
如果说 HTTP 是因特网的信使,那么 HTTP 报文就是它用来搬东西的包了. 这一章讲述关于 HTTP 报文的相关知识,包括: HTTP 报文的三个组成部分 请求报文以及其各种功能 响应报文以及各种 ...
- 《图解HTTP》阅读笔记--第二章 简单的HTTP协议--第三章 HTTP报文信息
第二章.简单的HTTP协议HTTP协议:HTTP协议用于客户端(请求资源的一端)和服务器端(响应回复提供资源的一端)的通信,是一种无状态协议HTTP1.1默认TCP持久连接,管线化发送(并行发送多个 ...
- 【HTTP权威指南】第三章-HTTP报文
HTTP是因特网的信使,报文就是信使运送的包裹. 这一章包含: 报文如何流动 报文的三个组成部分(起始行,首部,实体的主体部分) 请求报文和响应报文的区别 请求报文支持的各种功能(方法) 响应报文返回 ...
- (第三章,第四章)http报文内的http信息,返回结果的http状态码
第三章 http报文内的http信息 用于http协议交互的信息被称为http报文,包括请求报文和响应报文. 1.编码提升传输速率,在传输时编码能有效的处理大量的访问请求.但是编码的操作是计算机完成的 ...
- 第三章 HTTP报文中的HTTP信息
第三章 HTTP报文中的HTTP信息 HTTP通信过程:客户端—>服务端,服务端—>客户端. 1.HTTP报文 使用HTTP协议交互的信息被称为HTTP报文,包括请求报文和响应报文. [请 ...
- 《Django By Example》第三章 中文 翻译 (个人学习,渣翻)
书籍出处:https://www.packtpub.com/web-development/django-example 原作者:Antonio Melé (译者注:第三章滚烫出炉,大家请不要吐槽文中 ...
- 《Linux内核设计与实现》读书笔记 第三章 进程管理
第三章进程管理 进程是Unix操作系统抽象概念中最基本的一种.我们拥有操作系统就是为了运行用户程序,因此,进程管理就是所有操作系统的心脏所在. 3.1进程 概念: 进程:处于执行期的程序.但不仅局限于 ...
- Python黑帽编程3.0 第三章 网络接口层攻击基础知识
3.0 第三章 网络接口层攻击基础知识 首先还是要提醒各位同学,在学习本章之前,请认真的学习TCP/IP体系结构的相关知识,本系列教程在这方面只会浅尝辄止. 本节简单概述下OSI七层模型和TCP/IP ...
- 《Entity Framework 6 Recipes》中文翻译系列 (11) -----第三章 查询之异步查询
翻译的初衷以及为什么选择<Entity Framework 6 Recipes>来学习,请看本系列开篇 第三章 查询 前一章,我们展示了常见数据库场景的建模方式,本章将向你展示如何查询实体 ...
- 《Entity Framework 6 Recipes》中文翻译系列 (19) -----第三章 查询之使用位操作和多属性连接(join)
翻译的初衷以及为什么选择<Entity Framework 6 Recipes>来学习,请看本系列开篇 3-16 过滤中使用位操作 问题 你想在查询的过滤条件中使用位操作. 解决方案 假 ...
随机推荐
- css中字体常用单位px、em、rem和%的区别及用法总结
一.px.em.rem和%的定义 1.px(像素) px单位的名称为像素,它是一个固定大小的单元,像素的计算是针对(电脑/手机)屏幕的,一个像素(1px)就是(电脑/手机)屏幕上的一个点,即屏幕分辨率 ...
- iframe滚动条充当浏览器滚动条
在做博客项目的时候,使用了iframe,方便根据选择的文章类别切换显示的内容,但是文章一般都有很多,通过bootstrap的媒体列表的方式显示的话,iframe是一定会出现滚动条的,特别是我添加了一个 ...
- Linux查看进程并重启服务命令
top -u root 查看系统进程service network restartservice iptables restartservice sshd restartservice nginx r ...
- VBA宏注释(四)
注释用于记录程序逻辑和用户信息,其他程序员将来可以阅读并理解相同的代码无缝工作. 它包括由开发者,修改者以及还可以包括合并逻辑的信息. 解释器在执行时忽略注释. VBA中的注释用两种方法表示,它们分别 ...
- JS 学习书籍电子版PDF下载
JavaScript权威指南(第6版)(中文版) 链接:https://pan.baidu.com/s/1H1v77UY-yh7oDxonRjd0GA 提取码:r3pu JavaScript DOM编 ...
- SQLiteDatabase执行update、insert操作的时候,conflictAlgorithm参数的含义区别
/** * When a constraint violation occurs, an immediate ROLLBACK occurs, * thus ending the current tr ...
- dubbo线程池作用于接口而不是方法
记一次线上dubbo服务超时和线程池满问题排查 可能调用的接口没问题,但是该服务中的其他接口占用完了线程池,导致调用超时被拒绝处理.
- gitlab中的几个常用界面(runner管理、gitlab-ci.yml管理、runner token管理、新建用户、拉用户入工程、拉用户入组、复制工程导入组)
目录: 1.runner管理 2.gitlab-ci.yml管理 3.runner token管理 4.新建用户 5.拉用户入工程 6.拉用户入组 7.复制工程导入组 1.runners界面 http ...
- curl: (7) couldn't connect to host 解决方法
使用curl命令访问网站时报错: [root@bqh-119 ~]# curl -I www.test.com curl: (7) couldn't connect to host [root@bqh ...
- MySQL学习笔记-MHA安装配置
一.配置主从同步 1. 本例中主从ip及端口 Master:10.1.5.8:3306 Slave1:10.1.5.9:3306 (候选master) Slave2:10.1.5.195:3306 ...