用户访问万维网文档,万维网文档之间的链接以及万维网文档中数据传送到用户计算机,这些功能的实现都是由超文本传输协议 HTTP(HyperTextTransfer Protocol) 负责完成的。 HTTP 是一个应用层协议,它使用 TCP 连接进行可靠的传送,能够在万维网上进行文本、声音、图像、视频等各种信息的交换。

HTTP 协议也是工作在客户机 / 服务器模式下,分为 HTTP 客户端和 HTTP 服务器两个部分,双方每次进行交互,都是由客户端发出的请求和服务器端发出的响应构成。 HTTP 协议规定的用户使用浏览器访问万维网的过程可以总结为:

1. 用户在浏览器中键入需要访问网页的 URL 或者点击某个网页中链接;

2. 浏览器根据 URL 中的域名,通过 DNS 解析出目标网页的 IP 地址;

3. 浏览器与网页所在服务器建立 TCP 连接;

4. 浏览器发送 HTTP 请求报文,获取目标网页的文件;

5. 服务器发送 HTTP 响应报文,将目标网页文件发送给浏览器;

6. 释放 TCP 连接;

7. 浏览器将网页的内容包括文本、图像、声音等显示呈现在用户计算机屏幕。

HTTP 协议是无连接的,它使用面向连接的 TCP 协议所提供的服务。同时, HTTP 协议也是无状态的,即服务器端不记录客户端访问的时间和次数。最初的 HTTP 协议版本是 1.0 版,使用非持续连接(nonpersistentconnection) 。每传输一个对象都需要利用 1 个往返时间 RTT 建立 TCP 连接,用 1 个往返时间 RTT 申请并传输回对象,即平均用 2 个往返时间 RTT 获取一个对象。目前使用比较广泛的是 HTTP协议的 1.1 版本( HTTP/1.1 ),其在默认情况下使用持续连接 (persistentconnection) ,即利用同一个TCP 连接传输多个对象 。

HTTP 报文是面向文本的,报文中的每一个字段都是一些 ASCII 码串,各个字段的长度是不确定的。HTTP 有两类报文:请求报文和响应报文。 请求报文是从客户端向服务器发送的报文,响应报文是从服务器到客户端的报文。下面分别介绍请求报文和响应报文的具体格式。

1. HTTP 请求报文格式

HTTP 请求报文的由请求行、请求头部行、空行和请求数据四部分构成,具体格式如下所示:

(请求行) 方法名 + 空格 +URL+ 空格 + 版本 + 回车换行( \r\n )

(请求头部行 1 )关键字 + “:” + 空格 + 值 + 回车换行( \r\n )

……

(请求头部行 N )关键字 + “:” + 空格 + 值 + 回车换行( \r\n )

(空行)回车换行( \r\n )

(请求数据) ……

( 1 )请求行

请求行由请求方法字段、 URL 字段和 HTTP 协议版本字段 3 个字段组成,它们用空格分隔。最后由回车和换行表示请求行结束。例如:

GET www.sdu.edu.cn  HTTP/1.1 回车换行 ( \r\n )

其中“方法”字段表示该请求报文希望服务器做什么,请求报文的类型就是由所采用的方法决定的。 HTTP请求报文的主要方法包括: GET 、 POST 、 HEAD 、 PUT 、 DELETE 、 OPTIONS 、 TRACE 、CONNECT 等。最常见的方法有 GET 和 HEAD 。

GET 是最常见的一种请求方式,当客户端要从服务器中读取文档时,当点击网页上的链接或者通过在浏览器的地址栏输入网址来浏览网页,使用的都是 GET 方式。 GET 方法要求服务器将 URL 定位的资源放在响应报文的数据部分,回送给客户端。 GET 方式不适合传送私密数据和大量数据。

HEAD 的功能与 GET 相似,只是服务器端接收到 HEAD 请求后只返回响应头,而不会发送响应内容。当我们只需要查看某个页面的状态的时候,使用 HEAD 是非常高效的,因为在传输的过程中省去了页面内容。

( 2 )请求头部行( header )

请求头部行包括若干行,每行由关键字及其值构成的,关键字和值用英文冒号 “:” 分隔,每一行都由回车换行表示结束。请求头部通知服务器有关于客户端请求的信息,典型的请求头部关键字有:

User-Agent :产生请求的浏览器类型。

Accept :客户端可识别的内容类型列表。

Accept-Language :客户端可识别的语言类型

Host :请求的主机名。

Connection :告知服务器发送完文档后释放连接还是保持连接。

( 3 )空行

最后一个请求头部之后是一个空行,发送回车符和换行符,通知服务器以下不再有请求头部了。

( 4 )请求数据

GET 方法中没有请求数据的内容, POST 方法使用请求数据,用于客户端向服务器端填写表单等操作。

比如浏览器使用 GET 方法访问山东大学主页中的“学校简介”文档( URL 为www.sdu.edu.cn/2010/xxjj.htm ),则其 HTTP 请求报文可以为:

GET /2010/xxjj.html HTTP/1.1 \r\n

Host: www.sdu.edu.cn\r\n

User-Agent : Mozilla/5.0

Accept-Language:cn */*\r\n

2. 响应报文格式

HTTP 响应也由四个部分组成,分别是:状态行、消息头部、空行和响应正文。其具体格式如下:

(状态行)版本 + 空格 + 状态码 + 空格 + 短语 + 回车换行

(消息头部 1 )关键字 + “:” + 空格 + 值 + 回车换行

……

(消息头部 N )关键字 + “:” + 空格 + 值 + 回车换行

(空行)回车换行( \r\n )

(响应正文) ……

在响应报文的状态行中,版本字的表示服务器 HTTP 协议的版本,状态码字的表示服务器发回的响应状态代码;短语字段表示状态代码的文本描述。状态码由三位十进制数字组成,第一个数字定义了响应的类别,有五种可能取值( 1-5 ),每种状态码的含义如下:

1xx :指示信息。表示请求已接收,继续处理。

2xx :成功。表示请求已被成功接收、理解、接受。

3xx :重定向。要完成请求必须进行更进一步的操作。

4xx :客户端错误。请求有语法错误或请求无法实现。

5xx :服务器端错误。服务器未能实现合法的请求。

常见状态码及状态描述的说明如下:

200 OK :客户端请求成功。

400 Bad Request :客户端请求有语法错误,不能被服务器所理解。

401 Unauthorized :请求未经授权。

403 Forbidden :服务器收到请求,但是拒绝提供服务。

404 Not Found :请求资源不存在,比如输入了错误的 URL 。

500 Internal Server Error :服务器发生不可预期的错误。

503 Server Unavailable :服务器当前不能处理客户端的请求,一段时间后可能恢复正常。

消息头部与请求头部的格式相似,也是包含若干行,每行由关键字及其值构成,常用的关键字包括:

Date: 表示返回消息的时间。

Content-Type: 表示返回消息的内容类型。

Content-Length: 返回内容的长度(字节数)。

Server :使用的服务器软件及其版本号。

同样,最后一个消息头部之后是一个空行,发送回车符和换行符,通知客户端以下不再有消息头部了。

响应正文部分是服务器端根据客户端的请求发回的具体文档内容,以 HTML 语言表示。
 

HTTP的基本原理的更多相关文章

  1. Ognl表达式基本原理和使用方法

    Ognl表达式基本原理和使用方法 1.Ognl表达式语言 1.1.概述 OGNL表达式 OGNL是Object Graphic Navigation Language(对象图导航语言)的缩写,他是一个 ...

  2. Android自定义控件之基本原理

    前言: 在日常的Android开发中会经常和控件打交道,有时Android提供的控件未必能满足业务的需求,这个时候就需要我们实现自定义一些控件,今天先大致了解一下自定义控件的要求和实现的基本原理. 自 ...

  3. HMM基本原理及其实现(隐马尔科夫模型)

    HMM(隐马尔科夫模型)基本原理及其实现 HMM基本原理 Markov链:如果一个过程的“将来”仅依赖“现在”而不依赖“过去”,则此过程具有马尔可夫性,或称此过程为马尔可夫过程.马尔可夫链是时间和状态 ...

  4. 动态令牌-(OTP,HOTP,TOTP)-基本原理

    名词解释和基本介绍 OTP 是 One-Time Password的简写,表示一次性密码. HOTP 是HMAC-based One-Time Password的简写,表示基于HMAC算法加密的一次性 ...

  5. ZooKeeper基本原理

    ZooKeeper简介 ZooKeeper是一个开放源码的分布式应用程序协调服务,它包含一个简单的原语集,分布式应用程序可以基于它实现同步服务,配置维护和命名服务等. ZooKeeper设计目的 1. ...

  6. GBDT的基本原理

    这里以二元分类为例子,给出最基本原理的解释 GBDT 是多棵树的输出预测值的累加 GBDT的树都是 回归树 而不是分类树 分类树 分裂的时候选取使得误差下降最多的分裂 计算的技巧 最终分裂收益按照下面 ...

  7. 全文检索引擎 Solr 部署与基本原理

    全文检索引擎 Solr 部署与基本原理 搜索引擎Solr环境搭建实例 关于 solr , schema.xml 的配置说明 全文检索引擎Solr系列-–全文检索基本原理 一.搜索引擎Solr环境搭建实 ...

  8. 相机位姿估计0:基本原理之如何解PNP问题

    关键词:相机位姿估计 PNP问题求解 用途:各种位姿估计 文章类型:原理 @Author:VShawn(singlex@foxmail.com) @Date:2016-11-18 @Lab: CvLa ...

  9. geohash基本原理

    geohash基本原理是将地球理解为一个二维平面,将平面递归分解成更小的子块,每个子块在一定经纬度范围内拥有相同的编码,这种方式简单粗暴,可以满足对小规模的数据进行经纬度的检索 目录: 经纬度常识 认 ...

  10. Struts框架——(一)用Servlet + JSP演示Struts基本原理

    一. 用Servlet + JSP演示Struts基本原理 struts是开源项目.它通过采用 Java Servlet/JSP 技术,实现了基于Java EE Web应用的MVC的应用框架.Stru ...

随机推荐

  1. easy-ui treegrid 实现分页 并且添加自定义checkbox

    首先第一点easy-ui  treegrid 对分页没有好的实现, 因为在分页的过程中是按照 根节点来分页的  后台只能先按照 根节点做分页查询  再将子节点关联进去, 这样才能将treegrid 按 ...

  2. Unity3D编辑器扩展(四)——扩展自己的组件

    前面已经写了三篇: Unity3D编辑器扩展(一)——定义自己的菜单按钮 Unity3D编辑器扩展(二)——定义自己的窗口 Unity3D编辑器扩展(三)——使用GUI绘制窗口 今天写第四篇,扩展自己 ...

  3. mount的几个选项

    一.mount -o noatime表示在读文件时不去更改文件的access time属性了,所以该选项会提升mount操作的执行效率. 二.mount --bind:等同于 -o bind可用于挂载 ...

  4. sudo -iu [用户] 命令无法正常切换到用户目录的原因

    今天干活时遇到一个问题,在sudo -iu [用户]命令执行后无法切换到用户对应的[ 用户@机器 ~$ ]命令行 .bashrc已正常配置为 if [ -f /etc/bashrc ]; then . ...

  5. HDU 1846 巴什博奕

    点这里去做题 最简单的巴什博奕 ,凑m+1 #include<bits/stdc++.h> int main() { int T,n,r,m; scanf("%d",& ...

  6. linux_批量关闭进程

    以下环境是 fedora24 linux 系统中的情况: 仿真中遇到意外弹出上百个图片,无法一下全部关闭. 可以使用: ps -ef|grep LOCAL=NO|grep -v grep|cut -c ...

  7. Spring Boot中Web应用的统一异常处理 转载来自翟永超

    我们在做Web应用的时候,请求处理过程中发生错误是非常常见的情况.Spring Boot提供了一个默认的映射:/error,当处理中抛出异常之后,会转到该请求中处理,并且该请求有一个全局的错误页面用来 ...

  8. java web 开发手册

    W3School离线手册(2017.03)               提取密码: b2fo JavaScript高级程序设计第三版             提取密码: cscv CSS4.2.4 参 ...

  9. 论文word排版相关插件

    其中包括破解版的MathType.EndNote X7以及Aurora 链接:http://pan.baidu.com/s/1boRZTmf 密码:a6ai

  10. RabbitMQ 分发到多Consumer(Publish/Subscribe)

    上篇文章中,我们把每个Message都是deliver到某个Consumer.在这篇文章中,我们将会将同一个Message deliver到多个Consumer中.这个模式也被成为 "pub ...