Chapter 1 HTTP概述

1. Web客户端Web服务器

  • web服务器即为HTTP服务器
  • Web浏览器属于客户端
  • Web浏览器向服务器请求HTTP对象

2. 资源

  • Web服务器是Web资源的宿主
  • 所有类型的内容来源都是资源

3. 媒体类型(MIME类型)

  • Web对象都有MIME类型的数据格式标签
  • MIME:多用途因特网邮件扩展(Multipurpose Internet Mail Extension)。是一种文本标签,格式为:主类型/子类型,如text/html、image/jpeg。
  • Web浏览器从服务器取得一个对象时,会查看其MIME类型,并判断是否能处理这个对象

4. URI

服务器资源名被称为统一资源标识符(URI,Uniform Resource Identifier)

URI唯一标识并定位信息资源,下面的连接就是一个URI的示例:

现在大部分的URI都是URL

4.1 URL

URL统一资源定位符,描述了一台特定服务器上某资源的特定位置

URL实例:

4.2 URN

URN:统一资源名,作为特定内容的唯一名称使用,与目前的资源所在地无关。

5. 事务

 HTTP事务由一条请求命令和一个响应结果组成。这种通信通过交换报文(格式化数据块)来进行

6. 报文

  • HTTP报文由字符串组成,是纯文本。之所以不是二进制码,是为了方面人们进行阅读
  • HTTP报文包括:
    •   起始行 start line:在请求报文中说明做什么,在响应报文中说明发生了什么
    •   首部字段 headers:起始行后有 ≥ 0个首部字段,首部字段包含一些键值对。首部以空格结束
    •   主体 body:可包含任意的二进制数据

7. Extra

Web页面中包含多个对象

8. 连接

HTTP是应用层协议,无需操心TCP/IP负责的网络通信细节。HTTP使用TCP来传输数据

TCP提供了:

  • 无差错的网络传输
  • 按序传输
  • 未分段的数据流

9. Web的结构组件

9.1 代理

代理位于客户端和服务器之间,接受并转发所有客户端的请求。代理即是转发者,也是筛网(对请求和响应进行过滤,如过滤掉包含有病毒的请求或响应报文)

9.2 缓存

缓存,又称代理缓存是一种特殊的HTTP代理服务器,可将通过代理发送的文档保存备份保存,目的是提高传输效率

9.3 网关

用于将HTTP流量转换成其他的协议

9.4 隧道

9.5 Agent代理

用户Agent代理是代表用户发起HTTP请求的客户端程序,如Web浏览器、网络爬虫。


Chapter 2 URL和资源

URL语法

1. 方案

  • 方案规定如何访问指定资源
  • 方案以一个字母符号开始,由第一个“ : ”符号将其与URL的其余部分分隔开
  • 方案名无视大小写

2. 主机与端口

  • 主机组件标识了能够访问资源的宿主机器,可用主机名(www.joes-hardware.com)或IP地址表示主机名
  • 端口组件表示服务器正在监听的网络端口。对于下层使用TCP的HTTP来说,默认端口号为80

3. 用户名和密码

4. 路径

  • http://www.joes-hardware.com:80/seasonal/index-fall.html中,/seasonal/index-fall.html就是路径
  • 路径组件说明了资源位于服务器的什么地方
  • 可用“/” 将URL的路径组件划分为路径段。每个路径段都有自己的参数组件

5. 参数

  • 负责解析URL的应用程序有时候需要协议的参数来访问资源,否则,访问的服务器可能不会给请求提供服务,甚至提供错误的服务
  • 参数组件是URL中的名值对列表,由字符“ ; ”将其与URL的其余部分分隔开
  • URL路径组件可以分成若干路径段,每个路径段都可以有自己的参数,如:http://www.joes-hardware.com/hammers;sale=false/index.html;graphics=true

6. 查询

  • http://www.joes-hardware.com/inventory-check.cgi?item=12731中的?item=12731即为查询组件
  • 查询组件用于更加精确地查找资源
  • URL中的查询组件和标识网关资源的URL路径会被一起发送给网关
  • 查询字符串以名值对的形式出现,名值对之间用“ & ”分隔

7. 片段

  • 片段组件能够指定返回资源的某一部分,比如一个文本文档中的某个具体章节。
  • http://www.joes-hardware.com/tools.html#drills,则返回Joe的五金商店页面/tools.html中的名叫drill的部分
  • 服务器通常只处理整个对象,而不是对象的片段,客户端不能将片段传送给服务器。浏览器获取到整个资源以后,会根据片段来显示你感兴趣的那部分。

URL快捷方式

绝对URL与相对URL

绝对URL包含访问资源所需要的所有信息
相对URL p35-36

自动扩展URL

有的浏览器会在用户提供URL后自动扩展URL,比如输入baidu,浏览器会自动插入www.和.com

主要有两种自动扩展方式:

  • 主机名扩展:根据主机名,进行URL扩展
  • 历史扩展:在用户输入URL时,根据浏览器以前保存的用户历史URL输入来提供一些完整的用户想输入的URL的选项

URL字符集和编码机制

p38-40

未来展望

URN会得到很大的发展

PURL:永久统一资源定位符,是用URL实现URN功能的例子。基本思想是在搜索资源的过程中引入一个中间层,通过中间资源定位符服务器对资源的实际URL进行登记和跟踪


Chapter 3 HTTP报文

3.1 报文流

术语:流入(inbound)、流出(outbound)、上游(downstream)和下游(upstream)

所有发送者都位于接收者的上游,报文向下游流动,如图:

3.2 报文的组成部分

HTTP报文是简单的格式化数据块,包括了:

  • 对报文进行描述的起始行
  • 包含属性的首部:应以一个空行(CRLF)结束
  • 可选的、包含数据的主体部分

3.2.1 报文的语法

请求报文的格式:

响应报文的格式:

请求报文和响应报文只有起始行的语法不同

版本(version)的格式:

1. 起始行

请求报文和响应报文的起始行分别称为请求行响应行

请求行包含了一个方法、一个请求URL和HTTP版本号,这些字段用空格分隔

响应行包含了一个HTTP版本号、数字状态码和原因短语,用空格分隔

2. 方法

扩展方法:服务器实现的自己的请求方法

3. 状态码

4. 版本号

HTTP/x.y

使用版本号的目的是为了给使用HTTP的应用程序提供线索,以便互相了解对方的能力和报文格式

版本号不应被当作小数来对待,每个数字都会被当作一个单独的数字来处理

3.2.2 首部

p53 - p54

3.3 方法

安全方法

GET方法和HEAD方法被认为是安全的,因为使用这些方法的请求不会产生什么动作

GET

从服务器取文档

 HEAD

在未获取实际资源的情况下,对资源的首部进行检查,如查看响应中的状态码,看看某个对象是否存在

 PUT

向服务器写入文档

POST

向服务器输入数据

TRACE


对可能经过代理服务器的请求进行追踪,看一看请求报文最终到达服务器的时候变成了什么样子

OPTIONS

请求Web服务器告知其支持的各种功能,或者对某些特殊资源支持哪些方法

 DELETE

请服务器删除所指定的资源

扩展方法

按照惯例 ” 对所发送的内容要求严一点,对所接收的内容宽容一些 “ 来处理扩展方法

3.4 状态码

P62-70

MN

HTTP权威指南_Note的更多相关文章

  1. JavaScript权威指南 - 函数

    函数本身就是一段JavaScript代码,定义一次但可能被调用任意次.如果函数挂载在一个对象上,作为对象的一个属性,通常这种函数被称作对象的方法.用于初始化一个新创建的对象的函数被称作构造函数. 相对 ...

  2. JavaScript权威指南 - 对象

    JavaScript对象可以看作是属性的无序集合,每个属性就是一个键值对,可增可删. JavaScript中的所有事物都是对象:字符串.数字.数组.日期,等等. JavaScript对象除了可以保持自 ...

  3. JavaScript权威指南 - 数组

    JavaScript数组是一种特殊类型的对象. JavaScript数组元素可以为任意类型,最大容纳232-1个元素. JavaScript数组是动态的,有新元素添加时,自动更新length属性. J ...

  4. 《Ansible权威指南》笔记(3)——Ad-Hoc命令集,常用模块

    五.Ad-Hoc命令集1.Ad-Hoc命令集通过/usr/bin/ansible命令实现:ansible <host-pattern> [options]    -v,--verbose  ...

  5. 《Ansible权威指南》笔记(1)——安装,ssh密钥登陆,命令

    2016-12-23 读这本<Ansible权威指南>学习ansible,根据本书内容和网上的各种文档,以及经过自己测试,写出以下笔记.另,这本书内容很好,但印刷错误比较多,作者说第二版会 ...

  6. 读《Android编程权威指南》

    因为去年双十二购买了一折的<Android 编程权威指南(第一版)>,在第二版出来后图灵社区给我推送了第二版的优惠码,激动之余就立马下单购买电子书,不得不说Big Nerd Ranch G ...

  7. maven权威指南学习笔记(五)—— POM

    1. 简介 Archetype插件通过 pom.xml 文件创建了一个项目.这就是项目对象模型 (POM),一个项目的声明性描述. 当Maven运行一个目标的时候,每个目标都会访问定 义在项目POM里 ...

  8. maven权威指南学习笔记(一)——简介

    maven是什么?有什么用? Maven是一个项目管理工具,它包含了     一个项目对象模型 (Project Object Model),     一组标准集合,     一个项目生命周期(Pro ...

  9. 《javascript权威指南》读书笔记——第二篇

    <javascript权威指南>读书笔记——第二篇 金刚 javascript js javascript权威指南 今天是今年的196天,分享今天的读书笔记. 第2章 词法结构 2.1 字 ...

随机推荐

  1. elasticsearch-5.2.1在windows下的安装方法

    elasticsearch-5.2.1安装方法 1. 安装java 下载安装java jdk 1.8 以上 配置java环境变量 右击[我的电脑]---[属性]-----[高级系统设置]---[环境变 ...

  2. eclipse下启动tomcat访问网址报404错误

    问题: 解决步骤 首先检查一遍自己tomcat的相关配置,如果无误,则继续下面的操作 1.打开server视图,双击tomcat进入编辑页面 选择其中的第二个选项,并且修改Server path中的内 ...

  3. windows控件理论学习

    mmp快考试了还在浪 一.对话框编辑器创建控件 1.使用new在堆上创建,系统结束时我们需要使用delete去销毁控件 2.对话框编辑器控件,程序结束,自动销毁 二.控件类的基类 CWnd类和消息映射 ...

  4. HttpConnection

    1.HttpConnection 用于接受和发送网络数据 网络操作必须新开个子线程执行,否则会出现 ANR(Application Not Response) 应用无响应异常 Get: /** * 通 ...

  5. echarts研究

    1.echarts是什么? 关键字:data visualization,canvas,chart Echarts是基于轻量级的canvas类库,纯javaScript实现,MVC封装,数据驱动,一款 ...

  6. Fiddler 教程---小坦克

    协议. Fiddler无论对开发人员或者测试人员来说,都是非常有用的工具 Fiddler的工作原理 Fiddler 是以代理web服务器的形式工作的,它使用代理地址:127.0.0.1, 端口:888 ...

  7. Hibernate 对象关系映射文件

    简介: POJO 类和关系型数据库之间的映射可以用一个 XML 文档来定义 通过 POJO 类的数据库映射文件,Hibernate 可以理解持久化类和数据表之间的对应关系,也可以理解持久化类属性与数据 ...

  8. Web版记账本开发记录(一)代码和功能展示

    一丶基本机构 数据库截图 record表 年份表 index.jsp <%@ page language="java" contentType="text/html ...

  9. C++类中的Static关键字二

    静态成员是可以独立访问的,也就是说,无须创建任何对象实例就可以访问,而静态成员函数可不建立对象就可以被使用.   或者说静态函数与一般函数没有太大的区别,只是访问有限制,静态变量跟一般的全局变量的区别 ...

  10. PHP算法学习(8) 环形链表 解决约瑟夫问题

    2019年2月25日17:29:17 Josephus有过的故事:39 个犹太人与Josephus及他的朋友躲到一个洞中,39个犹太人决定宁愿死也不要被敌人抓.于是决定了自杀方式,41个人排成一个圆圈 ...