前言：

本文作为解决如何通过 Golang 来编写 Web 应用这个问题的前瞻，对 Golang 中的 Web 基础部分进行一个简单的介绍。目前 Go 拥有成熟的 Http 处理包，所以我们去编写一个做任何事情的动态 Web 程序应该是很轻松的，接下来我们就去学习了解一些关于 Web 的相关基础，了解一些概念，以及 Golang 是如何运行一个 Web 程序的。

文章预计分为四个部分逐步更新

2023-04-13 星期四一更全文共计约 3800 字阅读大约花费 5 分钟

文章目录：

Web 的工作方式
用 Go 搭建一个最简单的 Web 服务
了解 Golang 运行 web 的原理
Golang http 包详解（源码剖析）
总结

正文：

Web 的工作方式

了解当你访问一个网页时，背后是如何运作的，发生了一些什么？

其实当你输入网址（URL）并按下回车之后，你的浏览器相当于扮演了 客户端 的角色，首先你的浏览器会去请求 DNS 服务器进行域名解析，将你输入的 URL 地址转化为对应的 ip 地址，通过 ip 地址我们就可以找到对应的服务器位置，从而进行 TCP 连接。

连接之后，你的浏览器会发送 HTTP 请求（Request）包，服务区收到请求包之后开始从响应处理请求包，调用自身的服务，并返回 HTTP 响应（Response）包。

客户端收到了来自服务端的响应之后开始渲染这个响应包里的主体（body），等收到了全部的内容应答后，就会断开与服务器的 TCP 连接（这里先讨论一般情况）

如图

而一个 Web 服务器也被称作 HTTP 服务器，它通过 http 协议与客户端通信。这个客户端通常是指 Web 浏览器

所以 Web 服务器的工作原理可以简单的总结为：

客户端通过 TCP/IP 协议建立与服务器的 TCP 连接
客户端向服务器发送 HTTP 协议请求包，请求服务器里的资源文档
服务器向客户机发送 HTTP 协议应答包，如果请求的资源包含有其他动态语言的内容，服务器就会调用动态语言的解析引擎负责处理这些动态内容，并将处理得到的数据返回给客户端
客户端与服务端断开连接。客户端开始解释收到的 HTML 文档，在客户端屏幕上渲染图形结果

以上步骤实现了一个最简单的 HTTP 事务，在上述情况中，客户端与服务端的通信非持久连接，发送接收应答后就断开（这里暂时不讨论 http 1.1 之后的持久连接、后文会有专门说明）

URL 和 DNS 解析

刚刚我们提到了 URL，它可以用来输入访问网页，那具体 URL 是个什么东西呢?

URL 是 Uniform Resource Locator“统一资源定位符” 的英文缩写

基本格式如下图

而 DNS 则是 Domain Name System “域名系统” 的英文缩写，它是一种组织成域层次结构的计算机和网络服务命名系统，它用于 TCP/IP 网络，它从事将主机名或者域名转换为实际 IP 地址的工作。可以把他理解成 URL 的“翻译官”

工作原理如下图

我们来详细地解释一下关于 DNS 的工作原理：

我们以 www.google.com 为例，在浏览器地址栏输入该域名，操作系统会首先检查自己的 hosts 文件中是否存在这个网址的映射关系，如果有，就可以直接调用这个 IP 地址的映射，完成域名解析
其次如果 hosts 里没有这个域名的映射，则查找本地 DNS 解析器缓存，看里面有没有这个网址的映射关系，如果有也直接调用
如果 hosts 和 本地 DNS 解析器缓存都没有，就会先去找 TCP/IP 参数中设置的首选 DNS 服务器，我们可以把他叫做 本地 DNS 服务器，此服务器收到查询需求时，如果要查询的域名，包含在本地配置区域的资源中，就将解析结果返回给客户端，完成域名解析，该解析具有权威性
如果要查询的域名，本地 DNS 服务器配置区域资源没有，但是该服务器却缓存了此网址的映射关系，则也可以调用完成解析，但是该解析不具有权威性
如果本地 DNS 服务器本地区域资源文件以及缓存都没有该映射，则根据本地 DNS 服务器的设置（是否设置转发器）进行查询，如果未用转发模式，本地DNS 就把请求发送至 “根 DNS 服务器” ，“根 DNS 服务器”收到请求后会判断这个域名是谁来授权管理（本例子为.com），并会返回一个负责该顶级域名服务器的一个 IP。本地 DNS 服务器收到 IP 信息后，将会联系负责管理 .com 域的这台服务器。这台服务器收到请求后，如果自己无法解析，它就会找管理 .com 域的下一级 DNS 服务器地址（这里是 google.com）并把它的 IP 给本地 DNS 服务器。当本地 DNS 服务器收到这个地址后，就会找 google.com 域服务器，重复上面的操作，进行查询，直到找到（www.goole,com）为止
如果是转发模式，则此 DNS 服务器就会把请求转发至上一级 DNS 服务器，由上一级服务器进行解析，上一级如果不能解析，就找根服务器，或者转发请求给上上级服务器，如此循环，直到找到（www.goole,com）为止

无论是转发模式还是非转发模式，是转发给上一级还是直接找根 DNS ，最后都是把结果返回给本地 DNS 服务器，由此 DNS服务器再返回给我们的浏览器（客户端）

流程图如下

基于上面的步骤，浏览器最终通过 DNS 服务器获得的是 IP 地址，所以浏览器（客户端）发起请求的时候是通过 IP 地址来和服务器进行信息通信的

HTTP 协议详解

HTTP 协议当然是 Web 服务器工作的核心，所以我们接下来具体详细地了解清楚一下 HTTP 协议是怎么发挥作用的

HTTP 协议是一种能让 Web 服务器与浏览器（客户端）通过 Internet 进行发送和接受数据动作的一个协议，它建立在 TCP 协议之上，一般会采用 TCP 的 80 端口。它是一个标准的 “请求-响应协议” 即客户端发出请求，服务端收到请求返回响应。
在 HTTP 协议中，客户端总是要通过建立一个连接与发送一个 HTTP 请求来发起一个事务。而服务器不能主动去与客户端联系，也不能给客户端发出一个回调连接，只能被动监听。
客户端与服务端都可以自行提前中断一个连接，例如，当浏览器下载一个文件时，你可以随时通过点击“暂停”按钮来中断文件的下载，关闭与服务器的 HTTP 连接。
HTTP 协议是无状态的，同一个客户端的这一次请求与上次请求之间没有对应关系，对 HTTP 服务器来说，它并不知道这两个请求是否来自同一个客户端。当然对于需要解决这个问题的情况我们可以使用 "Cookie"机制来维护连接的可持续状态
正因为 HTTP 协议是建立在 TCP 协议之上的，所以 TCP 攻击一样会影响 HTTP 的通信，例如常见的针对 TCP 的攻击：SYN Flood （比较流行的一种 Dos 拒绝服务攻击和 Ddos 分布式拒绝服务攻击）就是通过利用 TCP 协议的缺陷，发送了大量的伪造 TCP 连接请求从而使得被攻击的服务器资源耗尽（CPU 满负荷或者内存不足）

接下来我们分别看看 HTTP 协议的请求包和响应包

HTTP 请求包（浏览器/客户端信息）

我们可以使用 F12 查看一些内容，例如 Request 包的结构：

Request 包分为三部分，第一部分叫 Request line （请求行），第二部分是 Request header （请求头），第三部分是 body（主体），header 和 body 之间会有个空行隔开

请求包的实例图

HTTP 协议定义了很多与服务器交互的请求方法，最基础的四种是：GET\POST\PUT\DELETE，一个 URL 地址用于描述一个网络上的请求资源，而 HTTP 中的这四个操作就分别对应对这个资源的查改增删4个操作

这四个操作中最熟悉和常用的是 GET 和 POST 。

GET 一般用于获取/查询资源信息

POST 一般用于更新资源信息

GET 与 POST 的区别：

GET 方法提交的数据会放在 URL 后面，使用 ? 分割 URL 和传输的数据，参数之间以 & 相连
POST 方法则是把提交的数据放在 HTTP 包的 body 中
GET能提交的数据大小会因为浏览器对于 URL 的长度限制而有所限制
POST 方法提交的数据不会有限制
GET 方法提交数据会带来某些安全问题，例如：在用户的登录界面，如果使用 GET 方法提交数据，用户的账号和密码就会出现在 URL 上面，如果页面被缓存或者其他人可以访问机器，就可以额从历史记录中获得该用户的账号和密码！

关于 GET 与 POST 之间更详细的比较可参考我的另一篇 blog

GET 和 POST 到底有什么区别？

HTTP 响应包（服务器信息）

HTTP 的 response 包的结构如下图

和上面看到的请求包类似，response 响应包的第一行叫做 ”状态行“，由 HTTP 协议版本号、状态码、状态消息三部分组成

状态码的作用是告诉 HTTP 客户端（浏览器），HTTP 服务器是否产生了预期的 Response。

在 HTTP 1.1 协议中定义了 5 类状态码，每个状态码由三位数字组成，首位表示类别：

1xx 提示信息：表示请求被成功接受，继续处理
2xx 成功：表示请求已被成功接受
3xx 重定向：表示要完成这个请求必须进行更进一步的处理
4xx 客户端错误：客户端的语法错误或者请求无法实现
5xx 服务端错误：服务器未能实现合法的请求

常见的状态有：200 ：正常信息、302：跳转、404 not found 等等

Tips：持续连接与非持续连接（协议无状态/keep-alive）

无状态是指协议对于事物处理没有记忆能力，服务器不知道客户端是什么状态，体现在打开一个服务器的网页和你之前打开这个服务器的网页之间没有任何联系

HTTP 协议就是典型的无状态的面向连接的协议，虽然是无状态但是它是面向连接的协议，所以千万不要说 HTTP 使用的是 UDP （面向无连接）的协议了！！！

无状态不代表不能保持TCP连接（只要不断开连接我就不管你什么状态不状态的）

从 HTTP 1.1 开始，默认都开启了叫做 Keep-Alive 的保持连接的特性，也就是当一个网页打开完成之后，客户端和服务器之间用于传输 HTTP 数据的 TCP 连接不会关闭，如果客户端再次访问这个服务器上的网页，会继续使用这一条已经建立的 TCP 连接

当然 Keep-ALive 不会永久保持连接，它会有一个保持时间上限，你可以自行设置

如果你尝试去检查（F12）访问任意一个网址

通过分析整个 URL 请求的通信过程，你会发现：

在所有的请求中不止一个 URL 请求，还会有很多其他的如静态文件的资源请求

这其实是浏览器自带的功能之一，第一次请求 url ,服务器端返回的是 HTML 页面，然后浏览器会开始渲染这个页面，但是当解析到 HTML DOM里面的图片连接、css脚本和js脚本的连接的时候，浏览器就会自动地发起一个请求静态资源的 HTTP 请求，去获取相应的资源并渲染，最终将所有资源整合完整地展现出来

在网页优化中就会有一项措施，就是利用减少 HTTP 请求次数（把尽量多的css 和 js 资源合并）减少网页请求静态资源的次数，来提高网页的加载速度，减轻服务器的压力

总结

在这一部分，我们初步认识了 Web 的工作方式，并对一些基础的计算机网络相关知识有了进一步了解，特别是对于基于 TCP 协议的 HTTP 协议，以及该协议如何在整个客户端-服务端中运作。
当我们知道了 Web 就是一个基于 HTTP 协议的的一个服务的时候，我们就可以做好准备，去尝试在 Go 语言中体会如何搭建一个可以运行的 Web 服务了。

关于 Golang 基础部分以及计算机网络部分读者可以参阅我的往期 blog

Goalng：基础复习一遍过

漫谈计算机网络：网络层 ------ 重点：IP协议与互联网路由选择协议

以上

看完记得留下一个

Go For Web：踏入Web大门的第一步——Web 的工作方式的更多相关文章

Scrapyd 改进第一步: Web Interface 添加 charset=UTF-8, 避免查看 log 出现中文乱码
0.问题现象和原因如下图所示,由于 Scrapyd 的 Web Interface 的 log 链接直接指向 log 文件,Response Headers 的 Content-Type 又没有声明 ...
【Web探索之旅】第一部分：什么是Web？
内容简介 1.Web探索之旅:开宗明义 2.第一部分第一课:什么是Web? 3.第一部分第二课:Web,服务和云 4.第一部分第三课:Web的诞生史 Web探索之旅:开宗明义大家好. 我们这个系列课 ...
使用WSE实现Web Service安全----我的第一篇
原文:使用WSE实现Web Service安全----我的第一篇 WSE(Web Services Enhancements)是微软为了使开发者通过.NET创建出更强大,更好用的Web Service ...
web前端学习python之第一章_基础语法(二)
web前端学习python之第一章_基础语法(二) 前言:最近新做了一个管理系统,前端已经基本完成, 但是后端人手不足没人给我写接口,自力更生丰衣足食, 所以决定自学python自己给自己写接口哈哈哈 ...
web前端学习python之第一章_基础语法(一)
web前端学习python之第一章_基础语法(一) 前言:最近新做了一个管理系统,前端已经基本完成, 但是后端人手不足没人给我写接口,自力更生丰衣足食, 所以决定自学python自己给自己写接口哈哈哈 ...
第一讲从头开始做一个web qq 机器人，第一步获取smart qq二维码
新手教程: 前言:最近在看了一下很久很久以前做的qq机器人失效了,最近也在换工作目前还在职,时间很挺宽裕的.就决定从新搞一个web qq机器人 PC的协议解析出来有点费时间以后再做. 准备工作: 编译 ...
Ireport第一张web项目报表。
原先项目里面的统计分析报表都是和普通的系统页面一样开发的,SSM架构,从数据库一层一层往前面传数据,最后通过jsp表现出来,这次在领导的建议下使用IReport进行报表开发,果然还是要使用工具啊,社会 ...
第一篇web框架
第一篇web框架 http协议 web应用和web框架主文 http协议 HTTP简介 HTTP协议是Hyper Text Transfer Protocol(超文本传输协议)的缩写,是用于从万维 ...
第一章 Web应用程序简介
1.1 Web应用程序基础知识 URL.URN与URI URL:Uniform Resource Locator URN:Uniform Resource Name URI:Uniform Resou ...
第一章 web应用程序开发原理
[总结] 1.计算机模式 :主机哑端计算机模式优点:速度快反应快维护修理方便数据安全性高缺点:单台计算机安全操作应用程序难维护难以跨出平台客户端客户计算机模式优点:速度快 ...

随机推荐

logic 运算符
【Rust入门】（一）构建自己的第一个Rust项目
安装Rust 参考文档,指定安装目录和镜像配置. rustc --version 检查是否安装成功. 构建程序使用rustc编译运行 rustc 编译:rustc main.js 运行: Windo ...
recovery gerrit
参考wiki :https://wiki.realtek.com/pages/viewpage.action?pageId=81823331 1.修改IP: for example : Gerrit/ ...
finereport连接mysql8.0
1.java包更新 2.下载地址:https://dev.mysql.com/downloads/connector/j/ 3.替换文件为8.0删除5.1版本 4.驱动器手动输入com.mysql.c ...
beta冲刺：汇总博客
这个作业属于哪个课程 <班级的链接> 这个作业要求在哪里 <作业要求的链接> 这个作业的目标汇总博客作业正文 .... 其他参考文献 ... 博客 beta冲刺(1/5) ...
如何利用Apifox通过签名计算及数据加解密进行用户认证接口测试?
用户注册场景:输入签名数据signature,appId,13位时间戳timestamp,6位随机数nonce,merchantId(非必填,本次不填)的请求参数发送给服务器,服务器返回响应数值后,校 ...
AI 脸部美容，一键让你变瘦变美变老变年轻
目录项目效果项目安装安装环境项目使用项目效果随着 AI 技术的发展,你不仅随时可以看到自己的老了之后的样子,还能看到自己童年的样子随着这部分技术的开源,会有越来越多的应用,当然我觉得前景 ...
个人数据保全计划：(2) NAS基础知识
前言距离去年国庆入手了NAS至今有好几个月时间了,NAS折腾起来有点麻烦,且实际作用因人而异,并没有想象中的好用,所以说好的这个系列一直没有更新~ 还有另一方面的原因,这些NAS的系统基于Linux ...
对于如何在IDEA中给Terminal添加git的详解
具体步骤 1.配置本机环境变量进入到环境变量的设置界面,然后找到下面的Path变量,双击点开: 然后新建一个变量,路径定义到git的目录下面的bin目录下: 2.WIN+R,然后输入cmd,进入终端 ...
MyBatis详细代码来啦！
家人们,改代码改到现在真的绝了,终于是改出来了,但是对于某些判断性的小问题还没写,细节性满满的增删改查终于实现啦! 目录结构各个文件的代码: //SqlSessionFactoryUtils.jav ...

Go For Web：踏入Web大门的第一步——Web 的工作方式

前言：

文章目录：

正文：

Web 的工作方式

了解当你访问一个网页时，背后是如何运作的，发生了一些什么？

URL 和 DNS 解析

HTTP 协议详解

HTTP 请求包 （浏览器/客户端 信息）

HTTP 响应包（服务器信息）

Tips： 持续连接 与 非持续连接（协议无状态/keep-alive）

总结

Go For Web：踏入Web大门的第一步——Web 的工作方式的更多相关文章

随机推荐

热门专题

HTTP 请求包（浏览器/客户端信息）

Tips：持续连接与非持续连接（协议无状态/keep-alive）