HTTP基础系列之:一文搞懂URL
一般我们日常在上网的时候,会在浏览器的地址栏里输入一个网站的 "网址",点击下回车,就会跳到你想去的网站,就类似这样
但其实,叫做 "网址" 并不是特别的准确,确切的说,应该叫做 URL
到底啥是URL
那到底啥是 URL 呢? 不就是一个网址吗?
URL 是英文 Uniform Resource Locator 的缩写,即统一资源定位器,是因特网上用于指定信息位置的表示方法,通过它就能找到网上的某个你要的资源
URL的组成
虽然我们平时使用浏览器的时候,只要输入baidu.com
或者qq.com
就能正常上网了,但其实我们输入的只是整个URL中的一小部分
来,我先看看一个相对完整的URL的整体结构是怎么样的
这里大致分了几个部分,我们一个个来看,它们具体是干什么的
协议
图中http://
这部分就是协议部分,即指定了URL是以什么协议发送网络请求的
常见的协议如:http://
、https://
、ftp://
、file://
,比如: http://
就是超文本传输协议,平时上网大多用这个协议,https://
是以安全为目标的HTTP协议。
地址
图中localhost
就是地址部分,用来确定URL所要访问的服务器的网络地址(也就是网址)。在URL中,地址可以用三个形式来表示:域名
、主机名
、IP地址
域名
我们平时输入的www.baidu.com
、www.qq.com
就是域名,域名也分一级域名
、二级域名
、以及顶级域名
。
顶级域名:在域名的尾巴部分,
.com
这种就是顶级域名
,顶级域名一般都代表网站属于某种机构或组织。像.com
(商业机构)、.org
(非盈利组织)、
.gov
(政府机构)这类就是常见的顶级域名,除此之外,还有些代表国家的顶级域名,如:.cn
(中国)、.us
(美国)、.jp
(日本)等等一级域名:像
qq.com
就是一级域名
,看上去十分简洁,在顶级域名.com
前只有一个单词短语二级域名:而
mail.qq.com
和v.qq.com
这种前面加了mail.
、v.
等字符串的就叫二级域名
不过,域名也只是一串文字,计算机和路由器并不能直接认出它,还需要通过DNS
服务器找到域名对应的IP地址
,再通过底层的TCP/IP
协议路由到对应的机器上去 (这些内容不是本文的重点暂时略过,先挖个坑再说)
主机名
主机名就是某台计算机的名字,在一个局域网内,可以通过主机名
找到你要访问的计算机。主机名和域名一样,计算机和路由器不认它,需要通过HOSTS文件
这样的技术找到主机名
和IP地址
的关联关系,最后还是翻译成IP地址
再继续发送网络请求
图中的localhost
也是主机名
,但是一种比较特殊的主机名
,是给 回环地址的一个标准主机名,就是代表本机自己的地址。
IP地址
在URL中也可以直接用IP地址
来代替域名或主机名,如192.168.0.1
,关于IP地址
的相关知识点放到以后再讲(继续挖坑)
端口号
图中在冒号:
后面的那串数字8080
就是端口号,一台服务器上可以开多个端口号,往往一个网络服务程序就对应一个端口号
比如,我在机器 A 上,开了两个服务程序,分别是 Tomcat
和SSH
,让它们分别关联端口8080
和22
,那URL中如果端口号是8080
就是会访问到Tomcat
程序,22
就会连接SSH服务。
但可能有小伙伴会有疑问:诶,我平时上百度看到的URL是http://www.baidu.com
没看到有端口号啊
其实是有的,端口号是80
,只是它被隐藏起来了,我们看不到而已,而这个80
端口也就是URL的默认端口号
但不是所有URL的默认端口号都是80
,如果协议是http://
,默认端口号为80
,但若是https://
协议,默认端口号就是443
了
虚拟目录
从第一个斜杠/
开始,到最后一个斜杠/
结束的那部分,也就是图中/app/user/
那部分即为虚拟目录
它就类似我们电脑中文件目录的格式,第一个/
为根目录,每多一个/
就多进入一层目录
文件名
从域名后开始算起的最后一个斜杠/
开始,到?
为止,没有?
则到#
为止,或者?
和#
都没有就是到整个URL结束为止的那部分就为文件名
说起来很绕吧,其实就是图中 info.do
这部分,它一般包含文件名和扩展名('.'后面那部分),用来指代一个URL所访问的具体文件或资源,它可以是图片、html文件、css文件,也可以是js文件、字体文件等等,它也可以不是某种文件,而是服务端后台执行的某段程序。
甚至可以省略不写虚拟目录和文件名,因为它们本来就不是必须的,就如http://www.baidu.com
这样的URL就没有文件名,但服务器会在缺省的情况下给你定位到某个特定的文件或程序上去。
查询参数
从?
后到#
结束,即图中的?uid=101&ty=2
为查询参数
查询参数,也称为URL参数、查询字符串,英文名为 Query
,它是用来向服务端以字符串的形式传递参数和少数数据用的
其参数形式一般都以多个键值对
的形式进行表示,如 a=1
、b=2
就是两个键值对
,键为"a"和"b",值为对应的"1"和"2", 多个键值对
用&
连起来:a=1&b=2
URL编码
但参数要传递的某些值往往带有特殊字符,这些字符和URL标准的格式冲突,比如要传a&b
这样字符串,和查询参数键值对的连接符&
冲突了,若不加以区分就会产生歧义
而最简单的办法,就是对参数值进行编码,称为 URL Encoding,通过编码,a&b
变成了a%26b
,就不再包含会冲突的特殊字符
而有些参数即便有特殊字符,也不会被编码,除非自行强制编码,比如URL中参数值是另外一串URL,就可以写成 http://localhost/do?url=http://www.baidu.com
这种特殊情况不会有歧义,因为计算机系统认得出参数是另一串URL,就会按URL的形式来解析,但当子URL又包含子参数和多子键值对的时候也难免会分不清参数到底是儿子的还是父亲的,这时还是强制编码的好
列表参数
URL的参数是一个个键值对,即一个key
对应一个value
,那如果是一个key
要传递多个值,也就是一个列表咋办?也好办
URL的参数名是可以重复的,比如a=1&a=2&a=3
,这里穿了3个参数名都为a
的查询参数,是完全可以的,可以利用这种特性,按顺序将 1
、2
、3
作为参数a
的列表值
为了表示更清楚点,一般都会在列表参数名后面加上一对方括号[]
,如:a[]=1&a[]=2&a[]=3
但是,对于URL参数的写法和格式的标准,也没有特别严格的规定,以上几种形式一般都会支持
锚
图中#
后面那部分字符串,#abc
就是锚部分
锚,英文称做Reference
,通常也是用来传递参数等信息,但与查询参数的本质区别就是这部分内容不会被传递到服务器端
锚一般用于页面,比如在浏览网页的时候,按个按钮突然帮你定位到页首或页面中的某个位子去了,这就是锚
现在随着前后端分离技术,尤其是 vue
、reactjs
等前端框架的兴起,锚作为前端javascript
程序处理的参数载体也越来越重要了
结语
URL看似已经习以为常、非常简单的东西,背后往往也隐藏着很多技术细节和知识点,甚至这短短一篇文章也没办法穷尽
其实URL的内容还有不少,比如<用户名>@<密码>
这种用户验证信息在URL中的传递,由于篇幅的关系还没有讲到
所以我讲分几篇文章来讲解HTTP
协议的其中几个重要部分,如果这一系列文章对你有帮助,别忘了关注哦~
最后,我还要推荐一款十分好用的 Java 端 HTTP
框架: Forest
官网:http://forest.dtflyx.com
Gitee仓库:https://gitee.com/dt_flys/forest
Github仓库:https://github.com/dromara/forest
这是一款声名式的HTTP框架,简单好用,因为它将拼接URL、请求头、请求体参数、等待响应,失败重试,转换响应数据到 Java 类型等脏活累活全包了
HTTP基础系列之:一文搞懂URL的更多相关文章
- 基础篇|一文搞懂RNN(循环神经网络)
基础篇|一文搞懂RNN(循环神经网络) https://mp.weixin.qq.com/s/va1gmavl2ZESgnM7biORQg 神经网络基础 神经网络可以当做是能够拟合任意函数的黑盒子,只 ...
- Web端即时通讯基础知识补课:一文搞懂跨域的所有问题!
本文原作者: Wizey,作者博客:http://wenshixin.gitee.io,即时通讯网收录时有改动,感谢原作者的无私分享. 1.引言 典型的Web端即时通讯技术应用场景,主要有以下两种形式 ...
- 一文搞懂指标采集利器 Telegraf
作者| 姜闻名 来源|尔达 Erda 公众号 导读:为了让大家更好的了解 MSP 中 APM 系统的设计实现,我们决定编写一个<详聊微服务观测>系列文章,深入 APM 系统的产品.架构 ...
- 三文搞懂学会Docker容器技术(下)
接着上面一篇:三文搞懂学会Docker容器技术(上) 三文搞懂学会Docker容器技术(中) 7,Docker容器目录挂载 7.1 简介 容器目录挂载: 我们可以在创建容器的时候,将宿主机的目录与容器 ...
- 一文搞懂所有Java集合面试题
Java集合 刚刚经历过秋招,看了大量的面经,顺便将常见的Java集合常考知识点总结了一下,并根据被问到的频率大致做了一个标注.一颗星表示知识点需要了解,被问到的频率不高,面试时起码能说个差不多.两颗 ...
- 一文搞懂如何使用Node.js进行TCP网络通信
摘要: 网络是通信互联的基础,Node.js提供了net.http.dgram等模块,分别用来实现TCP.HTTP.UDP的通信,本文主要对使用Node.js的TCP通信部份进行实践记录. 本文分享自 ...
- 一文搞懂Google Navigation Component
一文搞懂Google Navigation Component 应用中的页面跳转是一个常规任务, Google官方提供的解决方案是Android Jetpack的Navigation componen ...
- 一文搞懂RAM、ROM、SDRAM、DRAM、DDR、flash等存储介质
一文搞懂RAM.ROM.SDRAM.DRAM.DDR.flash等存储介质 存储介质基本分类:ROM和RAM RAM:随机访问存储器(Random Access Memory),易失性.是与CPU直接 ...
- 一文搞懂 Prometheus 的直方图
原文链接:一文搞懂 Prometheus 的直方图 Prometheus 中提供了四种指标类型(参考:Prometheus 的指标类型),其中直方图(Histogram)和摘要(Summary)是最复 ...
随机推荐
- 有关Java动态数组的一个小问题
前言 问题描述 今天遇到一个关于集合的问题,觉得比较有趣,记录一下,这个问题是:定义一个用户类,至少包含姓名,年龄,生日,qq邮箱,初始化10个用户,利用String操作,提取qq到List集合中,姓 ...
- 学习 Webpack5 之路(优化篇)
一.前言 从 0 到 1 学习的朋友可参考前置学习文章: 学习 Webpack5 之路(基础篇) 学习 Webpack5 之路(实践篇) 前置文章 学习 Webpack5 之路(基础篇) 对 webp ...
- JavaWeb_MVC 设计模式
Servlet缺点:(1)用servlet进行显示(out)会很麻烦,因为servlet是一个类,托福ibt并不擅长做显示:(2)servlet直接访问数据表的话,servlet内的访问和操作数据表的 ...
- DorisDB升级为StarRocks,全面开源!
今天被朋友圈刷屏了,StarRocks开源--携手未来,星辰大海! 原文链接:StarRocks开源--携手未来,星辰大海! 可能大家对StarRocks不太熟悉,但是DorisDB想必都是听说过的. ...
- JDK1.8源码(二)——java.lang.Integer类
一.初识 1.介绍 int 是Java八大基本数据类型之一,占据 4 个字节,范围是 -2^31~2^31 - 1,即 -2147483648~2147483647.而 Integer 是 int 包 ...
- 20210712考试-2021noip11
这篇总结比我写的好多了建议直接去看 T1 简单的序列 考场:愣了一会,想到以最大值分治.每次枚举最大值两侧更小的区间,st表预处理前缀和和最大值,用桶统计答案. 注意分治时要去掉最大值. const ...
- Maven专题4——Maven测试
Java世界的主流测试框架是JUnit和TestNG,Maven在构建执行到特定生命周期阶段的时候,通过插件执行JUnit和TestNG的测试用例. Maven执行测试的插件是maven-surefi ...
- POJ1804——Brainman(水题)
解题思路: 一个乱序序列的 逆序数 = 在只允许相邻两个元素交换的条件下,得到有序序列的交换次数 直接求逆序数 把S[i]和s[i+1~n]的元素逐个比较,如果s[i] > s[k] (k∈[i ...
- JS HTML5仿微信朋友圈特效
完美! 图片相册翻页可定位在第几张,右上角可关闭. 源代码下载地址: 链接: https://pan.baidu.com/s/1o7PA7wu 密码: asyt
- Win7 ASP连接数据库“未找到提供程序.该程序可能未正确安装”问题
是自己装的64位Windows 7系统的原因,默认64位环境下,IIS应用程序池未启用32位应用程序,我们只需要启用一下就可以了.打开IIS 7,定位到"应用程序池",然后选择使用 ...