URI

URI 是 Uniform Resource Identifier 的缩写。

Uniform

  • 统一不同类型的资源。比如 txtmp3jpeg 等不同的类型的资源都可以使用 URI 来标识
  • 统一不同协议。比如 httpftpmailto 等不同的协议都可以使用 URI 来标识
  • 统一新旧资源。引入新资源不会影响已有资源

Resource

官方定义没有对资源的范围做任何限制,所以任何被 URI 标识的东西都可以叫做资源。

常见的例子有电子文档、图片、固定用途的信息(比如今天 Los Angeles 的天气预报)、一项服务(比如 HTTP-to-SMS 网关)或者是一组资源。一个资源不一定需要能通过互联网访问,比如一个组织和图书馆中的一些书也可以是资源。抽象的概念也可以是资源,比如某些关系(比如雇佣关系或者婚姻关系)。

Identifier

从其他资源中区分一个资源,无论用什么手段实现(比如名称、地址)。标识符可以是 ID,但也可以不是,所以不要将标识符与 ID 等价。

语法规则

由 协议、authority、path、query 和 fragment 组成

URI         = scheme ":" hier-part [ "?" query ] [ "#" fragment ]

hier-part   = "//" authority path-abempty
/ path-absolute
/ path-rootless
/ path-empty

协议必填且不能为空,路径必填但可以为空。Authority 不是必填,但如果填写了要以 // 开头。

abempty 的意思是 absolute or empty

两个示例:

foo://example.com:8042/over/there?name=ferret#nose
\_/ \______________/\_________/ \_________/ \__/
| | | | |
协议 authority path query fragment
| _____________________|__
/ \ / \
urn:example:animal:ferret:nose

协议

为了 robustness,协议是大小写不敏感的(比如 HTTPhttp 是一样的),但为了一致性,只应该使用小写来表示协议。常用的有:http、https、ftp、mailto、file、data 和 irc。

Authority

很多 URI 协议都包含一个用于命名 authority 的分级元素,所以 URI 的路径会指向 authority 对应的命名空间。

Authority 以 // 开头,以下一个 /?# 或者 URI 的结尾而结尾。

语法如下:

authority   = [ userinfo "@" ] host [ ":" port ]

这里不描述 userinfo,因为很少用到。

host 语法如下:

host        = IP-literal / IPv4address / reg-name

host 同样是大小写不敏感,但为了一致性也要使用小写表示。

  • IP-literal:使用 IPV6 以及之后版本的 IP 地址,要使用 [] 包裹

  • IPv4address:使用点分十进制表示

      IPv4address = dec-octet "." dec-octet "." dec-octet "." dec-octet
    
    dec-octet   = DIGIT                 ; 0-9
    / %x31-39 DIGIT ; 10-99
    / "1" 2DIGIT ; 100-199
    / "2" %x30-34 DIGIT ; 200-249
    / "25" %x30-35 ; 250-255
  • reg-name:点分字符串,字符串可以是字母或者 -

可以看出 IPv4address 和 reg-name 并没有很明显的区分。所以为了区分这两者,采用 "first-match-wins" 算法:如果 host 匹配 IPv4address的规则,那它是一个 IPv4address 而不是 reg-name。

路径采用与文件系统一样的路径表示方式,以 / 分割。设计者这样说:

The relative URI syntax is just unix pathname syntax reused without apology.[2]

PS:设计者后悔采用 // 的设计,因为这个太笨拙了[2],从使用情况就可以看出,一般我们都不会用到 // 而是直接输入 // 后面的部分(比如输入 www.google.com 而不是 //www.google.com)。

URI、URL 和 URN

"Uniform Resource Locator" (URL) 是 URIs 的一个子集,提供一种定位资源而不是标识资源的方法。"Uniform Resource Name" (URN) 被用来指 "urn" 协议的 URIs 和其他通过名称属性定位的 URIs[1, 3]。

PS:关于 URL 的疑惑:上面说 URL 是定位而不是标识,但是 URI 中的 Identifier 就是标识符的意思,这不矛盾吗?

人们实际使用中也没有很明显的区分 URI 和 URL。普通用户都是说 URL,程序员混用 URL 和 URI,甚至连 RFC 中也是混用这两者(比如 "URI Syntax" (RFC 2396)、"Registration Procedures for URL Schemes" (RFC 2717))。

所以,综合各种情况,可以这样使用:

  • 如果资源会同时用 URL 和 URN 表示,那么使用 URI
  • 如果资源只用 URN 表示,那么用 URN,因为 URN 特殊并且少见
  • 如果资源只用 URL 表示,那么可以用 URL 或 URI,但是确定后最好统一使用而不是混用这两者

参考

  1. rfc3986
  2. https://www.w3.org/People/Berners-Lee/FAQ.html#etc
  3. https://tools.ietf.org/html/rfc3305

URI 、URL 和 URN的更多相关文章

  1. URI, URL, and URN

    URI: uniform resource identifier,统一资源标识符,用来唯一的标识一个资源. URL: uniform resource locator,统一资源定位器,它是一种具体的U ...

  2. URL、URN、URI的区别?

    URL.URN.URI区别 既然Web应用程序的文件等资源是放在服务器上,而服务器是因特网(Internet)上的主机,当然必须要有个方法,告诉浏览器到哪里取得文件等资源.通常会听到有人这么说:“你要 ...

  3. 关于URI URL URN

    刚琢磨.整理了关于escape.encodeURIComponent.encodeURI的知识.突然又对URI有点模糊了,遂整理了以下资源 : 资源一: URL,URI 和URN 的举例理解 资源二: ...

  4. URI、URL、URN介绍

    注:1. 仅从http(Hypertext Transfer Portocol)角度阐述,不涉及语言层面的类库. 2. 以下内容均参考<Http权威指南>一书. 一.万维网构成       ...

  5. uri,url.urn

    uri:Web上可用的每种资源 - HTML文档.图像.视频片段.程序等 - 由一个通过通用资源标志符(Universal Resource Identifier, 简称"URI" ...

  6. URI、URL和URN

    URI.URL和URN URI :Uniform Resource Identifier,通用资源标识符: URL:Uniform Resource Locator,统一资源定位符: URN:Unif ...

  7. URI、URL以及URN的区别

    首先,URI,是uniform resource identifier,统一资源标识符,用来唯一的标识一个资源.而URL是uniform resource locator,统一资源定位器,它是一种具体 ...

  8. URI、URL、URN

    URI.URL.URN URI(Uniform Resource Identifie):统一资源标识符 URL(Uniform Resource Locator):统一资源定位符 URN(Unifor ...

  9. Http权威指南笔记(一) URI URL URN 关系

    定义 URI:统一资源标识符(Uniform Resource Indentifier)用来标识服务器上的资源. URL:统一资源定位符(Uniform Resouce Locator)是资源标识符最 ...

  10. URI ,URL 和 URN

    URI : 统一资源标识符,用来唯一标识互联网资源,包括URL和URN URL:统一资源定位器 包含: 协议,域名,端口,路由,参数,hash https://i.cnblogs.com/EditPo ...

随机推荐

  1. Activity生命运行中的几个方法

    给大家看看一个周期图

  2. 访问子节点childNodes

    访问子节点childNodes 访问选定元素节点下的所有子节点的列表,返回的值可以看作是一个数组,他具有length属性. 语法: elementNode.childNodes 注意: 如果选定的节点 ...

  3. 在eclipse上Checkstyle的安装和使用

    1. 概述 随着中心的代码规范的建立和实施,项目组对代码规范要求,以及软件工程师们对自身代码的编写规范重要性的认知,“代码规范”已经成为了中心的一个“热词”.然后怎么才能写出有规范的代码,怎么才能养成 ...

  4. love2d教程30--文件系统

    在游戏里少不了文件操作,在love2d里我们可以直接用lua自带的io函数,如果不熟悉可以先读一下我的lua文件读写. 相对lua,love2d提供了更多的函数, 方便我们操作文件.不过可能处于安全考 ...

  5. 去除inline-block元素间间距的N种方法<转>

    一.现象描述 真正意义上的inline-block水平呈现的元素间,换行显示或空格分隔的情况下会有间距,很简单的个例子: <input /> <input type="su ...

  6. alsamixer 在音频子系统的使用

    alsamixer是Linux 音频架构ALSA工具的其中一个,用于配置音频的各个参数. alsamixer是基于文本下的图形界面的,可以通过键盘的上下键,左右键等,很方便地设置需要的音量,开关某个s ...

  7. 机器学习:如何通过Python入门机器学习

    我们都知道机器学习是一门综合性极强的研究课题,对数学知识要求很高.因此,对于非学术研究专业的程序员,如果希望能入门机器学习,最好的方向还是从实践触发. 我了解到Python的生态对入门机器学习很有帮助 ...

  8. thinkphp 命名规范

    目录和文件命名 目录和文件名采用 小写+下划线,并且以小写字母开头: 类库.函数文件统一以.php为后缀: 类的文件名均以命名空间定义,并且命名空间的路径和类库文件所在路径一致(包括大小写): 类名和 ...

  9. ubuntu samba 安装

    Samba是在Linux和UNIX系统上实现SMB协议的一个免费软件,是一种在局域网上共享文件和打印机的一种通信协议. 1. 安装 sudo apt-get install samba samba-c ...

  10. 绑定QQ登录 PHP OAuth详解(转)

    越来越多的网站开始采用 第三方账号登录 如qq 微博 开心网 等诸多流行的社交平台,利用第三方账号登录,可以更好地省去用户的注册时间,并且极大地提高用户体验,吸引更多的潜在用户. 让用户拥有 一个号码 ...