转自:http://www.cnblogs.com/GrayZhang/archive/2011/03/31/learning-html5-doctype.html

上一篇文章主要讲述了HTML文档的构成,同时肤浅地接触了“标签省略”这一概念,本文会从概念上介绍HTML文档中第一个出现的重要元素 - DOCTYPE。

所谓DOCTYPE,最初是XML的概念,即通过一种特定的语法,作为一种元数据,来描述XML文档中允许出现的元素,以及各元素的组成、嵌套规则等。具体的概念可以在WIKI中中得到一个更详细的结果。

但是在HTML中,DOCTYPE又有着一些不同的效果,其中之一就是著名的触发浏览器标准模式的功能。即如果没有DOCTYPE,浏览器会进入一种被称为Quirks模式的怪异状态,在该模式下,浏览器的盒模型、样式解析、布局等都与标准规定的存在差异。

需要注意的是,所谓的HTML标准、DOM标准等,只规定了在标准模式下的概念和行为,正如文档构成中提到的,DOCTYPE是一个HTML文档绝对不可以省略的部分,因此就根本不存在“Quirks模式”这样的概念。也正是因为标准中没有对Quirks模式做出任何的规定,因此不同浏览器在Quirks模式下的处理也是不同的,应用Quirks模式可谓难上加难。

HTML4的DOCTYPE

在HTML4的标准中,DOCTYPE被归属于“HTML版本信息”一章中。在该章节中,标准指定了3种DOCTYPE:

  • 严格模式:<!DOCTYPE HTML PUBLIC "-//W3C//DTD HTML 4.01//EN" "http://www.w3.org/TR/html4/strict.dtd">
  • 过渡模式:<!DOCTYPE HTML PUBLIC "-//W3C//DTD HTML 4.01 Transitional//EN" "http://www.w3.org/TR/html4/loose.dtd">
  • 框架模式:<!DOCTYPE HTML PUBLIC "-//W3C//DTD HTML 4.01 Frameset//EN" "http://www.w3.org/TR/html4/frameset.dtd">

在HTML4的标准中,每一个DOCTYPE对应的dtd文件都是有合法的URL指定的,可以通过互联网进行下载。浏览器可以根据URL获得到dtd的具体内容,并根据内容的规定来解析文档。

现实是不同的

HTML4如同XML一样,是一个相当理想化的标准。但是,现实往往并没有这么理想,试想下面的HTML文档:

<!DOCTYPE HTML PUBLIC "-//W3C//DTD HTML 4.01 Frameset//EN"
"http://www.w3.org/TR/html4/frameset.dtd">
<html>
<head>
<title>I'm not a frameset</title>
</head>
<body>
<p>So what?</p>
</body>
</html>

这个文档采用了一个框架模式的DOCTYPE,但其正文确没有使用任何<frame>元素,相对应地使用了应该由严格模式或者过渡模式指定的,标准的HTML结构。那么在这种情况下,浏览器能做什么呢?

拒绝渲染该页面?不,浏览器不敢这么做,在激烈的市场竞争之中,如果因此而导致部分页面无法渲染的话,就只能眼睁睁看着市场份额注入别家田了。所以浏览器顶多弱弱地报一个警告以示抗议,却依旧得乖乖地解析出这个文档并正确渲染。

这就是所谓的浏览器的“容错性”,事实上无论你的DOCTYPE是什么,浏览器都会以最大的兼容能力去解析一个文档,并以最大的努力让这个文档显示得符合开发者的预期。而浏览器的这一特性,也逐渐让标准制定者开始意识到,DOCTYPE似乎真的不怎么重要。因此,在HTML5中,DOCTYPE发生了一次重大的变化……

HTML5的DOCTYPE

到了HTML5了,这一变化相信多数人已经知道,就是HTML5将DOCTYPE的声明简化了,只需要<!DOCTYPE html>即可。

正好前文所述,在HTML4时代,标准制定者已经认识到,DOCTYPE对浏览器的渲染并没有太大的帮助,除了给无聊的w3c验证器看以外,DOCTYPE似乎只有触发浏览器兼容模式的作用。于是标准工作组采取了非常实际的态度,测试了所有课程顺触发标准模式的最简DOCTYPE,最终得出了这一结论。

但是故事不会这么简单,标准工作组也不是完成这么简单的动作就撒手不管的无赖分子,事实上他们还是很尽责任地考虑到了向后兼容性、可扩展性等一系列的事情,最后将DOCTYPE一章用了大量文字来进行描述,得到一个非常详实的结果。

HTML5的参考手册相关章节中,将DOCTYPE分为3类:

普通DOCTYPE - normal doctype

普通DOCTYPE就是我们所见的最简形式,即<!DOCTYPE html>,他的真正组成是这样的:

  1. 一段文本,即<!DOCTYPE,大小写不敏感。
  2. 1个或多个空格,关于空格的定义请参照简介中的解释。
  3. 字符HTML,同样大小写不敏感。
  4. 1个或多个空格。
  5. 结束标记,即>
不再推荐的DOCTYPE - deprecated doctype

即所谓HTML4时代的几个DOCTYPE,其组成如下:

  1. 一段文本,即<!DOCTYPE,大小写不敏感。
  2. 1个或多个空格。
  3. 字符HTML,同样大小写不敏感。
  4. 1个或多个空格。
  5. 字符PUBLIC,大小写不敏感。
  6. 继续1个或多个空格。
  7. 一对引号或单引号(必须前后匹配),引号中放一个Public ID。
  8. 可选内容:
    1. 1个或多个空格。
    2. 一对引号或单引号(必须前后匹配),引号中放一个与前面的Public ID对应的System ID。
  9. 1个或多个空格。
  10. 结束标记,即>

在标准中,Public ID和System ID是有严格的对应关系的,如果规定的System ID不能有Public ID,则上面的第8项可选内容也就不能存在。HTML5彻底放弃了HTML4中的过渡型和框架型的DOCTYPE,同时整合了XHTML的DOCTYPE声明,得出以下6种组合方式:

  • <!DOCTYPE html PUBLIC "-//W3C//DTD HTML 4.0//EN">
  • <!DOCTYPE html PUBLIC "-//W3C//DTD HTML 4.0//EN" "http://www.w3.org/TR/REC-html40/strict.dtd">
  • <!DOCTYPE html PUBLIC "-//W3C//DTD HTML 4.01//EN">
  • <!DOCTYPE html PUBLIC "-//W3C//DTD HTML 4.01//EN" "http://www.w3.org/TR/html4/strict.dtd">
  • <!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Strict//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-strict.dtd">
  • <!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.1//EN" "http://www.w3.org/TR/xhtml11/DTD/xhtml11.dtd">
遗留工具DOCTYPE - leagacy tool compatible doctype

顾名思义,完全是为了兼容久远时代的历史遗产而准备的DOCTYPE,甚至都已经没办法考证什么样的“工具”会搞出这种DOCTYPE来……遗留工具型的DOCTYPE的组成如下:

  1. 一段文本,即<!DOCTYPE,大小写不敏感。
  2. 1个或多个空格。
  3. 字符HTML,同样大小写不敏感。
  4. 1个或多个空格。
  5. 字符SYSTEM,大小写不敏感。
  6. 继续1个或多个空格。
  7. 一对引号或单引号(必须前后匹配),引号中放一段文本about:legacy-compat,注意这段文本是大小写敏感的。
  8. 1个或多个空格。
  9. 结束标记,即>

比如这样的DOCTYPE就属于此类:<!doctype HTML system "about:legacy-compat">,基本上除了大小写,没有什么值得改变的。

现实的细节

对于DOCTYPE的作用,在真正的浏览中,仅仅起到触发浏览器的标准模式的作用。虽然根据标准,一个HTML文档中,DOCTYPE前可以有其他的元素,如一个U+FFEF的BOM,几个注释,一点空格,但是在当前的状态下,并没有这么理想:

  • 对于IE6-9,如果DOCTYPE前存在注释,会进入Quirks模式。
  • 对于IE6,如果DOCTYPE前存在一个XML声明,会进入Quirks模式。

写完才发现,问题又全出在IE下……关于DOCTYPE的问题纠结至此,下一章主要讲述编码声明的问题。

HTML5标准学习 – DOCTYPE的更多相关文章

  1. 数百个 HTML5 例子学习 HT 图形组件 – 拓扑图篇

    HT 是啥:Everything you need to create cutting-edge 2D and 3D visualization. 这口号是当年心目中的产品方向,接着就朝这个方向慢慢打 ...

  2. HTML5+CSS3学习笔记(一)

    HTML5+CSS3概述 HTML5和CSS3不仅仅是两项新的Web技术标准,更代表了下一代HTML和CSS技术.虽然HTML5的标准规范还没有正式发布,但是未来的发展前景已经可以预见,那就是HTML ...

  3. HTML5 例子学习 HT 图形组件

    HTML5 例子学习 HT 图形组件 HT 是啥:Everything you need to create cutting-edge 2D and 3D visualization. 这口号是当年心 ...

  4. HTML5基础学习

    分享一下html5的一些基础,小白上路! 一.html5基本结构 <!DOCTYPE html> ↑声明文档类型为HTML5文件. 文档声明,在HTML文档必不可少.且必须放在文档第一行 ...

  5. HTML 参考手册- (HTML5 标准)

    HTML 参考手册- (HTML5 标准) 功能排序 New : HTML5 新标签 标签 描述 基础   <!DOCTYPE>  定义文档类型. <html> 定义一个 HT ...

  6. HTML5+CSS3学习笔记(一) 概述

    HTML5+CSS3概述      HTML5和CSS3不仅仅是两项新的Web技术标准,更代表了下一代HTML和CSS技术.虽然HTML5的标准规范还没有正式发布,但是未来的发展前景已经可以预见,那就 ...

  7. html5标准

    1.<!DOCTYPE html> html5标准网页声明,原先的是一串很长的字符串,现在是这个简洁形式,支持html5标准的主流浏览器都认识这个声明.表示网页采用html5 浅谈:htm ...

  8. IT兄弟连 HTML5教程 HTML5的学习线路图 第二、三阶段

    第二阶段编写用户交互功能 通过第一阶段的学习虽说可以完成页面制作,但并不完美,不能算是合格的前端工程师,所以要继续学习如图1.13中的第二阶段内容.现在的Web页面都融入了大量的特效,并且多数需要与用 ...

  9. 数百个 HTML5 例子学习 HT 图形组件 – 3D建模篇

    http://www.hightopo.com/demo/pipeline/index.html <数百个 HTML5 例子学习 HT 图形组件 – WebGL 3D 篇>里提到 HT 很 ...

随机推荐

  1. ES+Hbase对接方案概述

    方案背景 Hbase的索引方案有很多,越来越多的人开始选择ES+Hbase的方案,其实该方案并没有想象中那么完美,ES并发低,同时查询速度相对Hbase也慢很多,那为什么会选择他呢,它的写入比较快,如 ...

  2. prototype.js $F()函数介绍

    $F()是一个能够简化编码量的函数, 对于字段输入控件有效,包括input.textarea.select等,该函数的输入参数为这些输入控件元素对象的id或元素对象本身,函数负责返回 这些输入控件元素 ...

  3. MATLAB对话框设计[转]

    Matlab之对话框 对话框设计:在图形用户界面程序设计中,对话框是重要的信息显示和获取输入数据的用户界面对象. 1.公共对话框: 公共对话框是利用windows资源的对话框,包括文件打开.文件保存. ...

  4. PHP程序员,因该养成 7 个面向对象的好习惯

    在 PHP 编程早期,PHP 代码在本质上是限于面向过程的.过程代码 的特征在于使用过程构建应用程序块.过程通过允许过程之间的调用提供某种程度的重用. 但是,没有面向对象的语言构造,程序员仍然可以把 ...

  5. 在VMware上面安装Solaris 10

    导读 Oracle Solaris 11 是世界上最先进的企业操作系统,提供安全.速度.简单的企业云环境和DevOps.在这篇文章中我们将使用Solaris 10版本,但您可以按照同样的步骤,来安装刚 ...

  6. Clustering by fast search and find of density peaks

    参考:http://www.52ml.net/16296.html 这个算法的优点就在于,它首先一步就能找到聚类中心,然后划分类别.而其他算法需要反复迭代才能找到中心聚类. 就是不知道代码该怎么写.. ...

  7. BZOJ 1602 USACO2008 Oct 牧场行走

    翻翻吴大神的刷题记录翻到的... 乍一看是一个树链剖分吓瓜我...难不成吴大神14-10-28就会了树剖?orz... 再一看SB暴力都可过... 然后一看直接树上倍增码个就好了... 人生真是充满着 ...

  8. C 结构体小结

    看了三天结构体,是时候总结一下了. 关于结构体的声明: struct Student { ]; char sex; int age; ]; }; /*然后定义一个Student 类型的 student ...

  9. php获取网页内容方法总结

    抓取到的内容在通过正则表达式做一下过滤就得到了你想要的内容,至于如何用正则表达式过滤,在这里就不做介绍了,有兴趣的,以下就是几种常用的用php抓取网页中的内容的方法. 1.file_get_conte ...

  10. .Net Attribute特性

    1.什么是Atrribute 首先,我们肯定Attribute是一个类,下面是msdn文档对它的描述: 公共语言运行时允许你添加类似关键字的描述声明,叫做attributes, 它对程序中的元素进行标 ...