XHTML代码规则&手工html转换xhtml
XHTML规则
XHTML是XML得一个应用,它遵守XML得规范和要求。从技术角度上讲。这些语法规则是由XML规范定义的。
XML文档必须遵守的规则使得生成工具以解析文档变得更容易。这些规则也使得XML更容易处理。规则很简单,并且使用过HTML得人对于其中得一些规则应该比较熟悉。我们把XML得规则定义为下列两类:
∷XML语法规则,指的是定义了基本语法要求的规则。
∷XML文档规则,指的是管理着基本文档要求的规则。
∷XHTML语法规则
XHTML需要遵守的许多语法规则,比HTML文档需要遵守的规则严格很多。因此,下面所说的每个规则示例都伴随有使用HTML语法的HTML示例和遵循每节中定义的规则的XHTML示例。
1.所有的标记都必须要有一个相应的结束标记
以前在HTML中,你可以打开许多标签,例如<p>和<li>而不一定写对应的</p>和</li>来关闭它们。但在XHTML中这是不合法的。XHTML要求有严谨的结构,所有标签必须关闭。如果是单独不成对的标签,在标签最后加一个"/"来关闭它。例如:
<br /><img height="80" alt="网页设计师" src="../images/logo_w3cn_200x80.gif" width="200" />
2.所有标签的元素和属性的名字都必须使用小写
与HTML不一样,XHTML对大小写是敏感的,<title>和<TITLE>是不同的标签。XHTML要求所有的标签和属性的名字都必须使用小写。例如:<BODY>必须写成<body> 。大小写夹杂也是不被认可的,通常dreamweaver自动生成的属性名字"onMouseOver"也必须修改成"onmouseover"。
3.所有的XHTML标记都必须合理嵌套
同样因为XHTML要求有严谨的结构,因此所有的嵌套都必须按顺序,以前我们这样写的代码:
<p><b></p>/b>必须修改为:<p><b></b>/p>
就是说,一层一层的嵌套必须是严格对称。
4.所有的属性必须用引号""括起来
在HTML中,你可以不需要给属性值加引号,但是在XHTML中,它们必须被加引号。例如:
<height=80> 必须修改为:<height="80">
特殊情况,你需要在属性值里使用双引号,你可以用",单引号可以使用',例如:
<alt="say'hello'">
5.把所有<和&特殊符号用编码表示
任何小于号(<),不是标签的一部分,都必须被编码为< ;
任何大于号(>),不是标签的一部分,都必须被编码为> ;
任何与号(&),不是实体的一部分的,都必须被编码为&
6.给所有属性赋一个值
XHTML规定所有属性都必须有一个值,没有值的就重复本身。例如:
<td nowrap>
<input type="checkbox" name="shirt" value="medium" checked>
必须修改为:
<td nowrap="nowrap">
<input type="checkbox" name="shirt" value="medium" checked="checked">
7.不要在注释内容中使“- -”
“--”只能发生在XHTML注释的开头和结束,也就是说,在内容中它们不再有效。例如下面的代码是无效的:
<!--这里是注释-----------这里是注释-->
用等号或者空格替换内部的虚线。
<!--这里是注释= = = = = = = = = = = =这里是注释-->
以上这些规范有的看上去比较奇怪,但这一切都是为了使我们的代码有一个统一、唯一的标准,便于以识别。
∷XHTML文档规则
这里有为数不多的文档规则控制着良好构成的XML文档。我们还定义了一些可选择规则并推荐大家遵守,但这不是必须的。
把HTML转换成XHTML
1.手工转换文档
如果你更新数量不太多的文档,并且自己又很不愿意有一些XHTML实践经验,那么你会选择手工把HTML页面转换成XHTML。现在有非常出色的免费工具(HTML Tidy,将在下面具体讨论)可以帮你完成。但是,理解工具做了什么很重要,这样才能使用其中的自定义选项。
向后兼容性
XHTML与老式浏览器保持向后兼容。你应该记住XHTML使用HTML的词汇表,只有语法管理是阻止XHTML与老式浏览器兼容的实际障碍。幸运的是,XML语法与SGML(因此还有HTML)非常接近,因此语法方面的差别并不大。
在上面,已经讲解了XHTML文档必须遵守的所有规范,其中大多数已经由HTML进行了定义。额外的一些情况如所有的元素都必须关闭以及遵守空元素规则,是新增的
。
● 在使用XML的空元素语法时,在后面的斜线(/)之前要加一个空格,如<br />。
● 大多数老式浏览器会把XML的声明
<?xml version=”1.o” encoding=”HTF-8” standlone=”no”?>
作为内容显示出来,因此最好是省去将被老式浏览器看到的XHTML文档。如果你从文档中省去了XML声明,则该文档只能使用UTF-8或者UTF-16字符编码。
● 使用外部样式或者脚本文档,而不要把他们嵌入到你的XHTML文档的头部。在XHML代码之前,Web开发者可以使用HTML注释把脚本和样式单语句隐藏起来不被老式浏览器所见。XHTML使用XML CDATA节来标识内部脚本和样式单语法。
老式和新式的处理器很可能有冲突。如果你不使用外部脚本或者样式单,则应保证内部语句不要包含<.&.}]>或者--。
● 要在属性值或中加入折行或者多个空白符。许多XML开发者使用折行来帮助提供文档的可读性,但是浏览器对空白的处理切并不统一,并且在显示XHTML文档时多个空白符可能会引起问题。如果要使用空白符来提高可读性,那么要保证你只在元素之间使用这些空白符。
● 引用以英镑符(#value)开始的段识别符时要使用name和id属性。Name属性最初用于引用命名的锚接点(anchor);但是HTML4已经不在赞成使用此属性,并且引入了id属性代替它来唯一的标识给定的元素。为了保证将来的兼容性,你希望使用id属性;但是,因为许多目前的浏览器以及老式浏览器并不支持此属性,所以你也要使用name属性。例如:
<a name=”one” id=”one”>…</a>
● 同样,为了保持向前和向后的兼容性,还要同时使用lang和xml:lang属性来定义一个给定元素的语言。xml:lang属性比lang属性优先。
规则
作为XML的一个应用,XHTML要求遵守XML的语法要求。详细规则在前面已经说过。
闭合所有元素;
使用正确的空元素语法;
所有的属性值都必须用引号;
为所有属性分配值;
元素和属性名要小写。XHTML区分大小写;
元素要正确嵌套;
包含一个DOCTYPE声明
如果你坚持使用XHTML1的DTD之一,就不能使用HTML4的DTD引用。当你把自己的文档从HTML转换到XHTML时,要保证使用的是正确的DOCTYPE声明。
XHTML提供了三种dtd声明可供选择:
过渡的(transitional):
要求非常宽松的dtd,它允许你继续使用html4.01的标识(但是要符合xhtml的写法)。完整代码如下:
<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN"
"http://www.w3.org/tr/xhtml1/dtd/xhtml1-transitional.dtd">
严格的(strict):
要求严格的dtd,你不能使用任何表现层的标识和属性,例如<br>。完整代码如下:
<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 STRICT//EN"
"http://www.w3.org/tr/xhtml1/dtd/xhtml1-strict.dtd">
框架的(frameset):
专门针对框架页面设计使用的dtd,如果你的页面中包含有框架,需要采用这种dtd。完整代码如下:
<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 FRAMESET//EN" http://www.w3.org/tr/xhtml1/dtd/xhtml1-frameset.dtd">
添加XHTML名字空间:
XHTML使用XML名字空间来帮助唯一地标识元素和属性集。这种办法对于计划混和(嵌套)使用其他XML词汇表地时候尤其会带来方便。根据XHTML技术规范,所有的XHTML文档都必须使用默认的XHTML技术规范,所有的XHTML文档都必须使用默认的XHTML名字空间(xmlns="http://www.w3.org/1999/xhtml")。这个名字空间是要求使用的,并且必须定义在html起始标志中。
综合应用
下面的清单不是一个良好构成的XHTML文档,我们将把它转换成良好构成的XHTML文档。
不严谨的HTML文档
<HTML>
<HEAD>
<TITLE>Sloppy HTML</TITLE>
</HEAD>
<BODY>
<H1>Element Rules</H1>
<P><FONT COLOR=RED>Elements provide the structure that holds your document together.</FONT>
<BR>
<OL COMPACT>
<LI>Close all elements.
<LI>Empty elements should follow empty-element syntax,and besure to add the white space for backward compatibility.
<LI>Convert all stand-alone attributes to attributes with values.
<LI>Add quotation marks to all attribute values.
<LI>Convert all uppercase element and cttribute names to lowercase.
<LI>Use the appropriate DOCTYPE declaration.
<LI>Add the XHTML namespace to the html start tag.
<LI>Make sure you comply with any backward-compatible steps defined in the section "Backward Compatibility. "
</OL>
</BODY>
</HTML>
按照下列步骤把上述文档更改为具有良好的构成:
1.关闭所有元素。注意p元素以及列表项元素(li)都没有关闭标志,因此应该添加标识关闭的p和li标志。
<P><FONT COLOR=RED>Elements provide the structure that holds your document together.</FONT></P>
<BR>
<OL COMPACT>
<LI>Close all elements.</LI>
<LI>Empty elements should follow empty-element syntax,and besure to add the white space for backward compatibility. </LI>
<LI>Convert all stand-alone attributes to attributes with values. </LI>
<LI>Add quotation marks to all attribute values. </LI>
<LI>Convert all uppercase element and cttribute names to lowercase. </LI>
<LI>Use the appropriate DOCTYPE declaration. </LI>
<LI>Add the XHTML namespace to the html start tag. </LI>
<LI>Make sure you comply with any backward-compatible steps defined in the section "Backward Compatibility. "</LI>
</OL>
2.空元素应该最手空元素语法,并且要保证加入必要的空格以保持向后兼容性。BR元素是上述文档中唯一的空元素,因此应该把它更改成<BR />。
3.把所有独立的属性转换成带有值的属性。把COMPACT更改为COMPACT=COMPACT。
4.在所有属性值上加引号。
<P><FONT COLOR="RED">Elements provide the structure that holds your document together.</FONT></P>
<BR>
<OL COMPACT="COMPACT">
5.把所有大写元素和属性名(以及属性值)都转换为小写。
<html>
<head>
<title>Sloppy HTML</title>
</head>
<body>
<h1> Element Rules</h1>
<p><font color="red"> Elements provide the structure that holds your document together.</font></p>
<br />
<ol compact="compact">
<li> Close all elements.</li>
<li> Empty elements should follow empty-element syntax,and besure to add the white space for backward compatibility.</li>
<li> Convert all stand-alone attributes to attributes with values.</li>……
6.使用正确的DOCTYPE声明。我们将使用过渡型(Transitional)DTD:
<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN"
"http://www.w3.org/tr/xhtml1/dtd/xhtml1-transitional.dtd">
7.把XHTML名字空间添加到html起始标志中。
<html xmlns=http://www.w3.org/1999/xhtml>
最后得到的代码如下:
简洁的XHTML文档
<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN"
"http://www.w3.org/tr/xhtml1/dtd/xhtml1-transitional.dtd">
<html xmlns=http://www.w3.org/1999/xhtml>
<head>
<title>Sloppy HTML</title>
</head>
<body>
<h1> Element Rules</h1>
<p><font color="red"> Elements provide the structure that holds your document together.</font></p>
<br />
<ol compact="compact">
<li> Close all elements.</li>
<li> Empty elements should follow empty-element syntax,and besure to add the white space for backward compatibility.</li>
<li> Convert all stand-alone attributes to attributes with
values.</li>
<li> Add quotation marks to all attribute values.</li>
<li>Convert all uppercase element and cttribute names to lowercase.</li>
<li>Use the appropriate DOCTYPE declaration.</li>
<li>Add the XHTML namespace to the html start tag.</li>
<li>Make sure you comply with any backward-compatible steps defined in the section "Backward Compatibility."</li>
<ol>
</body>
</html>
这份清单中,对标记进行了缩进。可以使标记更便于阅读。
XHTML代码规则&手工html转换xhtml的更多相关文章
- 分享非常有用的Java程序 (关键代码)(五)---把 Array 转换成 Map
原文:分享非常有用的Java程序 (关键代码)(五)---把 Array 转换成 Map import java.util.Map; import org.apache.commons.lang.Ar ...
- 单元测试系列之十:Sonar 常用代码规则整理(二)
摘要:帮助公司部署了一套sonar平台,经过一段时间运行,发现有一些问题出现频率很高,因此有必要将这些问题进行整理总结和分析,避免再次出现类似问题. 作者原创技术文章,转载请注明出处 ======== ...
- 单元测试系列之九:Sonar 常用代码规则整理(一)
更多原创测试技术文章同步更新到微信公众号 :三国测,敬请扫码关注个人的微信号,感谢! 摘要:公司部署了一套sonar,经过一段时间运行,发现有一些问题出现频率很高,因此有必要将这些问题进行整理总结和分 ...
- 【转】SonarQube配置自定义的CheckStyle代码规则
原文地址:https://www.jianshu.com/p/ff1d800885ce 惯例第一步肯定是SonarQube的安装与运行配置了,但这部分不在本文主题内,网上一搜一大把,这里就不讲了,大家 ...
- SonarQube中三种类型的代码规则
https://www.cnblogs.com/guoguochong/p/9117829.html 1.概述SonarQube(sonar)是一个 开源 平台,用于 管理 源代码的 质量 . Son ...
- XHTML的规则
以正确的DOCTYPE和命名空间开始文档 使用meta内容元素声明你的字符编码 用小写字母写所有元素和属性名称 给所有属性值加引号 给所有属性赋一个值 关闭所有标签 用空格和斜杠关闭“空”标签 不要在 ...
- https,https的本地测试环境搭建,asp.net结合https的代码实现,http网站转换成https网站之后遇到的问题
一:什么是https SSL(Security Socket Layer)全称是加密套接字协议层,它位于HTTP协议层和TCP协议层之间,用于建立用户与服务器之间的加密通信,确保所传递信息的安 ...
- 【转】https,https的本地测试环境搭建,asp.net结合https的代码实现,http网站转换成https网站之后遇到的问题
正需要这个,写的很好,就转过来了 转自: http://www.cnblogs.com/naniannayue/ 一:什么是https SSL(Security Socket Layer)全称 ...
- ThinkPHP HTML标签代码和UBB互相转换
1.UBB 转为 HTML TP的扩展里面自带一个ubb方法,用这个方法就能把用户输入的ubb格式代码转换为HTML标签的代码.这里用到的基本知识就是正则表达式啦,今天先不讲正则表达式. 来看一下TP ...
随机推荐
- [转载]《STL源码剖析》阅读笔记之 迭代器及traits编程技法
本文从三方面总结迭代器 迭代器的思想 迭代器相应型别及traits思想 __type_traits思想 一 迭代器思想 迭代器的主要思想源于迭代器模式,其定义如下:提供一种方法,使之能够依 ...
- HDOJ 1422 重温世界杯 -- 动态规划
题目地址:http://acm.hdu.edu.cn/showproblem.php?pid=1422 Problem Description 世界杯结束了,意大利人连本带利的收回了法国人6年前欠他们 ...
- OpenJudge/Poj 2000 Gold Coins
1.链接地址: http://bailian.openjudge.cn/practice/2000 http://poj.org/problem?id=2000 2.题目: 总Time Limit: ...
- [翻译][MVC 5 + EF 6] 10:处理并发
原文:Handling Concurrency with the Entity Framework 6 in an ASP.NET MVC 5 Application 1.并发冲突: 当一个用户编辑一 ...
- docker+tomcat+java配置(ubuntu)
原创文章,转载请注明出处. 本文是基于ubuntu14.04搭建的dosker,tomcat配置是在docker容器外面(为了方便查看日志)使用的是docker启动挂载,该tomcat工程依赖于doc ...
- Winform TreeView控件技巧
在开发的时候经常使用treeview控件来显示组织结构啊,目录结构啊,通常会结合属性checkedboxs,来做选中,取消的操作下面是一个选中,取消的小例子,选中节点的时候,如果节点存在子节点,可以选 ...
- phpcms前端页面上传文件
PHPCMS其实有一个叫做附件的模块,上传用的就是这个东西,现在我们来看一下对应的文件:phpcms\modules\attachment \attachments.php就是这个文件,大概在29行上 ...
- VB-获取某字符在其中出现的次数
'方法1: Dim str As String " "))) '方法2: Dim n&, j& j = n = , text1.Text, "/ITEMN ...
- 【python】Windows安装Beautiful Soup
环境:win10,python 3.5,Beautiful Soup 4.1 步骤1:设定python为系统环境变量,具体设置如下图,在文本后加上";C:\Python35;C:\Pyt ...
- 机器学习实战——k-近邻算法
本章内容 ================================ (一)什么是k-近邻分类算法 (二)怎样从文件中解析和导入数据 (三)使用Matplotlib创建扩散图 (四)对数据进行归 ...