ch2 XML

有两种XML文档结构,DTD和Schema,用解释文档构成规则,这些规则指定了每个元素俺的合法子元素和属性。

DTD

DTD有多种提供方式,可以像下面这样加到XML中:

<?xml version="1.0"?>

<!DOCTYPE configuration [    //文档类型必须匹配根元素的名字

  <!ELEMENT configuration ...>

  more rules

  ...

]>

<configuration>    //根元素

  ...

</configuration>

当然,直接在XML中提供DTD不常用,更常用的方式是DTD放在外面。用SYSTEM声明。

<!DOCTYPE configuration SYSTEM "config.dtd"> //相对于当前XML文档的路径,因为是相对路径,解析器要能够定位,要么是File或Url对象,要么是InputStream加实体解析器来定位。

<!DOCTYPE configuration SYSTEM "http://myserver.com/config.dtd">

还有一种所谓的“总所周知”的DTD机制:

<!DOCTYPE web-app

  public "-//Sun Microsystems, Inc.//DTD Web Application 2.2//EN"   //publicId

  "http://java.sun.com/j2ee/dtds/web-app_2_2.dtd">  //systemId

如果解析器能定位public,就不需要http那段了

然后书中给了一段代码和一句洋文翻译过来的话,“如果你使用的是DOM解析器,并且想要支持PUBLIC标识符,请调用DocumentBuilder类的setEntityResolver方法来安装EntityResolver接口的某个实现类的一个对象”。

啥叫支持public标识符?难道是上面的public "-//Sun ...?看样子是的。

class MyEntityResolver implements EntityResolver{  //EntityResolver的实现类

  public InputSource resolveEntity(String publicID, String systemID){

    if(publicID.equals(a known ID)){

      return new InputSource(DTD data);  //这里就是支持public标识符的设置了吧,简单的说就是解析器能够通过public标识符来定位其指定的DTD文档  

    }else{

      return null;

    }

  }

}

真TM绕口,直接看下JDK DocumentBuilder的方法说明:

  setEntityResolver(EntityResolver er) //EntityResolver接口的某个实现类的一个对象

Specify the EntityResolver to be used to resolve entities present in the XML document to be parsed.

明白了。

然后我们就知道,DTD是通过上面这些方式来定位了。

好了,接下来说说具体的。ELEMENT规则用于指定某个元素有什么样的子元素,可以是正则表达式。

<!ELEMENT menu (item)*>   //menu元素包含0或多个item元素

<!ELEMENT font (name,size)>

<!ELEMENT name (#PCDATA)>

<!ELEMENT size (#PCDATA)>

<!ELEMENT chapter (intro, (heading, (para|image|table|note)+)+) //元素嵌套

包含被解析文本#PCDATA的规则有两种,只包含文本、文办加标签:

<!ELEMENT para (#PADATA)>

<!ELEMENT para (#PADATA|em|strong|code)*>

非法的例子:

<!ELEMENT para (image,#PCDATA)>

------------------------------------------------------

描述元素属性的语法规则:

<!ATTLIST element attribute type default>

典型例子:

<!ATTLIST font style (plain|bold|italic|bold-italic) "plain">   //style属性,有4个值,默认为plain

<!ATTLIST size unit CDATA #IMPLIED>  //这里的CDATA与前面XML中的<![CDATA[...]>是没关系的,这里指任意字符串

DTD实体的定义与引用:

<!ENITY back.label "Back">

<menumitem label="&back.label;"/>

DTD介绍完毕。

用法:

factory.setValidating(true);   //启用DTD验证

factory.setIgnoringElementWhitespace(true);  //去掉空格验证

Java核心技术II读书笔记(二)的更多相关文章

  1. Java核心技术II读书笔记(三)

    ch2 XML SAX解析器 SAXParserFactory factory = SAXParserFactory.newInstance(); SAXParser parser = factory ...

  2. Java核心技术II读书笔记(一)

    Char2 XML 解析器:读入一个文件,确认其具有正确的格式,然后将其分解成各种元素,使程序员能够访问这些元素. java库提供了两种XML解析器:DOM和SAX,即文档对象模型和流机制解析器. D ...

  3. 深入理解Java虚拟机之读书笔记二 垃圾收集器

    1.对象已死? a.引用计数算法:缺点是它很难解决对象之间的相互循环引用的问题,Java语言中没有选用它. b.根搜索算法(GC Roots Tracing):通过一系列的名为"GC Roo ...

  4. 《Java核心技术》 -- 读书笔记 ② - 类 | 对象 | 接口

    对象vs对象变量 “对象” 描述的是一个类的具体实例,他被java虚拟机分配在 "堆" (Heap)中. “对象变量” 为一个对象的引用(对象变量的值=记载着具体对象的位置/地址) ...

  5. Java常用类库 读书笔记 二

    1.Date类 常用操作方法: public Date ()                         构造方法,实例化Date类对象 public Data(long Date)       ...

  6. 《Java核心技术》 -- 读书笔记 ① - 预热

    引言 之前通过网上的实例自己使用了Java的一些技术及轮子快速的的“烂“造了一些小应用,但是毕竟没有认真地了解和认知Java,遂打算花一个月左右的时间来细细品味一下... 从头开始,慢慢深入!! Ja ...

  7. Java逍遥游记读书笔记<二>

    Abstract抽象类 1.抽象类不能被实例化 2.抽象方法没有方法体 如: public abstract class Weapen { public abstract void attack(); ...

  8. 《深入理解java虚拟机》读书笔记二——第三章

    第三章 垃圾收集器与内存分配策略 1.判断对象是否已死 引用计数法: 给对象添加一个引用计数器,每当有一个地方引用它时,计数器值就加1,每当引用失效时,计数器值就减1. 任何时刻计数器为0的对象就是不 ...

  9. 《深入理解Java虚拟机》读书笔记二

    第三章 垃圾收集器与内存分配策略 1.判断对象是否已死 引用计数法: 给对象添加一个引用计数器,每当有一个地方引用它时,计数器值就加1,每当引用失效时,计数器值就减1. 任何时刻计数器为0的对象就是不 ...

随机推荐

  1. ExtJs之工具栏及菜单栏

    先培养一下大概的感觉吧. 基本按书上都弄出来了. <!DOCTYPE html> <html> <head> <title>ExtJs</titl ...

  2. (转)两分钟彻底让你明白Android Activity生命周期(图文)!

    转自: http://blog.csdn.net/android_tutor/article/details/5772285 大家好,今天给大家详解一下Android中Activity的生命周期,我在 ...

  3. Struts2 直接返回字符串(可用于json)

    struts2可以在method中直接返回一个字符串而不是视图.让Action中的返回字符串的方法,直接return null;并在return之前用输出流输出字符串就可以了,跟servlet输出HT ...

  4. QTP 参数化

    PS:方法内容是转的别人的,我们项目中只用到了方法三,主要用于将测试数据与业务分离,增强测试数据的可维护性. 方法一.DataTable方法 这是QTP提供的一种方法,也是最容易实现参数化的一种方式. ...

  5. mq_send

    NAME mq_send - 将消息发送到消息队列 (REALTIME) SYNOPSIS #include <mqueue.h>int mq_send(mqd_t mqdes, cons ...

  6. IIS7 ASP.NET 未被授权访问所请求的资源

    IIS7 ASP.NET 未被授权访问所请求的资源 ASP.NET 未被授权访问所请求的资源.请考虑授予 ASP.NET 请求标识访问此资源的权限. ASP.NET 有一个在应用程序没有模拟时使用的基 ...

  7. Geoprocessor 使用

    在AO中使用Geoprocessor(ESRI.ArcGIS.Geoprocessor) 1.观察arcmap中的使用方法,明确各参数意义. 2.arctoolbox中参数对应为features/fe ...

  8. Linux系统文件权限&目录权限

    linux系统一切都是文件,文件和目录的所属与权限--来分别规定所有者.所有组.其余人的读.写.执行权限. 读(read),写(write),执行(excute)简写为(r.w.x),也可以以用(4. ...

  9. 机器学习 —— 概率图模型(Homework: CRF Learning)

    概率图模型的作业越往后变得越来越有趣了.当然,难度也是指数级别的上涨啊,以至于我用了两个周末才完成秋名山神秘车牌的寻找,啊不,CRF模型的训练. 条件随机场是一种强大的PGM,其可以对各种特征进行建模 ...

  10. 【转】Java中==、equals、hashcode的区别与重写equals以及hashcode方法实例

    原文地址:http://www.cnblogs.com/luankun0214/p/4421770.html 感谢网友的分享,记录下来只为学习. 1.重写equals方法实例   部分代码参考http ...