DOM&SAX解析XML

　　在上一篇随笔中分析了xml以及它的两种验证方式。我们有了xml，但是里面的内容要怎么才能得到呢？如果得不到的话，那么还是没用的，解析xml的方式主要有DOM跟SAX，其中DOM是W3C官方的解析方式，而SAX是民间（非官方）的，两种解析方式是很不一样的。下面通过例子来分析两种解析方式的区别。

下面是要解析的xml文档

 <?xml version="1.0" encoding="utf-8"?>

 <学生名册>

 <!--http://www.cnblogs.com/zhi-hao/-->

     <学生 学号="A1">

         <姓名>CIACs</姓名>

         <性别>男</性别>

         <年龄>22</年龄>

     </学生>

     <学生 学号="A2">

         <姓名>zhihao</姓名>

         <性别>男</性别>

         <年龄>23</年龄>

     </学生>

 </学生名册>

DOM（Document Object Model）文档对象模式，从名字上就可以知道，DOM应该是基于文档对象来解析的。在DOM解析方式中主要用到了以下四个接口

1、Document接口，该接口是对xml文档进行操作的入口，要想操作xml，必须获得文档的入口。

2、Node接口，存储xml文档的节点的

3、NodeList接口

4、NameNodeMap接口，存储的是xml中的属性。

DOM中的基本对象有Document,Node,NodeList,Element和Attr。有了这些就可以解析xml了

 package xmlTest;

 import java.io.File;

 import javax.xml.parsers.DocumentBuilder;

 import javax.xml.parsers.DocumentBuilderFactory;

 import org.w3c.dom.Attr;

 import org.w3c.dom.Document;

 import org.w3c.dom.Element;

 import org.w3c.dom.NamedNodeMap;

 import org.w3c.dom.Node;

 import org.w3c.dom.NodeList;

 /**

  *

  * @author CIACs

  * 2014-09-22

  */

 public class DOM {

     public static void main(String[] args) throws Exception {

         //获得解析工厂实例

         DocumentBuilderFactory dbf = DocumentBuilderFactory.newInstance();

         //通过工厂获得DocumentBulider

         DocumentBuilder db = dbf.newDocumentBuilder();

         //获得文档对象的入口

         Document doc = db.parse(new File("student.xml"));

         //获得根元素

         Element root = doc.getDocumentElement();

         //开始解析

         parseElement(root);

     }

     private static void parseElement(Element element)

     {

         String tagName = element.getNodeName();

         System.out.print("<"+tagName);

         //获得元素属性

         NamedNodeMap map = element.getAttributes();

         if(null != map)

         {

             for(int i = 0;i < map.getLength();i++)

             {

                 Attr attr = (Attr)map.item(i);

                 String attrName = attr.getName();

                 String attrValue = attr.getValue();

                 System.out.print(" "+attrName + "=\""+attrValue+"\"");

             }

         }

         System.out.print(">");

         //获得元素的孩子节点

         NodeList child = element.getChildNodes();

         for(int i = 0;i < child.getLength();i++)

         {

             Node node = child.item(i);

             //判断节点类型

             short nodeType = node.getNodeType();

             if(nodeType == Node.ELEMENT_NODE)

             {

                 parseElement((Element)node);

             }

             else

                 if(nodeType == Node.TEXT_NODE)

                 {

                     System.out.print(node.getTextContent());

                 }

                 else

                     if(nodeType == Node.COMMENT_NODE)

                     {

                         System.out.print("<!--"+node.getTextContent()+"-->");

                     }

         }

         System.out.print("</"+tagName+">");

     }

 }

DOM

输出结果：

当然你可以直接输出内容，不用控制格式。

SAX(Simple APIs for XML)面向xml的简单APIs。SAX解析xml的一般步骤如下

1、创建SAXParserFactory对象； SAXParserFactory spf = SAXParserFactory.newInstance();

2、使用上面创建的工厂对象创建SAXParser解析对象；SAXParser sp = spf.newSAXParser();

3、创建SAXHandler处理器，而这个SAXHandler类要继承DefaultHandler，自己重新编写其中的方法，主要有 public void startElement(String uri, String localName, String qName,Attributes attributes) throws SAXException{ } 这个方法是在读取xml数据的节点元素开始时触发，需要实现这个方法进行标记元素的名字的操作； public void characters(char[] ch, int start, int length）throws SAXException{ } 这个方法可以处理节点之间的数据； public void endElement(String uri, String ocalName, String qName)throws SAXException { } 这个方法在处理节点元素终止时触发，可添加代码来将节点数据进行存储。

下面是解析xml的代码

 package xmlTest;

 import java.io.File;

 import javax.xml.parsers.SAXParser;

 import javax.xml.parsers.SAXParserFactory;

 import org.xml.sax.Attributes;

 import org.xml.sax.SAXException;

 import org.xml.sax.helpers.DefaultHandler;

 /**

  *

  * @author CIACs

  * 2014-09-22

  */

 public class Sax {

     public static void main(String []args)

     {

         try

         {

             //获得sax解析工厂实例

             SAXParserFactory spf = SAXParserFactory.newInstance();

             //获得sax解析器

             SAXParser sp = spf.newSAXParser();

             //获得SAXHandler,该类是继承自DefaultHandler的

             SAXHandler handler = new SAXHandler();

             //开始解析xml文档

             sp.parse(new File("student.xml"), handler);

         }

         catch(Exception e)

         {

             e.printStackTrace();

         }

     }

 }

 class SAXHandler extends DefaultHandler

 {

      private String currentElement;

      private String currentValue;

      private String attrName;

      private String attrValue;

     @Override

     public void startElement(String uri, String localName, String qName,

             Attributes attributes) throws SAXException {

         currentElement = qName;

         for(int i = 0;i < attributes.getLength();i++)

         {

             attrName = attributes.getQName(i);

             attrValue = attributes.getValue(i);

             System.out.println("属性: "+ attrName + "=" + attrValue);

         }

     }

      @Override

     public void characters(char[] ch, int start, int length)

             throws SAXException {

         currentValue = new String(ch,start,length);

     }

      @Override

     public void endElement(String uri, String localName, String qName)

             throws SAXException {

          if(currentElement.equals(qName))

          {

              System.out.println(currentElement + "=" + currentValue);

          }

     }

 }

Sax

输出结果：

这里我也是直接输出xml的内容，并没有写到硬盘，在实际应用时你可以把内容存在Map中。

总结：

　　通过上面的两个解析实例，我们可以看出DOM解析XML时，首先将xml文档整个加载到内存中，然后就可以随机访问内存中的文档对象树（dom解析器是把xml解析成树形结构的）。SAX是基于事件的而且是顺序的，就是读到某个标签时就会调用相应的方法，一旦经过了某个元素之后，我们就没办法再去访问了。DOM由于要把整个xml加载到内存中，所以当xml很大时，内存就可能会溢出，而SAX不用事先把xml文档加载到内存中，占用内存小，相对而言SAX是面向xml的简单APIs，在开发上比较复杂，要开发者去实现事件处理器，但会更灵活，而DOM会更易于理解和开发。对于大型的xml文档，我们通常会使用SAX的方式去解析。

DOM&SAX解析XML的更多相关文章

Dom,pull,Sax解析XML
本篇随笔将详细讲解如何在Android当中解析服务器端传过来的XML数据,这里将会介绍解析xml数据格式的三种方式,分别是DOM.SAX以及PULL. 一.DOM解析XML 我们首先来看看DOM(Do ...
Android之SAX解析XML
一．SAX解析方法介绍 SAX(Simple API for XML)是一个解析速度快并且占用内存少的XML解析器,非常适合用于Android等移动设备. SAX解析器是一种基于事件的解析器,事件驱动 ...
JAVA使用SAX解析XML文件
在我的另一篇文章(http://www.cnblogs.com/anivia/p/5849712.html)中,通过一个例子介绍了使用DOM来解析XML文件,那么本篇文章通过相同的XML文件介绍如何使 ...
SAX解析xml浅析
SAX解析XML文件采用事件驱动的方式进行,也就是说,SAX是逐行扫描文件,遇到符合条件的设定条件后就会触发特定的事件,回调你写好的事件处理程序.使用SAX的优势在于其解析速度较快,占用内存较少(相对 ...
JavaWeb学习日记----SAX解析XML
1.SAX解析XML文档的方式: 与DOM方式解析不同,DOM方式解析是根据XML的层级结构在内存中分配一个树形结构,把xml的标签,属性和文本都封装成对象.优点是可以很方便实现增删改操作.缺点是,如 ...
用DOM方式解析XML
一.用DOM方式解析XML 此例子节点结构如下: 1.获取book节点属性 (1).如果不知道节点的属性,通过 NamedNodeMap attrs = book.getAttributes(); 来 ...
Python：使用基于事件驱动的SAX解析XML
SAX的特点: 是基于事件的 API 在一个比 DOM 低的级别上操作为您提供比 DOM 更多的控制几乎总是比 DOM 更有效率但不幸的是,需要比 DOM 更多的工作基于对象和基于事件的接口 ...
python 之模块之 xml.dom.minidom解析xml
# -*- coding: cp936 -*- #python 27 #xiaodeng #python 之模块之 xml.dom.minidom解析xml #http://www.cnblogs.c ...
安卓SAX解析XML文件
XML文件经常使用的解析方式有DOM解析,SAX解析. 一.Sax SAX(simpleAPIforXML)是一种XML解析的替代方法. 相比于DOM.SAX是一种速度更快,更有效的方法. 它逐行扫描 ...

随机推荐

attribute section的用法
1. gcc的__attribute__编译属性要了解Linux Kernel代码的分段信息,需要了解一下gcc的__attribute__的编绎属性,__attribute__主要用于改变所声明或 ...
使用二维NDRange workgroup
作为初学者一直,经过多次的上网搜索你一定会看到迈克老狼的向量加法的示例,不知道你是否和我一样,刚开始并不是很准确的知道他的add.cl写的代码的意思,源码如下: #pragma OPENCL EXTE ...
Ruby on Rails Session 2: How to install Aptana Studio 3 on Ubuntu 12.04 LTS
Update: An updated version of these instructions for Ubuntu 12.10 (Quantal Quetzal) is available her ...
Node调试工具JSHint
Node调试工具JSHint的安装及配置教程作者: 字体:[增加减小] 类型:转载时间:2014-05-27我要评论 Node的优势我就不再乱吹捧了,它让javascript统一web的前后台成 ...
[转]3proxy 二级代理配置样例
转自:http://www.cnblogs.com/airsong23/p/3893094.html 适应情况: 有时,我们的机器HOST-A只能通过代理服务器HOST-B才可以访问internet, ...
Jakarta-Commons- BeanUtils学习笔记：
http://www.cnblogs.com/zhangyi85/archive/2009/04/22/1441341.html 1.什么是BeanUtils: BeanUtils主要提供了对于Jav ...
CVPR2013-reading list
Detection Evolution with Multi-order Contextual Co-occurrence. How to build high-level features for ...
android 双卡手机发短信/判断手机是否为双卡
通过反射发现sendMultipartTextMessage多了一个phoneType的参数,这个参数就是这只用GMS还是CDMA卡发送的. phoneType获取方法,iTelephony.getA ...
android 75 新闻列表页面
new.xml <?xml version="1.0" encoding="UTF-8" ?> <newslist> <news& ...
IT行业智力测试
1.有10筐苹果,其中有1筐是次品,正品苹果每个10两,次品苹果每个9两,现有一称,问怎么一次称出次品是哪筐? 2.有甲.乙.丙.丁四个人,要在夜里过一座桥.他们通过这座桥分别需要耗时1.2.5.10 ...

DOM&SAX解析XML

DOM&SAX解析XML的更多相关文章

随机推荐

热门专题