java解析XML之DOM解析和SAX解析（包含CDATA的问题）

　　Dom解析功能强大，可增删改查，操作时会将XML文档读到内存，因此适用于小文档；

　　SAX解析是从头到尾逐行逐个元素解析，修改较为不便，但适用于只读的大文档；SAX采用事件驱动的方式解析XML。如同在电影院看电影一样，从头到尾看一遍，不能回退（Dom可来来回回读取），在看电影的过程中，每遇到一个情节，都会调用大脑去接收处理这些信息。SAX也是相同的原理，每遇到一个元素节点，都会调用相应的方法来处理。在SAX的解析过程中，读取到文档开头、文档结尾，元素的开头和元素结尾都会调用相应方法，我们可以在这些方法中进行相应事件处理。

github项目地址：https://github.com/Snailclimb/XML github

Students.xml

<?xml version="1.0" encoding="utf-8"?>

<Students>

  <Student num="001">

    <name>小明</name>

    <age>20</age>

    <subject><![CDATA[数学&英语]]></subject>

    <sport>篮球</sport>

  </Student>

  <Student num="002">

    <name>小红</name>

    <age>21</age>

    <subject><![CDATA[数学&英语]]></subject>

    <sport>篮球</sport>

  </Student>

  <Student num="003">

    <name>小蓝</name>

    <age>23</age>

    <subject><![CDATA[数学&英语]]></subject>

    <sport>篮球</sport>

  </Student>

  <Student num="004">

    <name>小白</name>

    <age>19</age>

    <subject><![CDATA[数学&英语]]></subject>

    <sport>篮球</sport>

  </Student>

  <Student num="005">

    <name>小林子</name>

    <age>18</age>

    <subject><![CDATA[数学&英语]]></subject>

    <sport>篮球</sport>

  </Student>

  <Student num="006">

    <name>小东子</name>

    <age>20</age>

    <subject><![CDATA[数学&英语]]></subject>

    <sport>篮球</sport>

  </Student>

  <Student num="007">

    <name>小左子</name>

    <age>21</age>

    <subject><![CDATA[数学&英语]]></subject>

    <sport>篮球</sport>

  </Student>

  <Student num="008">

    <name>小张</name>

    <age>22</age>

    <subject><![CDATA[数学&英语]]></subject>

  </Student>

  <Student num="009">

    <name>小明</name>

    <age>23</age>

    <subject><![CDATA[数学&英语]]></subject>

    <sport>篮球</sport>

  </Student>

  <Student num="010">

    <name>小明</name>

    <age>20</age>

    <subject><![CDATA[数学&英语]]></subject>

    <sport>篮球</sport>

  </Student>

</Students>

DOM解析

package cn.yangtze.domtext;

import java.io.IOException;

import javax.xml.parsers.DocumentBuilder;

import javax.xml.parsers.DocumentBuilderFactory;

import javax.xml.parsers.ParserConfigurationException;

import org.w3c.dom.Document;

import org.w3c.dom.NamedNodeMap;

import org.w3c.dom.Node;

import org.w3c.dom.NodeList;

import org.xml.sax.SAXException;

public class DomPractice {

    public static void main(String[] args) {

        // TODO Auto-generated method stub

        // 创建一个DocumentBuilderFactory的对象

        DocumentBuilderFactory dbf = DocumentBuilderFactory.newInstance();

        // 创建一个DocumentBuilder的对象

        try {

            // 创建DocumentBuilder对象

            DocumentBuilder db = dbf.newDocumentBuilder();

            // 通过DocumentBuilder对象的parser方法加载books.xml文件到当前项目下

            Document document = db.parse("Students.xml");

            // 获取所有Student节点的集合

            NodeList StudentList = document.getElementsByTagName("Student");

            // 通过nodelist的getLength()方法可以获取StudentList的长度

            System.out.println("DOM解析开始...");

            // 遍历每一个Student节点

            for (int i = 0; i < StudentList.getLength(); i++) {

                System.out.println("开始解析第" + (i + 1) + "个学生");

                // 通过 item(i)方法 获取一个Student节点，nodelist的索引值从0开始

                Node book = StudentList.item(i);

                // 获取Student节点的所有属性集合

                NamedNodeMap attrs = book.getAttributes();

                // 遍历Student的属性

                for (int j = 0; j < attrs.getLength(); j++) {

                    // 通过item(index)方法获取Student节点的某一个属性

                    Node attr = attrs.item(j);

                    // 输出学生的属性名和属性值

                    System.out.println(attr.getNodeName() + "：" + attr.getNodeValue());

                }

                NodeList childNodes = book.getChildNodes();

                // 遍历childNodes获取每个节点的节点名和节点值

                for (int k = 0; k < childNodes.getLength(); k++) {

                    // 区分出text类型的node以及element类型的node

                    if (childNodes.item(k).getNodeType() == Node.ELEMENT_NODE) {

                        // 输出子节点的属性名和属性值

                        System.out.println(childNodes.item(k).getNodeName() + "："

                                + childNodes.item(k).getFirstChild().getNodeValue());

                    }

                }

            }

        } catch (ParserConfigurationException e) {

            e.printStackTrace();

        } catch (SAXException e) {

            e.printStackTrace();

        } catch (IOException e) {

            e.printStackTrace();

        }

        System.out.println("DOM解析结束...");

    }

}

SAX解析

SAXParserHandler.java

package cn.yangtze.saxtext;

import org.xml.sax.Attributes;

import org.xml.sax.SAXException;

import org.xml.sax.helpers.DefaultHandler;

public class SAXParserHandler extends DefaultHandler {

    private int StudentIndex = 0;

    // 解析开始的标志

    @Override

    public void startDocument() throws SAXException {

        System.out.println("SAX解析开始...");

    }

    // 解析结束的标志

    @Override

    public void endDocument() throws SAXException {

        System.out.println("SAX解析结束...");

    }

    // 用来遍历XML文件的开始标签

    @Override

    public void startElement(String uri, String localName, String qName, Attributes attributes) throws SAXException {

        // 调用DefaultHandler类的startElement方法

        super.startElement(uri, localName, qName, attributes);

        // 开始解析Student元素节点

        if (qName.equals("Student")) {

            ++StudentIndex;

            System.out.println("开始解析第" + StudentIndex + "个学生");

            //输出XML属性，也就是XML文件中的num属性，注意在因使用属性而引起的一些问题：

            /*1 ，属性无法包含多重的值（元素可以）

            2，属性无法描述树结构（元素可以）

            3，属性不易扩展（为未来的变化）

            4，属性难以阅读和维护

            5，请尽量使用元素来描述数据。而仅仅使用属性来提供与数据无关的信息。*/

            for (int i = 0; i < attributes.getLength(); ++i) {

                System.out.println(attributes.getQName(i) + "：" + attributes.getValue(i));

            }

        } else if (!qName.equals("Students")) {

            System.out.print(qName + "：");//输出元素值

        }

    }

    // 用来遍历XML文件的结束标签

    @Override

    public void endElement(String uri, String localName, String qName) throws SAXException {

        super.endElement(uri, localName, qName);

        // 判断一个学生是否解析完

        if (qName.equals("Student")) {

            System.out.println("结束解析第" + StudentIndex + "个学生");

        }

    }

    @Override

    public void characters(char[] ch, int start, int length) throws SAXException {

        super.characters(ch, start, length);

        String text = new String(ch, start, length);

        if (!text.trim().equals("")) {

            System.out.println(text);

        } // if

    }

}

SAXDemo.java

//SAX解析XML

package cn.yangtze.saxtext;

import java.io.File;

import java.io.IOException;

import javax.xml.parsers.ParserConfigurationException;

import javax.xml.parsers.SAXParser;

import javax.xml.parsers.SAXParserFactory;

import org.xml.sax.SAXException;

public class SAXDemo {

    public static void main(String[] args) {

        File file =new File("Students.xml");

        try {

            // 通过SAXParserFactory的静态方法newInstance()方法获取SAXParserFactory实例对象factory

            SAXParserFactory factory = SAXParserFactory.newInstance();

            // 通过SAXParserFactory实例的newSAXParser()方法返回SAXParser实例parser

            SAXParser saxParser = factory.newSAXParser();

            // 定义SAXParserHandler对象

            SAXParserHandler handler = new SAXParserHandler();

            // 解析XML文档

            saxParser.parse(file, handler);

        } catch (ParserConfigurationException e) {

            e.printStackTrace();

        } catch (SAXException e) {

            e.printStackTrace();

        } catch (IOException e) {

            e.printStackTrace();

        }

    }

}

java解析XML之DOM解析和SAX解析（包含CDATA的问题）的更多相关文章

JAVA解析XML之DOM方式
JAVA解析XML之DOM方式准备工作创建DocumentBuilderFactory对象; 创建DocumentBuilder对象; 通过DocumentBuilder对象的parse方法 ...
用java操作XML文件(DOM解析方式)
XML 可扩展标记语言(Extensible Markup Language),是独立于软件和硬件的传输工具. XML的作用: (1)用作配置文件 (2)简化数据共享 (3)简化数据传输 XML DO ...
JAVA解析XML文件(DOM,SAX,JDOM,DOM4j附代码实现)
1.解析XML主要有四种方式 1.DOM方式解析XML(与平台无关,JAVA提供,一次性加载XML文件内容,形成树结构,不适用于大文件) 2.SAX方式解析XML(基于事件驱动,逐条解析,适用于只处理 ...
java 解析 xml （DOM方法全）
Java 处理 XML 的三种主流技术及介绍 http://www.ibm.com/developerworks/cn/xml/dm-1208gub/ 这篇文章讲的比较详细,下面我主要介绍 dom方法 ...
解析XML：DOM,SAX,PULL
Android解析XML有三种方式:DOM(document object model).SAX(simple api XML).PULL 1.DOM DOM解析XML文件时,会将XML文件的所有内容 ...
SAX解析xml (遍历DOM树各节点)
本文参考 http://yangjunfeng.iteye.com/blog/401377 1. books.xml <?xml version="1.0" encoding ...
XML解析之sax解析案例（二）使用sax解析把 xml文档封装成对象
Demo1类: import java.io.File; import java.util.List; import javax.xml.parsers.SAXParser; import javax ...
XML解析的二种方法之Sax解析
package com.huawei.xml; import java.io.InputStream;import java.util.Stack; import javax.xml.parsers. ...
python 解析xml 文件: DOM 方式
环境 python:3.4.4 准备xml文件首先新建一个xml文件,countries.xml.内容是在python官网上看到的. <?xml version="1.0" ...

随机推荐

WPF通过NPIO读写Excel操作
自已摸索实现了对excel简单的上传和下载并做了一个封装类,下面分享一下. 先去官网:http://npoi.codeplex.com/下载需要引入dll(可以选择.net2.0或者.net4.0的d ...
WPF比较两个随机数大小写，利用MVVM思想实现
MVVM模式是把表现层和业务层完全分离,所以这里就使用MVVM制作一个极其简单的WPF的例子: 先看看最终图:
第一篇：python基础_1
本篇内容 Python介绍安装第一个程序(hello,world) 变量用户输入(input) 数据类型数据运算 if判断 break和continue的区别 while 循环一. Pyth ...
openstack之Glance介绍
什么是Glance glance即image service(镜像服务),是为虚拟机的创建提供镜像服务为什么要有Glance 我们基于openstack是构建基本的Iaas平台对外提供虚机,而虚机在 ...
Python虚拟环境virtualenv的使用
virtualenv 是一个创建孤立的Python环境的工具.可以让你创建各自独立的.互不影响的Python开发环境. 使用pip安装即可 pip install virtualenv 查看是否安装成 ...
（二）Redis字符串String操作
String全部命令如下: set key value # 设置一个key的value值 get key # 获取key的value值 mset key1 value1 key2 value2 ... ...
【题解】SDOI2009Bill的挑战
这题好像状压的做法比较的无脑?但想记录一下容斥的做法,感觉自己对于容斥简直一无所知.这道题目容斥的解法我也是看了题解才会的.如有雷同,是我看的(*/ω＼*)我们可以首先枚举当前字符串与给定的哪 \(k ...
BZOJ5334：[TJOI2018]数学计算——题解
https://www.lydsy.com/JudgeOnline/problem.php?id=5334 小豆现在有一个数x,初始值为1. 小豆有Q次操作,操作有两种类型: 1 m: x = x ...
[bzoj] 1040 骑士 || 基环外向树dp
原题给出n个点n条边和每个点的点权,一条边的两个断点不能同时选择,问最大可以选多少. //图是一张基环外向树森林是不是很像舞会啊- 就是多了一条边. 所以我们考虑一下对于一棵基环外向树,拆掉一条在 ...
JS传递中文参数出现乱码的解决办法
一.window.open() 乱码: JS中使用window.open("url?param="+paramvalue)传递参数出现乱码,提交的时候,客户端浏览器URL中显示参数 ...

java解析XML之DOM解析和SAX解析（包含CDATA的问题）

java解析XML之DOM解析和SAX解析（包含CDATA的问题）的更多相关文章

随机推荐

热门专题