java解析XML之DOM解析和SAX解析(包含CDATA的问题)
Dom解析功能强大,可增删改查,操作时会将XML文档读到内存,因此适用于小文档;
SAX解析是从头到尾逐行逐个元素解析,修改较为不便,但适用于只读的大文档;SAX采用事件驱动的方式解析XML。如同在电影院看电影一样,从头到尾看一遍,不能回退(Dom可来来回回读取),在看电影的过程中,每遇到一个情节,都会调用大脑去接收处理这些信息。SAX也是相同的原理,每遇到一个元素节点,都会调用相应的方法来处理。在SAX的解析过程中,读取到文档开头、文档结尾,元素的开头和元素结尾都会调用相应方法,我们可以在这些方法中进行相应事件处理。
github项目地址:https://github.com/Snailclimb/XML github
Students.xml
<?xml version="1.0" encoding="utf-8"?>
<Students>
<Student num="001">
<name>小明</name>
<age>20</age>
<subject><![CDATA[数学&英语]]></subject>
<sport>篮球</sport>
</Student>
<Student num="002">
<name>小红</name>
<age>21</age>
<subject><![CDATA[数学&英语]]></subject>
<sport>篮球</sport>
</Student>
<Student num="003">
<name>小蓝</name>
<age>23</age>
<subject><![CDATA[数学&英语]]></subject>
<sport>篮球</sport>
</Student>
<Student num="004">
<name>小白</name>
<age>19</age>
<subject><![CDATA[数学&英语]]></subject>
<sport>篮球</sport>
</Student>
<Student num="005">
<name>小林子</name>
<age>18</age>
<subject><![CDATA[数学&英语]]></subject>
<sport>篮球</sport>
</Student>
<Student num="006">
<name>小东子</name>
<age>20</age>
<subject><![CDATA[数学&英语]]></subject>
<sport>篮球</sport>
</Student>
<Student num="007">
<name>小左子</name>
<age>21</age>
<subject><![CDATA[数学&英语]]></subject>
<sport>篮球</sport>
</Student>
<Student num="008">
<name>小张</name>
<age>22</age>
<subject><![CDATA[数学&英语]]></subject>
</Student>
<Student num="009">
<name>小明</name>
<age>23</age>
<subject><![CDATA[数学&英语]]></subject>
<sport>篮球</sport>
</Student>
<Student num="010">
<name>小明</name>
<age>20</age>
<subject><![CDATA[数学&英语]]></subject>
<sport>篮球</sport>
</Student>
</Students>
DOM解析
package cn.yangtze.domtext;
import java.io.IOException;
import javax.xml.parsers.DocumentBuilder;
import javax.xml.parsers.DocumentBuilderFactory;
import javax.xml.parsers.ParserConfigurationException;
import org.w3c.dom.Document;
import org.w3c.dom.NamedNodeMap;
import org.w3c.dom.Node;
import org.w3c.dom.NodeList;
import org.xml.sax.SAXException;
public class DomPractice {
public static void main(String[] args) {
// TODO Auto-generated method stub
// 创建一个DocumentBuilderFactory的对象
DocumentBuilderFactory dbf = DocumentBuilderFactory.newInstance();
// 创建一个DocumentBuilder的对象
try {
// 创建DocumentBuilder对象
DocumentBuilder db = dbf.newDocumentBuilder();
// 通过DocumentBuilder对象的parser方法加载books.xml文件到当前项目下
Document document = db.parse("Students.xml");
// 获取所有Student节点的集合
NodeList StudentList = document.getElementsByTagName("Student");
// 通过nodelist的getLength()方法可以获取StudentList的长度
System.out.println("DOM解析开始...");
// 遍历每一个Student节点
for (int i = 0; i < StudentList.getLength(); i++) {
System.out.println("开始解析第" + (i + 1) + "个学生");
// 通过 item(i)方法 获取一个Student节点,nodelist的索引值从0开始
Node book = StudentList.item(i);
// 获取Student节点的所有属性集合
NamedNodeMap attrs = book.getAttributes();
// 遍历Student的属性
for (int j = 0; j < attrs.getLength(); j++) {
// 通过item(index)方法获取Student节点的某一个属性
Node attr = attrs.item(j);
// 输出学生的属性名和属性值
System.out.println(attr.getNodeName() + ":" + attr.getNodeValue());
}
NodeList childNodes = book.getChildNodes();
// 遍历childNodes获取每个节点的节点名和节点值
for (int k = 0; k < childNodes.getLength(); k++) {
// 区分出text类型的node以及element类型的node
if (childNodes.item(k).getNodeType() == Node.ELEMENT_NODE) {
// 输出子节点的属性名和属性值
System.out.println(childNodes.item(k).getNodeName() + ":"
+ childNodes.item(k).getFirstChild().getNodeValue());
}
}
}
} catch (ParserConfigurationException e) {
e.printStackTrace();
} catch (SAXException e) {
e.printStackTrace();
} catch (IOException e) {
e.printStackTrace();
}
System.out.println("DOM解析结束...");
}
}
SAX解析
SAXParserHandler.java
package cn.yangtze.saxtext;
import org.xml.sax.Attributes;
import org.xml.sax.SAXException;
import org.xml.sax.helpers.DefaultHandler;
public class SAXParserHandler extends DefaultHandler {
private int StudentIndex = 0;
// 解析开始的标志
@Override
public void startDocument() throws SAXException {
System.out.println("SAX解析开始...");
}
// 解析结束的标志
@Override
public void endDocument() throws SAXException {
System.out.println("SAX解析结束...");
}
// 用来遍历XML文件的开始标签
@Override
public void startElement(String uri, String localName, String qName, Attributes attributes) throws SAXException {
// 调用DefaultHandler类的startElement方法
super.startElement(uri, localName, qName, attributes);
// 开始解析Student元素节点
if (qName.equals("Student")) {
++StudentIndex;
System.out.println("开始解析第" + StudentIndex + "个学生");
//输出XML属性,也就是XML文件中的num属性,注意在因使用属性而引起的一些问题:
/*1 ,属性无法包含多重的值(元素可以)
2,属性无法描述树结构(元素可以)
3,属性不易扩展(为未来的变化)
4,属性难以阅读和维护
5,请尽量使用元素来描述数据。而仅仅使用属性来提供与数据无关的信息。*/
for (int i = 0; i < attributes.getLength(); ++i) {
System.out.println(attributes.getQName(i) + ":" + attributes.getValue(i));
}
} else if (!qName.equals("Students")) {
System.out.print(qName + ":");//输出元素值
}
}
// 用来遍历XML文件的结束标签
@Override
public void endElement(String uri, String localName, String qName) throws SAXException {
super.endElement(uri, localName, qName);
// 判断一个学生是否解析完
if (qName.equals("Student")) {
System.out.println("结束解析第" + StudentIndex + "个学生");
}
}
@Override
public void characters(char[] ch, int start, int length) throws SAXException {
super.characters(ch, start, length);
String text = new String(ch, start, length);
if (!text.trim().equals("")) {
System.out.println(text);
} // if
}
}
SAXDemo.java
//SAX解析XML
package cn.yangtze.saxtext;
import java.io.File;
import java.io.IOException;
import javax.xml.parsers.ParserConfigurationException;
import javax.xml.parsers.SAXParser;
import javax.xml.parsers.SAXParserFactory;
import org.xml.sax.SAXException;
public class SAXDemo {
public static void main(String[] args) {
File file =new File("Students.xml");
try {
// 通过SAXParserFactory的静态方法newInstance()方法获取SAXParserFactory实例对象factory
SAXParserFactory factory = SAXParserFactory.newInstance();
// 通过SAXParserFactory实例的newSAXParser()方法返回SAXParser实例parser
SAXParser saxParser = factory.newSAXParser();
// 定义SAXParserHandler对象
SAXParserHandler handler = new SAXParserHandler();
// 解析XML文档
saxParser.parse(file, handler);
} catch (ParserConfigurationException e) {
e.printStackTrace();
} catch (SAXException e) {
e.printStackTrace();
} catch (IOException e) {
e.printStackTrace();
}
}
}
java解析XML之DOM解析和SAX解析(包含CDATA的问题)的更多相关文章
- JAVA解析XML之DOM方式
JAVA解析XML之DOM方式 准备工作 创建DocumentBuilderFactory对象; 创建DocumentBuilder对象; 通过DocumentBuilder对象的parse方法 ...
- 用java操作XML文件(DOM解析方式)
XML 可扩展标记语言(Extensible Markup Language),是独立于软件和硬件的传输工具. XML的作用: (1)用作配置文件 (2)简化数据共享 (3)简化数据传输 XML DO ...
- JAVA解析XML文件(DOM,SAX,JDOM,DOM4j附代码实现)
1.解析XML主要有四种方式 1.DOM方式解析XML(与平台无关,JAVA提供,一次性加载XML文件内容,形成树结构,不适用于大文件) 2.SAX方式解析XML(基于事件驱动,逐条解析,适用于只处理 ...
- java 解析 xml (DOM方法全)
Java 处理 XML 的三种主流技术及介绍 http://www.ibm.com/developerworks/cn/xml/dm-1208gub/ 这篇文章讲的比较详细,下面我主要介绍 dom方法 ...
- 解析XML:DOM,SAX,PULL
Android解析XML有三种方式:DOM(document object model).SAX(simple api XML).PULL 1.DOM DOM解析XML文件时,会将XML文件的所有内容 ...
- SAX解析xml (遍历DOM树各节点)
本文参考 http://yangjunfeng.iteye.com/blog/401377 1. books.xml <?xml version="1.0" encoding ...
- XML解析之sax解析案例(二)使用sax解析把 xml文档封装成对象
Demo1类: import java.io.File; import java.util.List; import javax.xml.parsers.SAXParser; import javax ...
- XML解析的二种方法之Sax解析
package com.huawei.xml; import java.io.InputStream;import java.util.Stack; import javax.xml.parsers. ...
- python 解析xml 文件: DOM 方式
环境 python:3.4.4 准备xml文件 首先新建一个xml文件,countries.xml.内容是在python官网上看到的. <?xml version="1.0" ...
随机推荐
- 用php实现一个双向队列 如何实现?
PHP面试题作业 class DuiLie { private $array = array();//声明空数组 public function setFirst($item){ return arr ...
- Linux下安装MySQL管理工具MySQL Administrator和MySQL Query Browser(转载)
文章来源:http://blog.csdn.net/sunrier/article/details/7572299 Linux下MySQL Administrator和MySQL Query Brow ...
- [计算机网络-应用层] HTTP协议
1.HTTP概况 Web的应用层协议是超文本传输协议(HTTP),它是Web的核心. HTTP由两部分程序实现:一个客户机程序和一个服务器程序,它们运行在不同的端系统中,通过交换HTTP报文进行对话. ...
- C++基础知识(二)
八. 继承:让某个类的对象获得另一个类的对象的特性.通过继承可实现代码重用,即从已存在的类派生出的一个新类将自动具有原来那个类的特性. 类的继承还具有:(1)单向性:A类为B类的基类(父类),则派生类 ...
- P2587 [ZJOI2008]泡泡堂
题目描述 第XXXX届NOI期间,为了加强各省选手之间的交流,组委会决定组织一场省际电子竞技大赛,每一个省的代表队由n名选手组成,比赛的项目是老少咸宜的网络游戏泡泡堂.每一场比赛前,对阵双方的教练向组 ...
- P1135 奇怪的电梯
题目描述 呵呵,有一天我做了一个梦,梦见了一种很奇怪的电梯.大楼的每一层楼都可以停电梯,而且第i层楼(1<=i<=N)上有一个数字Ki(0<=Ki<=N).电梯只有四个按钮:开 ...
- Python文件传输模块ftplib
ftplib是基于FTP协议实现的一个Python模块 from ftplib import FTP # 创建一个FTP连接对象 ftp = FTP() #[ 当带有参数时,即:ftp = FTP(h ...
- [学习笔记]min-max容斥
[Learning]min-max容斥以及推广 min-max容斥 就是max(a,b)=min(a)+min(b)-min(a,b) max(a,b,c)=a+b+c-min(a,b)-min(a, ...
- 【队列】【P2827】【NOIP2016D2T3】蚯蚓
传送门 Description 本题中,我们将用符号 $\lfloor c \rfloor$ 表示对 $c$ 向下取整,例如:$\lfloor 3.0 \rfloor = \lfloor 3.1 \r ...
- oracle数据库数据导入导出步骤(入门)
oracle数据库数据导入导出步骤(入门) 说明: 1.数据库数据导入导出方法有多种,可以通过exp/imp命令导入导出,也可以用第三方工具导出,如:PLSQL 2.如果熟悉命令,建议用exp/imp ...