【学习笔记】关于DOM4J：使用DOM4J解析XML文档

一、概述

DOM4J是一个易用的、开源的库，用于XML、XPath和XSLT中。采用了Java集合框架并完全支持DOM、SAX、和JAXP。

DOM4J最大的特色是使用大量的接口，主要接口都在org.dom4j这个包里定义：

二、DOM4J的接口

Attribute:定义了XML的属性；

Branch：是能够包含子节点的节点，如XML元素（Element）和文档（Documents）定义了一个公共的行为；

CDATA：定义了XML的CDATA区域；

CharacterData：是一个标识接口，标致基于字符的节点：（CDATA、Comment、Text）；

Comment：定义了XML注释的行为；

Document：定义了XML文档；

DocumentType：定义了XML的DOCTYPE声明；

Element：定义了XML文档；

ElementHandler:定义了Element对象的处理器；

ElementPath：被ElementHandler使用，用于取得当前正在处理的路径层次信息；

Entity：定义XML的entity；

Node：为所有的DOM4J中XML节点定义了多态行为；

NodeFilter：定义了在DOM4J节点中产生的一个滤镜或谓词的行为（predicate）；

ProcessingInstruction：定义XML处理指令；

Text：定义XML文本节点；

Visitor：用于实现Visitor模式；

XPath：在分析一个字符串后会提供一个XPath表达式。

三、使用DOM4J操作XML数据

1.Document对象相关

读取XML文件，获得document对象。

SAXReader reader = new SAXReader();

Document document = reader.read(new File("input.xml"));

2.节点相关

获取文档的根元素

Element rootElm = document.getRootElement();

取得某节点的单个子节点

Element memberElm = root.element("member");//"member"是节点名

取得节点的文字

String text = memberElm.getText();

String text = root.elementText("name");//取得根元素下的name子节点的文字

取得某节点下名为“member”的所有子节点并进行遍历

List nodes = rootElm.elements("member");

for(Iterator it=nodes.iterator;it.hasNext();){

　　Element elm = (Element)it.next();

}

对某节点下的所有子节点进行遍历

for(Iterator it = root.elementIterator();it.hasNext();){

　　Element element = (Element) it.next();

}

在某节点下添加子节点

Element ageElm = newMemberElm.addElement("age");

设置节点文字

ageElm.setText("29");

删除某节点

parentElm.remove(childElm);//childElm是待删除的节点，parentElm是其父节点

3.相关属性

取得某节点下的属性

Element root = document.getRootElement();

Attribute attribute = root.attribute("size");//属性名name

取得属性的文字

String text = attribute.getText();

String text = root.element("name").attributeValue("firstname");

遍历某节点的所有属性

Element root = document.getRootElement();

for(Iterator it = root.attributeIterator();it.hasNext();{

　　Attribute attribute = (Attribute)it.next();

　　String text = attribute.getText();

　　System.out.println(text);

}

设置某节点的属性和文字

newMemberElm.addAttribute("name","sitinspring");

设置属性的文字

Attribute attribute = root.attribute("name");

attribute.setText("sitinspring");

删除某属性

Attribute attribute = root.attribute("size");

root.remove(attribute);

4.将文档写入XML文件

（1）文档中全为英文，不设置编码格式，直接写入

XMLWriter writer = new XMLWriter(new FileWriter("output.xml");

writer.write(document);

writer.close();

（2）文档中含有中文，设置编码格式在写入

OutputFormat format = OutputFormat.createPrettyPrint();

format.setEncoding("GBK");

XMLWriter writer = new XMLWriter(new FileWriter("output.xml"),format);

writer.write(document);

writer.close();

四、案例：使用DOM4J读取XML文档，步骤如下：

1.导入DOM4J的jar包

2.指定要解析的XML文件

3.把XML文件转换成Document对象

4.获取节点属性或文本的值

 import java.io.File;

 import java.util.Iterator;

 import org.dom4j.Document;

 import org.dom4j.DocumentException;

 import org.dom4j.Element;

 import org.dom4j.io.SAXReader;

 /**

  * 使用DOM4J解析XML文档

  * @author Administrator

  *

  */

 public class PhoneDom4j {

     public static void main(String[] args) {

         Document phone = null;

         try {

             //加载DOM树

             SAXReader saxReader = new SAXReader();

             phone = saxReader.read(new File("src/phoneInfo.xml"));

         } catch (DocumentException e) {

             e.printStackTrace();

         }

         //获取xml的根节点

         Element root = phone.getRootElement();

         //遍历所有的Brand标签

         for (Iterator<?> itBrand = root.elementIterator(); itBrand.hasNext();) {

             Element brand = (Element) itBrand.next();

             //输出标签的属性

             System.out.println("品牌："+brand.attributeValue("name"));

             //遍历Type标签

             for (Iterator<?> itType = brand.elementIterator(); itType.hasNext();) {

                 Element type = (Element) itType.next();

                 //输出标签的name属性

                 System.out.println("\t型号："+type.attributeValue("name"));

             }

         }

     }

 }

【学习笔记】关于DOM4J：使用DOM4J解析XML文档的更多相关文章

dom4j创建和解析xml文档
DOM4J解析特征: 1.JDOM的一种智能分支,它合并了许多超出基本XML文档表示的功能. 2.它使用接口和抽象基本类方法. 3.具有性能优异.灵活性好.功能强大和极端易用的特点. 4.是一个开 ...
使用dom4j解析XML文档
dom4j的包开源包,不属于JDK里面,在myeclipse中要单独导入在项目中,这里不累赘了做这个过程,很慢,因为很多方法没用过不熟悉,自己得去查帮助文档,而且还得去试,因为没有中文版,英文翻译不 ...
DOM4J解析XML文档
Tip:DOM4J解析XML文档 Dom4j是一个简单.灵活的开放源代码的库.Dom4j是由早期开发JDOM的人分离出来而后独立开发的.与JDOM不同的是,dom4j使用接口和抽象基类,虽然Dom4j ...
使用DOM4J解析XML文档，以及使用XPath提取XML文档
使用DOM4J解析XML文档需要首先下载DOM4J工具包.这是个第三方工具包在使用DOM4J解析的时候需要导入 DOM4J的JAR包下载DOM4J工具包->在MyEclipse中新建lib ...
dom4j解析xml文档全面介绍
一.dom4j介绍 dom4j是一个Java的XML API,类似于jdom,用来读写XML文件的.dom4j是一个非常非常优秀的Java XML API,具有性能优异.功能强大和极端易用使用的特点, ...
源生API解析XML文档与dom4j解析XML文档
一.XML语言 XML是一种可扩展的标记语言,是一种强类型的语言,类似HTML(超文本标记语言,是一种弱类型的语言).XML是一种通用的数据交换格式(关系型数据库),综上所诉:XML可以传输数据,也可 ...
Java高级特性第15节解析XML文档(3) - JDOM和DOM4J技术
一.JDOM解析特征: 1.仅使用具体类,而不使用接口. 2.API大量使用了Collections类. Jdom由6个包构成: Element类表示XML文档的元素 org.jdom: 解析xml ...
javaweb dom4j解析xml文档
1.什么是dom4j dom4j是一个Java的XML API,是jdom的升级品,用来读写XML文件的.dom4j是一个十分优秀的JavaXML API,具有性能优异.功能强大和极其易使用的特点,它 ...
Xml学习笔记（3）利用递归解析Xml文档添加到TreeView中
利用递归解析Xml文档添加到TreeView中 private void Form1_Load(object sender, EventArgs e) { XmlDocument doc = new ...

随机推荐

logging、hashlib、collections模块
一.hashlib模块(加密模块) 1.什么叫hash:hash是一种算法(3.x里代替了md5模块和sha模块,主要提供 SHA1, SHA224, SHA256, SHA384, SHA512 , ...
MyBatis介绍及使用
一.介绍: 1.MyBatis实际上是Ibatis3.0版本以后的持久化层框架[也就是和数据库打交道的框架]! 2.和数据库打交道的技术有: 原生的JDBC技术--->Spring的JdbcTe ...
手机端file限制只能选择图片、视频、音频，直接打开摄像头拍照或录像
限制只能选择图片 <input type="file" accept="image/*"> 限制只能选择视频 <input type=&quo ...
docker 部署笔记
Docker虚拟机常用命令先更新软件包 yum -y update 安装Docker虚拟机 yum install -y docker 运行.重启.关闭Docker虚拟机 service d ...
poj 1220 NUMBER BASE CONVERSION
NUMBER BASE CONVERSION Time Limit: 1000MS Memory Limit: 10000K Total Submissions: 5976 Accepted: ...
江西理工大学南昌校区排名赛 A: 单身狗的卡片游戏
题目描述萌樱花是一只单身狗. 萌樱花今天在桌子上摆出了N张卡片,每张卡片i写着一个数字Ai 他不喜欢卡片上的数字多个出现,于是他想搞点事情拆分它们. 从桌子上选出三张卡,去掉一张数字最大,一张数字最 ...
HDU - 3033 滚动数组有坑
每层至少一个,滚动时要判上一层非法与否,所以每次都要memset #include<bits/stdc++.h> #define rep(i,j,k) for(int i=j;i<= ...
python内置函数一
⼀. 本节主要内容:1. 内置函数什么是内置函数? 就是python给你提供的. 拿来直接⽤的函数, 比如print., input等等. 截⽌到python版本3.6.2 python⼀共提供了6 ...
关于vue2非表单元素使用contenteditable="true"实现textarea高度自适应
<template> <div ref="sendContent" contenteditable="true" v-html="s ...
使用JDBC连接了数据库的图书管理系统2.0
更新日志: 2019.3.28 数据库版本2.0 1.使用mySQL数据库 2.修改代码使用JDBC连接数据库 3.新增Manage操作类及DBUtils数据库工具类 4.完善代码(封装及方法调用) ...

【学习笔记】关于DOM4J：使用DOM4J解析XML文档

【学习笔记】关于DOM4J：使用DOM4J解析XML文档的更多相关文章

随机推荐

热门专题