一、概述

DOM4J是一个易用的、开源的库,用于XML、XPath和XSLT中。采用了Java集合框架并完全支持DOM、SAX、和JAXP。

DOM4J最大的特色是使用大量的接口,主要接口都在org.dom4j这个包里定义:

二、DOM4J的接口

Attribute:定义了XML的属性;

Branch:是能够包含子节点的节点,如XML元素(Element)和文档(Documents)定义了一个公共的行为;

CDATA:定义了XML的CDATA区域;

CharacterData:是一个标识接口,标致基于字符的节点:(CDATA、Comment、Text);

Comment:定义了XML注释的行为;

Document:定义了XML文档;

DocumentType:定义了XML的DOCTYPE声明;

Element:定义了XML文档;

ElementHandler:定义了Element对象的处理器;

ElementPath:被ElementHandler使用,用于取得当前正在处理的路径层次信息;

Entity:定义XML的entity;

Node:为所有的DOM4J中XML节点定义了多态行为;

NodeFilter:定义了在DOM4J节点中产生的一个滤镜或谓词的行为(predicate);

ProcessingInstruction:定义XML处理指令;

Text:定义XML文本节点;

Visitor:用于实现Visitor模式;

XPath:在分析一个字符串后会提供一个XPath表达式。

三、使用DOM4J操作XML数据

1.Document对象相关

读取XML文件,获得document对象。

SAXReader reader = new SAXReader();

Document document = reader.read(new File("input.xml"));

2.节点相关

获取文档的根元素

Element rootElm = document.getRootElement();

取得某节点的单个子节点

Element memberElm = root.element("member");//"member"是节点名

取得节点的文字

String text = memberElm.getText();

String text = root.elementText("name");//取得根元素下的name子节点的文字

取得某节点下名为“member”的所有子节点并进行遍历

List nodes = rootElm.elements("member");

for(Iterator it=nodes.iterator;it.hasNext();){

  Element elm = (Element)it.next();

}

对某节点下的所有子节点进行遍历

for(Iterator it = root.elementIterator();it.hasNext();){

  Element element = (Element) it.next();

}

在某节点下添加子节点

Element ageElm = newMemberElm.addElement("age");

设置节点文字

ageElm.setText("29");

删除某节点

parentElm.remove(childElm);//childElm是待删除的节点,parentElm是其父节点

3.相关属性

取得某节点下的属性

Element root = document.getRootElement();

Attribute attribute = root.attribute("size");//属性名name

取得属性的文字

String text = attribute.getText();

String text = root.element("name").attributeValue("firstname");

遍历某节点的所有属性

Element root = document.getRootElement();

for(Iterator it = root.attributeIterator();it.hasNext();{

  Attribute attribute = (Attribute)it.next();

  String text = attribute.getText();

  System.out.println(text);

}

设置某节点的属性和文字

newMemberElm.addAttribute("name","sitinspring");

设置属性的文字

Attribute attribute = root.attribute("name");

attribute.setText("sitinspring");

删除某属性

Attribute attribute = root.attribute("size");

root.remove(attribute);

4.将文档写入XML文件

(1)文档中全为英文,不设置编码格式,直接写入

XMLWriter writer = new XMLWriter(new FileWriter("output.xml");

writer.write(document);

writer.close();

(2)文档中含有中文,设置编码格式在写入

OutputFormat format = OutputFormat.createPrettyPrint();

format.setEncoding("GBK");

XMLWriter writer = new XMLWriter(new FileWriter("output.xml"),format);

writer.write(document);

writer.close();

四、案例:使用DOM4J读取XML文档,步骤如下:

1.导入DOM4J的jar包

2.指定要解析的XML文件

3.把XML文件转换成Document对象

4.获取节点属性或文本的值

 import java.io.File;
import java.util.Iterator; import org.dom4j.Document;
import org.dom4j.DocumentException;
import org.dom4j.Element;
import org.dom4j.io.SAXReader; /**
* 使用DOM4J解析XML文档
* @author Administrator
*
*/
public class PhoneDom4j { public static void main(String[] args) {
Document phone = null;
try {
//加载DOM树
SAXReader saxReader = new SAXReader();
phone = saxReader.read(new File("src/phoneInfo.xml"));
} catch (DocumentException e) {
e.printStackTrace();
}
//获取xml的根节点
Element root = phone.getRootElement();
//遍历所有的Brand标签
for (Iterator<?> itBrand = root.elementIterator(); itBrand.hasNext();) {
Element brand = (Element) itBrand.next();
//输出标签的属性
System.out.println("品牌:"+brand.attributeValue("name"));
//遍历Type标签
for (Iterator<?> itType = brand.elementIterator(); itType.hasNext();) {
Element type = (Element) itType.next();
//输出标签的name属性
System.out.println("\t型号:"+type.attributeValue("name"));
}
} } }

【学习笔记】关于DOM4J:使用DOM4J解析XML文档的更多相关文章

  1. dom4j创建和解析xml文档

    DOM4J解析  特征: 1.JDOM的一种智能分支,它合并了许多超出基本XML文档表示的功能. 2.它使用接口和抽象基本类方法. 3.具有性能优异.灵活性好.功能强大和极端易用的特点. 4.是一个开 ...

  2. 使用dom4j解析XML文档

    dom4j的包开源包,不属于JDK里面,在myeclipse中要单独导入在项目中,这里不累赘了 做这个过程,很慢,因为很多方法没用过不熟悉,自己得去查帮助文档,而且还得去试,因为没有中文版,英文翻译不 ...

  3. DOM4J解析XML文档

    Tip:DOM4J解析XML文档 Dom4j是一个简单.灵活的开放源代码的库.Dom4j是由早期开发JDOM的人分离出来而后独立开发的.与JDOM不同的是,dom4j使用接口和抽象基类,虽然Dom4j ...

  4. 使用DOM4J解析XML文档,以及使用XPath提取XML文档

    使用DOM4J解析XML文档 需要首先下载DOM4J工具包.这是个第三方工具包 在使用DOM4J解析的时候需要导入 DOM4J的JAR包 下载DOM4J工具包->在MyEclipse中新建lib ...

  5. dom4j解析xml文档全面介绍

    一.dom4j介绍 dom4j是一个Java的XML API,类似于jdom,用来读写XML文件的.dom4j是一个非常非常优秀的Java XML API,具有性能优异.功能强大和极端易用使用的特点, ...

  6. 源生API解析XML文档与dom4j解析XML文档

    一.XML语言 XML是一种可扩展的标记语言,是一种强类型的语言,类似HTML(超文本标记语言,是一种弱类型的语言).XML是一种通用的数据交换格式(关系型数据库),综上所诉:XML可以传输数据,也可 ...

  7. Java高级特性 第15节 解析XML文档(3) - JDOM和DOM4J技术

    一.JDOM解析 特征: 1.仅使用具体类,而不使用接口. 2.API大量使用了Collections类. Jdom由6个包构成: Element类表示XML文档的元素 org.jdom: 解析xml ...

  8. javaweb dom4j解析xml文档

    1.什么是dom4j dom4j是一个Java的XML API,是jdom的升级品,用来读写XML文件的.dom4j是一个十分优秀的JavaXML API,具有性能优异.功能强大和极其易使用的特点,它 ...

  9. Xml学习笔记(3)利用递归解析Xml文档添加到TreeView中

    利用递归解析Xml文档添加到TreeView中 private void Form1_Load(object sender, EventArgs e) { XmlDocument doc = new ...

随机推荐

  1. 【转】C#控件——DataGridView单元格文本自动换行

    源地址:https://www.cnblogs.com/wangshenhe/archive/2012/07/25/2608324.html DataGridView是.NET开发中常用的控件,在开发 ...

  2. Maven配置与安装

    最近重装了一下系统,便重新安装与配置了maven,记录这个过程并分享出来. 注意:maven安装需要Java依赖,我这里使用的是jdk1.8. 1.安装并配置环境变量 首先在 maven 官网下载 m ...

  3. bzoj2564: 集合的面积(闵可夫斯基和 凸包)

    题面 传送门 题解 花了一个下午的时间调出了一个稍微能看的板子--没办法网上的板子和咱的不太兼容-- 首先有一个叫做闵可夫斯基和的东西,就是给你两个点集\(A,B\),要你求一个点集\(C=\{x+y ...

  4. .Generator与其他异步处理方案

    1.Generator与其他异步处理方案 以前,异步编程的方法,大概有下面四种. 1.1 回调函数 JavaScript 语言对异步编程的实现,就是回调函数.所谓回调函数,就是把任务的第二段单独写在一 ...

  5. SDUT OJ 数据结构实验之串二:字符串匹配

    数据结构实验之串二:字符串匹配 Time Limit: 1000 ms Memory Limit: 65536 KiB Submit Statistic Discuss Problem Descrip ...

  6. HMTL5 本地数据库

    数据库这个东东现在也可以用在web上了,目前为止, chrom 6 以上版本,opera 10 以上,safari 5以上支持这个功能. htm4中数据库只能放在服务器,只能通过服务器来访问,但是在h ...

  7. XMLHttpRequest 与 Ajax 概要

    关于XMLHttpRequest 开发者使用XMLHttpRequest对象与服务端进行交互(发送http请求.接受返回数据等),可以在不打断用户下一步操作的情况下刷新局部页面.XMLHttpRequ ...

  8. 使用C#来编写一个异步的Socket服务器

    介绍 我最近需要为一个.net项目准备一个内部线程通信机制. 项目有多个使用ASP.NET,Windows 表单和控制台应用程序的服务器和客户端构成. 考虑到实现的可能性,我下定决心要使用原生的soc ...

  9. vscode 遇到设置问题

    // 控制是否在新窗口中打开文件. // - default: 除了从软件内部选择的文件 (如,从“文件”菜单选择),其他所有文件都将在新窗口中打开 // - on: 文件将在新窗口中打开 // - ...

  10. C#.net地址传参汉字乱码解决方案

    C#.net地址传参汉字乱码解决方案   web.config文件: <system.web> <globalization requestEncoding="GB2312 ...