java基础之XML

XML是一种通用的数据交换格式,它的平台无关性、语言无关性、系统无关性、给数据集成与交互带来了极大的方便。本篇文章重点介绍DOM4J对XML文件的一些操作。

1. XML解析概述

  常见解析方式和解析器

  1. DOM:要求解析器把整个XML文档装载到内存,并解析成一个Document对象。

    优点:元素与元素之间保留结构关系,故可以进行增删改查操作。

    缺点:XML文档过大,可能出现内存溢出显现。
  2. SAX:是一种速度更快,更有效的方法。它逐行扫描文档,一边扫描一边解析。并以事件驱动的方式进行具体解析,每执行一行,都将触发对应的事件。

    优点:处理速度快,可以处理大文件

    缺点:只能读,逐行后将释放资源。

2. DOM4J介绍

2.1 常用包

包名 作用
import org.dom4j.Document; Document文档类
import org.dom4j.Element 元素节点类
import org.dom4j.QName; 一个对元素名字的封装类
import org.dom4j.io.SAXReader; sax读取类
import org.dom4j.io.XMLWriter xml写入类
import org.dom4j.io.OutputFormat 输出格式

2.2 内置元素

元素 含义
Attribute 定义了 XML 的属性。
Branch 指能够包含子节点的节点。如XML元素(Element)和文档(Docuemnts)定义了一个公共的行为
CDATA 定义了 XML CDATA 区域
CharacterData 是一个标识接口,标识基于字符的节点。如CDATA,Comment, Text.
Comment 定义了 XML 注释的行为
Document 定义了XML 文档
DocumentType 定义 XML DOCTYPE 声明
Element 定义XML 元素
ElementHandler 定义了Element 对象的处理器
ElementPath 被 ElementHandler 使用,用于取得当前正在处理的路径层次信息
Entity 定义 XML entity
Node 为dom4j中所有的XML节点定义了多态行为
NodeFilter 定义了在dom4j 节点中产生的一个滤镜或谓词的行为(predicate)
ProcessingInstruction 定义 XML 处理指令
Text 定义 XML 文本节点
Visitor 用于实现 Visitor模式
XPath 在分析一个字符串后会提供一个 XPath 表达式

2.2 Element类

方法 含义
getQName() 元素的QName对象
getNamespace() 元素所属的Namespace对象
getNamespacePrefix() 元素所属的Namespace对象的prefix
getNamespaceURI() 元素所属的Namespace对象的URI
getName() 元素的local name
getQualifiedName() 元素的qualified name
getText() 元素所含有的text内容,如果内容为空则返回一个空字符串而不是null
getTextTrim() 元素所含有的text内容,其中连续的空格被转化为单个空格,该方法不会返回null
attributeIterator() 元素属性的iterator,其中每个元素都是

2.3 Attribute类

方法 含义
attributeValue() 元素的某个指定属性所含的值
elementIterator() 元素的子元素的iterator,其中每个元素都是Element对象
element() 元素的某个指定(qualified name或者local name)的子元素
elementText() 元素的某个指定(qualified name或者local name)的子元素中的text信息
getParent() 元素的父元素
getPath() 元素的XPath表达式,其中父元素的qualified name和子元素的qualified name之间使用”/”分隔
isTextOnly() 是否该元素只含有text或是空元素
isRootElement() 是否该元素是XML树的根节点

2.4 常用操作

  • 读取xml文件,获得document对象.
  1. SAXReader reader = new SAXReader();
  2. Document document = reader.read(new File("***.xml"));
  • 解析XML形式的文本,得到document对象.
  1. String text = "<members></members>";
  2. Document document = DocumentHelper.parseText(text);
  • 获取根节点
  1. Element root = dom.getRootElement();
  • 取得某节点的单个子节点
  1. Element memberElm=root.element("title");
  • 获取节点文字
  1. String text=memberElm.getText();
  • 取得某节点下名为"title"所有字节点并进行遍历
  1. List list = rootElm.elements("member");
  2. Iterator<Element> it = list.iterator();
  3. while(it.hasNext()){
  4. Element elm = it.next();
  5. // do something...
  6. }
  • 在某节点下添加子节点.
  1. Element ageElm = newMemberElm.addElement("age");
  • 设置节点文字.
  1. ageElm.setText("29");
  • 删除某节点.
  1. parentElm.remove(childElm);
  • 取得某节点下的某属性
  1. Element root=document.getRootElement();
  2. Attribute attribute=root.attribute("id");
  • 设置某节点的属性和文字.
  1. newMemberElm.addAttribute("name", "sitinspring");
  • 设置属性的文字
  1. Attribute attribute=root.attribute("name");
  2. attribute.setText("sitinspring");
  • 删除某属性
  1. Attribute attribute=root.attribute("size");// 属性名name
  2. root.remove(attribute);

3. 代码演示

3.1 DOM4J读取xml文件

  test.xml

  1. <?xml version="1.0" encoding="UTF-8"?>
  2. <bookstore>
  3. <book id="1">
  4. <title>巴黎圣母院</title>
  5. <author>雨果</author>
  6. </book>
  7. <book id="2">
  8. <title></title>
  9. <author>米切尔</author>
  10. </book>
  11. </bookstore>

  1. 使用List列表解析xml

  1. import java.io.File;
  2. import java.util.List;
  3. import org.dom4j.Attribute;
  4. import org.dom4j.Document;
  5. import org.dom4j.Element;
  6. import org.dom4j.io.SAXReader;
  7. public class XmlDemo {
  8. public static void main(String[] args) throws Exception {
  9. SAXReader reader = new SAXReader();
  10. File file = new File("test.xml");
  11. Document document = reader.read(file);
  12. Element root = document.getRootElement();
  13. List<Element> childElements = root.elements();
  14. for (Element child : childElements) {
  15. //已知属性名情况下
  16. System.out.println("--->id: " + child.attributeValue("id"));
  17. System.out.println("title:" + child.elementText("title"));
  18. System.out.println("author:" + child.elementText("author"));
  19. //未知属性名情况下
  20. /*List<Attribute> attributeList = child.attributes();
  21. for (Attribute attr : attributeList) {
  22. System.out.println(attr.getName() + ": " + attr.getValue());
  23. }
  24. List<Element> elementList = child.elements();
  25. for (Element ele : elementList) {
  26. System.out.println(ele.getName() + ": " + ele.getText());
  27. }
  28. System.out.println();*/
  29. }
  30. }
  31. }
  32. //输出结果:
  33. --->id: 1
  34. title:巴黎圣母院
  35. author:雨果
  36. --->id: 2
  37. title:飘
  38. author:米切尔

  2. 使用Iterator解析xml

  1. public class XmlDemo {
  2. public static void main(String[] args) throws Exception {
  3. SAXReader reader = new SAXReader();
  4. Document document = reader.read(new File("test.xml"));
  5. Element root = document.getRootElement();
  6. Iterator<Element> it = root.elementIterator();
  7. while (it.hasNext()) {
  8. Element element = it.next();
  9. //未知属性名称情况下
  10. Iterator<Element> attrIt = element.attributeIterator();
  11. while (attrIt.hasNext()) {
  12. Attribute a = (Attribute) attrIt.next();
  13. System.out.println(a.getValue());
  14. }
  15. Iterator<Element> eleIt = element.elementIterator();
  16. while (eleIt.hasNext()) {
  17. Element e = eleIt.next();
  18. System.out.println(e.getName() + ": " + e.getText());
  19. }
  20. System.out.println();
  21. //已知元素名情况下
  22. /*System.out.println("id: " + element.attributeValue("id"));
  23. System.out.println("title: " + element.elementText("title"));
  24. System.out.println("author: " + element.elementText("author"));
  25. System.out.println();*/
  26. }
  27. }
  28. }
  29. //输出结果:
  30. id: 1
  31. title:巴黎圣母院
  32. author:雨果
  33. id: 2
  34. title:飘
  35. author:米切尔

3.2 DOM4J创建xml文件

  1. public class XmlDemo {
  2. public static void main(String[] args) throws Exception {
  3. Document doc = DocumentHelper.createDocument();
  4. //增加根节点
  5. Element books = doc.addElement("bookstore");
  6. //增加子元素
  7. Element book1 = books.addElement("book");
  8. Element title1 = book1.addElement("title");
  9. Element author1 = book1.addElement("author");
  10. Element book2 = books.addElement("book");
  11. Element title2 = book2.addElement("title");
  12. Element author2 = book2.addElement("author");
  13. //为子节点添加属性
  14. book1.addAttribute("id", "3");
  15. //为元素添加内容
  16. title1.setText("战争与和平");
  17. author1.setText("列夫托尔斯泰");
  18. book2.addAttribute("id", "4");
  19. title2.setText("红楼梦");
  20. author2.setText("曹雪芹");
  21. //实例化输出格式对象
  22. OutputFormat format = OutputFormat.createPrettyPrint();
  23. //设置输出编码
  24. format.setEncoding("UTF-8");
  25. //创建需要写入的File对象
  26. File file = new File("test2.xml");
  27. //生成XMLWriter对象,构造函数中的参数为需要输出的文件流和格式
  28. XMLWriter writer = new XMLWriter(new FileOutputStream(file), format);
  29. //开始写入,write方法中包含上面创建的Document对象
  30. writer.write(doc);
  31. }
  32. }

  运行结果(项目根目录下):

  1. <?xml version="1.0" encoding="UTF-8"?>
  2. <bookstore>
  3. <book id="3">
  4. <title>战争与和平</title>
  5. <author>列夫托尔斯泰</author>
  6. </book>
  7. <book id="4">
  8. <title>红楼梦</title>
  9. <author>曹雪芹</author>
  10. </book>
  11. </bookstore>

3.2 DOM4J修改xml文件

  1. public class XmlDeml {
  2. public static void main(String[] args) throws Exception {
  3. SAXReader reader = new SAXReader();
  4. File file = new File("test.xml");
  5. Document document = reader.read(file);
  6. Element root = document.getRootElement();
  7. Element nameElement = root.element("book").element("author");
  8. nameElement.setText("鲁迅");
  9. //写回XML文档
  10. OutputFormat format = OutputFormat.createPrettyPrint();
  11. XMLWriter writer = new XMLWriter(new FileOutputStream("test.xml"), format);
  12. writer.write(document);
  13. writer.close();
  14. }
  15. }

  运行结果(项目根目录下):

  1. <?xml version="1.0" encoding="UTF-8"?>
  2. <bookstore>
  3. <book id="1">
  4. <title>巴黎圣母院</title>
  5. <author>鲁迅</author>
  6. </book>
  7. </bookstore>

java基础之XML的更多相关文章

  1. JAVA基础知识xml,date

    虽然说看文档最好是看官方原来的文档,但是呢,下面是我看别的人的总结,算做抛砖引玉吧,如果有不对的,我会在后期给更正或者自己来写一篇 1,JAVA中对xml的操作,包括schema,dtd等相关知识:标 ...

  2. java基础篇---XML解析(二)

    XML解析之最流行的方式:DOM4J dom4j是使用java语言编写的,用于读,写,操作XML的一套组件 dom4j是一个开源的java组件,可从http://sourceforge.net/pro ...

  3. java基础篇---XML解析(一)

    XML是可扩展标记语言 在XML文件中由于更多的是描述信息的内容,所以在得到一个xml文档后应该利用程序安装其中元素的定义名称去除对应的内容,这样的操作称为XML解析. 在XML解析中W3C定义SAX ...

  4. java基础74 XML解析中的SAX解析相关知识点(网页知识)

    1.SAX解析工具 SAX解析工具:是Sun公司提供的,内置JDK中.org.xml.sax.*         点击查看: DOM解析相关知识:以及DOM和SAX解析的原理(区别) 2.SAX解析的 ...

  5. java基础71 XML解析中的【DOM和SAX解析工具】相关知识点(网页知识)

    本文知识点(目录):本文下面的“实例及附录”全是DOM解析的相关内容 1.xml解析的含义    2.XML的解析方式    3.xml的解析工具    4.XML的解析原理    5.实例    6 ...

  6. JAVA基础之XML相关

    个人理解: 知晓XML与HTML的不同,知道其的自由性和约束的方式(规范)!数据按Schema约束写到XML里,然后通过dom4j解析出所有的元素,再用反射创建对象接着调出其所有的方法!!!特别要熟练 ...

  7. JAVA基础学习之XMLCDATA区、XML处理指令、XML约束概述、JavaBean、XML解析(8)

    1.CDATA区在编写XML文件时,有些内容可能不想让解析引擎解析执行,而是当作原始内容处理.遇到此种情况,可以把这些内容放在CDATA区里,对于CDATA区域内的内容,XML解析程序不会处理,而是直 ...

  8. Spring基础篇——通过Java注解和XML配置装配bean

    自动化装配的确有很大的便利性,但是却并不能适用在所有的应用场景,比如需要装配的组件类不是由自己的应用程序维护,而是引用了第三方的类库,这个时候自动装配便无法实现,Spring对此也提供了相应的解决方案 ...

  9. java基础之概谈xml文件解析

    XML已经成为一种非常通用的数据交换格式,它的平台无关性,语言无关性,系统无关性,给数据集成与交互带来了极大的方便. 诸多web应用框架,其可配置的编程方式,给我们的开发带来了非常大程度的便捷,但细细 ...

随机推荐

  1. 软工网络15Alpha阶段敏捷冲刺博客集合

    博客链接集合 第一篇:http://www.cnblogs.com/net15/p/8885400.html 第二篇:http://www.cnblogs.com/net15/p/8893808.ht ...

  2. Alpha冲刺 - (5/10)

    Part.1 开篇 队名:彳艮彳亍团队 组长博客:戳我进入 作业博客:班级博客本次作业的链接 Part.2 成员汇报 过去两天完成了哪些任务 基于ssm框架的前后端交互测试,结合微信小程序demo 展 ...

  3. 关于esp32的系统初始化启动过程及设计学习方法

    对于esp32,其开发程序中有且只能有一个app_main函数,该函数是用户程序的入口,这在没有调用FreeRTOS的系统中相当于函数main,但其实在app_main之前,系统还有一段初始化的过程, ...

  4. Xcode8.0 / OS X EI Capitan 10.11.6 提交报错90111

    改用新系统和新版xcode(都是正式版)后,提交App Store审核时报错: INFO ITMS-90111: "Beta Toolchain. 构建新的 App 和App 更新时,必须使 ...

  5. Windows核心编程:第10章 同步设备IO与异步设备IO

    Github https://github.com/gongluck/Windows-Core-Program.git //第10章 同步设备IO与异步设备IO.cpp: 定义应用程序的入口点. // ...

  6. 解决C#中调用WCF方法报错:远程服务器返回错误 (404) 未找到

    IIS配置问题,解决方法: 1. 首先添加MIME类型 扩展名“.svc”,MIME类型 “application/octet-stream” 2.处理程序映射--添加托管处理程序 请求路径 “.sv ...

  7. 背水一战 Windows 10 (63) - 控件(WebView): 基础知识, 加载 html, http, https, ms-appx-web:///, embedded resource, ms-appdata:///, ms-local-stream://

    [源码下载] 背水一战 Windows 10 (63) - 控件(WebView): 基础知识, 加载 html, http, https, ms-appx-web:///, embedded res ...

  8. JavaScript获取键盘事件

    JavaScript中: onkeydown 事件会在用户按下一个键盘按键时发生. onkeypress 事件会在键盘按键被按下并释放一个键时发生. onkeyup 事件会在键盘按键被松开时发生. 支 ...

  9. web自动化测试(java)---元素定位

    和python类似,java-selenium也提供了很多种元素定位的方法,具体如下: findElement(By.id()) findElement(By.name()) findElement( ...

  10. url参数+,&,=,/等转义编码

    url出现了有+,空格,/,?,%,#,&,= 等特殊符号的时候,可能在服务器端无法获得正确的参数值. 案例: <img src="BarCode39.aspx?barcode ...