XML解析器之JAXP与DOM4J

XML是一种数据格式，那么需要对XML文件进行操作就需要用到XML解析器---------针对dom方式和sax方式提供了不同的解析技术-----需要不同的XML解析器

　dom方式：会把文档中所有元素(标签)，根据xml的层级结构，解析成各个Node对象(节点)。在内存中分配一个树形结构，把xml的标签，属性和文本都封装成对象

　　　　缺点：如果文件过大，造成内存溢出。

　　　　优点：树结构，容易遍历和实现增删改。

　sax方式：采用事件驱动，边读边解析，解析到某一个对象，返回对象名称，可以由用户自己建立自己的对象模型。SAX可以在解析文档的任意时刻停止解析。

　　　　缺点：不能对节点实现增删改操作。

　　　　优点：不受文件大小限制，方便实现查询操作。

DOM(Documeng Object Model)解析器-------JAXP(Java API for XMLProcessing，意为XML处理的Java API)------Java自带的解析xml接口

　　　　解析器存在于------JDK的javax.xml.parsers 包中

　　　　　　dom方式：DocumentBuilder : dom解析器类，

　　　　　　　　　　　DocumentBuilderFactory：dom解析工厂类

　　　过程：通过查看API可以发现，而DocumentBuilderFactory是个抽象类，但存在newInstance()方法通过反射的方式得到该接口的实例对象。

　DocumentBuilder是个抽象类，可以通过 DocumentBuilderFactory.newDocumentBuilder()方法得到解析器实例。

　该解析器类存在 parse(File f) 方法返回Document对象，还存在parse(String uri)方法也返回一个Document对象

　而Doucument是个接口，其父接口是Node接口，Document和Node存在一些方法对标签进行操作，详细查看API 。

　　　　　　　　getElementsByTagName(String tagname)：获取标签, 返回的是 NodeList 集合

　　　　　　　　createElement(String tagName)：创建标签

　　　　　　　　createTextNode(String data)：创建文本

　　　　　　　　appendChild(Node newChild)：将文本添加到标签下面

　　　　　　　　removeChild(Node oldChild)：删除节点

　　　　　　　　getParentNode() ：获取父节点

　　　　　　　　getTextContent()：得到标签里面的内容　

static Document getdocument() throws Exception {

　// 通过工厂解析器类得到Doucment对象

		DocumentBuilderFactory builderFactory = DocumentBuilderFactory.newInstance();

		DocumentBuilder documentbuilder  = builderFactory.newDocumentBuilder();

		　　// parse()解析xml，返回document 

		return documentbuilder.parse(URL);

	}

//docuent及其父接口Node有诸多操作标签/属性/文本内容的方法

看具体要求选用具体方法

注意：删除元素需要得到----该元素的父节点删除，不能自己删自己

　　　在编译器中的增删改----都是对内存操作--因此都需要回写到具体文件中

//回写操作

static void writer(Document document) throws Exception {

		　　TransformerFactory factory = TransformerFactory.newInstance();

		　　Transformer transformer = factory.newTransformer();

		　　transformer.transform(new DOMSource(document), new StreamResult(URL));

	}

　　　sax方式：SAXParser : 解析器类

　　　　　　　SAXParserFactory : 解析器工厂类

　过程：查看API可以发现，SAXParserFactory是个抽象类，可以通过反射的方式newInstance()方法得到该类实例对象。

　　　SAXParser也是个抽象类，其实例对象可以通过SAXParserFactory.newSAXParser()得到解析器实例。

　　　SAXParser对象中存在---parse(File f, DefaultHandler dh)----解析使用指定的指定XML文件的内容DefaultHandler 。

默认事件自动处理其中存在三个方法：解析开始标签---startElement(String uri, String localName, String qName, Attributes attributes)----返回标签名称

　　　解析文本内容----characters(char[] ch,int start,int length)------通过string的构造方法，返回文本内容

　　　解析结束标签-----endElement(String uri,String localName, String qName)-------返回结束标签

　　　　　　　　　参数File --------xml的路径

　　　　　　　　　DefaultHandler----默认事件处理器

class MyDefaultHandler extends DefaultHandler {

 @Override

		public void startElement(String uri, String localName, String qName, Attributes attributes)

				throws SAXException {

			System.out.print("<"+qName+">");//输出返回的开始标签

		}

@Override

public void characters(char[] ch, int start, int length) throws SAXException {

// TODO Auto-generated method stub

System.out.print(new String(ch,start,length));输出返回的结束标签

}

		@Override

		public void endElement(String uri, String localName, String qName) throws SAXException {

			System.out.print("<"+qName+">");输出返回的文本内容

		}

	}

DOM4J(Document Object Model for Java)：是dom4j组织提供的一个用来解析处理XML、 XPath和XSLT开源框架，需要导包--dom4j-2.1.1.jar。DOM4J使用接口和抽象基本类方法，hibernate框架使用的解析方式就是DOM4J，该网址可下载dom4j的JAR包------------https://dom4j.github.io-----哈哈哈哈，该网站能快速掌握Dom4j解析器的使用。

　　　Dom4J中提供如些对象和方法对XML操作：

　　　　SAXReader()：SAXReader可以通过多种方式读取xml数据，并返回Document格式的对象。

　　　　Document对象：getRootElement() ：获取根节点，返回的是Element。

　　　　Element是个接口对象，父接口是Node：getParent()：获取父节点

　　　　　　　　　　　　　　　　　addElement()：添加标签

　　　　　　　　　　　　　　　　　elements()：获取标签下面的所有一层子标签

　　　　　　　　　　　　　　　　　elements(qname)：获取标签下面一层中名为qname的子标签

　　　　　　　　　　　　　　　　　element(qname）：表示获取表面下面的第一个子标签

　　　　　　　　　　　　　　　　　addElement("xxx")：表示创建名为XXX的子标签

　　　　　　　　　　　　　　　　　setText("YYY")：表示添加值为YYY的标签内容

　　　　　　　　　　　　　　　　　addAttribute("name", "James")：表示添加属性

　　　　　对XPath支持--------------selectNodes("xpath表达式")：多个节点

　　　　　　　　　　　　　　　　　　 selectSingleNode("xpath表达式")：一个节点

SAXReader reader = new SAXReader();　　//注意导包----dom4j的import org.dom4j.Document;

Document document = reader.read(url);//import org.dom4j.io.SAXReader;

// 1、创建解析器
SAXReader saxReader = new SAXReader();
// 2、得到document
Document document = saxReader.read("src/DTD.xml");
// 3、得到根节点
Element element = document.getRootElement();
// 4、获取到第一个person
// 使用element方法
Element elementperson = element.element("person");
// 5、在p1下面添加元素
// 在p1上面直接使用 addElement("标签名称")方法返回一个Element
Element addelement = elementperson.addElement("段位");
// 6、在添加完成之后的元素下面添加文本
// 在sex上直接使用 setText("文本内容")方法
addelement.setText("黄金");
// 7、回写xml
// 格式化 OutputFormat,使用 createPrettyPrint方法，表示一个漂亮的格式
// 使用类XMLWriter 直接new 这个类，传递两个参数
// 第一个参数是xml文件路径 new FileOutputStream("路径")
// 第二个参数是格式化类的值

对XML文件进行修改------需要将修改的内容写到文件

//将修改内容写道文本对象中

方式一：FileWriter out = new FileWriter("src/DTD.xml");

　　　　document.write(out);

　　　　out.close();

方式二：将修改内容有格式的写入到文档

　　　　FileWriter fileWiter = new FileWriter("src/DTD.xml");

　　　　XMLWriter writer = new XMLWriter(fileWiter);

　　　　writer.write( document );

　　　　writer.close();

//将修改内容有格式的写入到文档中---有格式

方式三：OutputFormat format = OutputFormat.createPrettyPrint();

　　　　XMLWriter writer = new XMLWriter(new FileOutputStream("src/DTD.xml"),format);

　　　　　　　　　writer.write(document);
　　　　　　　　　writer.close();

DTD.xml文件

　　　　Dom4j中可以使用元素迭代器来遍历下一层的元素和属性：elementIterator()----attributeIterator()---hasNext()

　　　　 Dom4j中支持XPath语法：不过，需要的导包jaxen-1.2.0.jar---下载路径----https://mvnrepository.com/artifact/jaxen/jaxen/1.2.0

　　　　　　第一种形式 -----/AAA/DDD/BBB：表示一层一层的，AAA下面 DDD下面的BBB

　　　　　第二种形式---------//BBB：选取所有 BBB 子元素，而不管它们在文档中的位置。

　　　　　第三种形式----------------/*: 所有元素

　　　　　第四种形式-----------------BBB[1]：　表示第一个BBB元素　　BBB[last()]：表示最后一个BBB元素

　　　　　　第五种形式--------------//BBB[@id]：表示只要BBB元素上面有id属性，都得到

　　　　　　第六种形式----------- //BBB[@id='b1'] 表示元素名称是BBB,在BBB上面有id属性，并且id的属性值是b1

　　　　　常见这六种----详细查看-----https://www.w3school.com.cn/xpath/xpath_syntax.asp

    　　　　　//1、创建解析器

            SAXReader reader = new SAXReader();

            //2、得到document

            Document document = reader.read("src/DTD.xml");

            //3、得到根节点  getRootElement() 返回Element

            Element element = document.getRootElement();

            //Xpath查询

            　　Node node = document.selectSingleNode("//name[1]");

            //修改name元素的值为独孤求败

            　　node.setText("独孤求败");

            /*

             * List<Node> list = element.selectNodes("//name");

             * list for(Node node :

             * list) { System.out.println(node.getText()); }

             */

            //回写文档中

            OutputFormat format = OutputFormat.createPrettyPrint();

            XMLWriter writer = new XMLWriter(new FileOutputStream("src/DTD.xml"),format);

            writer.write(document);

            writer.close();

参考笔记：https://www.cnblogs.com/linkworld/p/7565533.html

XML解析器之JAXP与DOM4J的更多相关文章

XML 解析之 jaxp 解析器
XML 的解析方式有两种方式: DOM 解析和 SAX 解析. DOM 解析: 根据 XML 的层级结构, 在内存中分配一个树形结构, 把 XML 的标签, 属性和文本都封装成对象. 优点: 可以实现 ...
XML解析之JAXP
body, table{font-family: 微软雅黑; font-size: 10pt} table{border-collapse: collapse; border: solid gray; ...
XML解析之JAXP案例详解
根据一个CRUD的案例,对JAXP解析xml技术,进行详细的解释: 首先,已知一个xml文件中的数据如下: <?xml version="1.0" encoding=&quo ...
XML概念定义以及如何定义xml文件编写约束条件java解析xml DTD XML Schema JAXP java xml解析 dom4j 解析 xpath dom sax
本文主要涉及:xml概念描述,xml的约束文件,dtd,xsd文件的定义使用,如何在xml中引用xsd文件,如何使用java解析xml,解析xml方式dom sax,dom4j解析xml文件 XML来 ...
JAVA基础学习之XMLCDATA区、XML处理指令、XML约束概述、JavaBean、XML解析（8）
1.CDATA区在编写XML文件时,有些内容可能不想让解析引擎解析执行,而是当作原始内容处理.遇到此种情况,可以把这些内容放在CDATA区里,对于CDATA区域内的内容,XML解析程序不会处理,而是直 ...
XML解析【介绍、DOM、SAX详细说明、jaxp、dom4j、XPATH】
什么是XML解析前面XML章节已经说了,XML被设计为"什么都不做",XML只用于组织.存储数据,除此之外的数据生成.读取.传送等等的操作都与XML本身无关! XML解析就是读取 ...
Java XML解析工具 dom4j介绍及使用实例
Java XML解析工具 dom4j介绍及使用实例 dom4j介绍 dom4j的项目地址:http://sourceforge.net/projects/dom4j/?source=directory ...
【Java】XML解析之DOM4J
DOM4J介绍 dom4j是一个简单的开源库,用于处理XML. XPath和XSLT,它基于Java平台,使用Java的集合框架,全面集成了DOM,SAX和JAXP,使用需要引用dom4j.jar包 ...
xml解析方式之JAXP解析入门
XML解析 1 引入 xml文件除了给开发者看,更多的情况使用[程序读取xml文件]的内容.这叫做xml解析 2 XML解析方式(原理不同) DOM解析 SAX解析 3 XML解析工具 DOM解析原理 ...

随机推荐

Django项目：CMDB(服务器硬件资产自动采集系统)--12--08CMDB采集硬件数据日志记录
#settings.py # ————————01CMDB获取服务器基本信息———————— import os BASEDIR = os.path.dirname(os.path.dirname(o ...
resful风格
package com.atguigu.springboot.controller; import com.atguigu.springboot.dao.DepartmentDao; import c ...
Mac OS下使用ll等命令
1. 进入用户bash_profile文件 vi ~/.bash_profile 2. 添加如下命令 alias ll='ls -l' alias la='ls -A' alias l='ls -CF ...
mui.fire()用法
作用: mui.fire() 可以触发目标窗口的自定义事件 mui.fire( 目标窗口的webview , '自定义事件名' ,{参数列表}:) 目标窗口监听这个自定义事件 window.addEv ...
【bzoj 4671】异或图
题目神仙题啊神仙题显然这个东西一脸不可求的样子啊,这种东西我们显然需要搞一个容斥什么的于是设\(g_i\)表示至少存在\(i\)个联通块(联通块内部的边没有要求,联通块和联通块之间不存在边)的方 ...
记录：vue结合springboot进行分页查询和按条件进行查询
界面: 主要代码: 搜索框: <el-form ref="searchForm" :inline="true" :model="searchMa ...
Leetcode513. Find Bottom Left Tree Value找树左下角的值
给定一个二叉树,在树的最后一行找到最左边的值. 示例 1: 输入: 2 / \ 1 3 输出: 1 示例 2: 输入: 1 / \ 2 3 / / \ 4 5 6 / 7 输出: 7 注意: 您可以假 ...
WPF 导出Excel 导出图片
/// <summary> /// 导出Excel /// </summary> private void ExportExcel(DataTable ExcelDt) { / ...
JZOJ5870 【NOIP2018模拟9.15】地图
题目描述 Description
EasyUI Tree与Datagrid联动
效果图这是一个简单的solr检索的例子输入关键词,显示树选择一个节点,得到该节点下文档信息代码: JSP: 重点是标红的URL传递 <body> <d ...

XML解析器之JAXP与DOM4J

DTD.xml文件

XML解析器之JAXP与DOM4J的更多相关文章

随机推荐

热门专题