JavaWeb学习日记----XML的解析
XML的解析简介:
在学习JavaScript时,我们用的DOM来解析HEML文档,根据HTML的层级结构在内存中分配一个树形结构,把HTML的标签啊,属性啊和文本之类的都封装成对象。
比如:document对象,element对象,属性对象,文本对象,Node结点对象
我们通常有两种方式来解析XML:DOM和SAX
DOM解析方式:
其实跟HTML差不多的,也是根据XML的层级结构在内存中分配一个树形结构,把XML的标签,属性和文本都封装成对象。
缺点:如果文件过大的话,就和造成内存溢出。
优点:可以很方便实现增删改操作。
SAX解析方式:
采用事件驱动,从上到下,一行一行的解析,边读边解析。解析到某一个对象时,返回对象名称。
缺点:不能实现增删改操作
优点:不会内存溢出,可以方便实现查询操作。
解析器:
在解析XML时,需要解析器。针对DOM和SAX,不同的公司和组织向我们提供了不同的解析器。
SUN公司: jaxp
dom4j组织: dom4j
jdom组织 : jdom
在实际开发中,dom4j用的最多
jaxp:
jaxp解析器在JDK的javax.xml.parsers包里面。针对dom和sax分别提供了解析器:
dom: DocumentBuilder: 解析器类
DocumentBuilderFactory: 解析器工厂类
sax: SAXParser: 解析器类
SAXParserFactory: 解析器工厂类
那么我们具体获得JAXP中的DOM解析器的方法如下:
调用DocumentBuilderFactory.newInstance()方法得到创建DOM解析器的工厂。
调用工厂对象的newDocumentBuilder()方法得到解析器对象。
调用解析器对象的parse()方法解析XML文档,该方法的参数为XML文档的URL或者封装了XML路径的文件对象。即:parse(String uri) parse(File f)
示例:
// 创建解析器工厂
DocumentBuilderFactory documentBuilderFactory = DocumentBuilderFactory.newInstance();
// 获得解析器
DocumentBuilder documentBuilder = documentBuilderFactory.newDocumentBuilder();
// 解析目标XML文件
Document document = documentBuilder.parse("src/OnePiece.xml");
通过上述步骤我们就能得到代表整个文档的Document对象,就可以利用DOM特性对整个XML文档进行操纵了。
Document接口中常用的方法:
NodeList getElementsByTagName(String tagname) 按文档顺序返回包含在文档中且具有给定标记名称的所Element的 NodeList。
Element createElement(String tagName) 创建指定类型的元素。
Text createTextNode(String data) 创建给定指定字符串的 Text 节点。
Document的父接口Node中常用的方法:
Node appendChild(Node newChild)
将节点 newChild 添加到此节点的子节点列表的末尾。
Node removeChild(Node oldChild)
从子节点列表中移除 oldChild 所指示的子节点,并将其返回。
Node getParentNode()
此节点的父节点。
String getTextContent()
此属性返回此节点及其后代的文本内容。
void setTextContent(String textContent)
此属性返回此节点及其后代的文本内容。
在得到的NodeList集合中有下列方法可以实现遍历:
int getLength()
列表中的节点数。
Node item(int index)
返回集合中的第 index 个项。
在对Document对象进行更新操作时,都是在内存中进行的。如果想要更直观地显示在XML文档中,需要进行回写操作。即:把Document对象又重新写入到XML文件中。
示例:
现有一个XML文档内容如下:
<?xml version="1.0" encoding="UTF-8" standalone="no"?>
<海贼王>
<草帽海贼团>
<船长>路飞</船长>
<厨师>山治</厨师>
<航海士>娜美</航海士>
<船医>乔巴</船医>
<音乐家>贝多芬</音乐家> </草帽海贼团>
<草帽海贼团>
<副船长>索隆</副船长>
<考古学家>罗宾</考古学家>
<狙击手>乌索普</狙击手>
<船工>弗兰奇</船工>
</草帽海贼团>
</海贼王>
需求:将第一个<草帽海贼团>下面的<音乐家>内容贝多芬改为布鲁克
代码如下:
package com.alex; import javax.xml.parsers.DocumentBuilder;
import javax.xml.parsers.DocumentBuilderFactory;
import javax.xml.transform.Transformer;
import javax.xml.transform.TransformerFactory;
import javax.xml.transform.dom.DOMSource;
import javax.xml.transform.stream.StreamResult;
import org.w3c.dom.Document;
import org.w3c.dom.Node;
import org.w3c.dom.NodeList; /*
* 将第一个<草帽海贼团>下面的<音乐家>内容贝多芬改为布鲁克
*/
public class OnePieceTest3 {
public static void main(String[] args) throws Exception {
// 创建解析器
DocumentBuilderFactory documentBuilderFactory = DocumentBuilderFactory.newInstance();
DocumentBuilder documentBuilder = documentBuilderFactory.newDocumentBuilder();
// 解析目标XML文件
Document document = documentBuilder.parse("src/OnePiece.xml"); // 获得目标元素集合
NodeList list = document.getElementsByTagName("草帽海贼团"); Node node = list.item(0);
NodeList childNodes = node.getChildNodes();
for (int j = 0; j < childNodes.getLength(); j++) {
Node node2 = childNodes.item(j);
String nodeName = node2.getNodeName();
if (nodeName.equals("音乐家"))
node2.setTextContent("布鲁克");
}
// 回写
// 创建转换器
TransformerFactory transformerFactory = TransformerFactory.newInstance();
Transformer transformer = transformerFactory.newTransformer();
transformer.transform(new DOMSource(document), new StreamResult("src/OnePiece.xml"));
}
}
修改后XML文档内容如下:
<?xml version="1.0" encoding="UTF-8" standalone="no"?>
<海贼王>
<草帽海贼团>
<船长>路飞</船长>
<厨师>山治</厨师>
<航海士>娜美</航海士>
<船医>乔巴</船医>
<音乐家>布鲁克</音乐家>
</草帽海贼团>
<草帽海贼团>
<副船长>索隆</副船长>
<考古学家>罗宾</考古学家>
<狙击手>乌索普</狙击手>
<船工>弗兰奇</船工>
</草帽海贼团>
</海贼王>
2019-04-05
JavaWeb学习日记----XML的解析的更多相关文章
- JavaWeb学习日记----XML基础
1.XML基础: XML全称为eXtensible Markup Language;即可扩展标记型语言,同HTML一样使用标签来操作.它的可扩展性体现在标签可以由自己定义,可以是中文标签. XML用途 ...
- JavaWeb学习日记----表单提交方式
1.表单提交方式 (1) 使用input控件中的submit提交 代码如下: <!DOCTYPE html> <html lang="en"> <he ...
- JavaWeb学习——web.xml文件说明
JavaWeb学习——web.xml文件说明 摘要:本文主要学习了web.xml文件的作用以及如果配置. 是什么 web.xml文件是用来在JavaWeb项目里面初始化配置信息的,比如:访问的首页.S ...
- JavaWeb学习笔记——XML解析
DOM解析操作 只在跟节点<addresslist>下面建立一个子节点<name> <?xml version="1.0" encoding=&quo ...
- JavaScripts学习日记——XML DTD Schema
今日关键词: XML DTD Schema 1.XML 1 XML的概述 1.1 什么是XML XML全称为Extensible Markup Language,意思是可扩展的标记语言.XML语法上和 ...
- JavaWeb学习日记----SAX解析XML
1.SAX解析XML文档的方式: 与DOM方式解析不同,DOM方式解析是根据XML的层级结构在内存中分配一个树形结构,把xml的标签,属性和文本都封装成对象.优点是可以很方便实现增删改操作.缺点是,如 ...
- Javaweb学习笔记——使用Jdom解析xml
一.前言 Jdom是什么? Jdom是一个开源项目,基于树形结构,利用纯java的技术对XML文档实现解析,生成,序列化以及多种操作.它是直接为java编程服务,利用java语言的特性(方法重载,集合 ...
- JavaWeb学习笔记——XML和SAX解析区别
- 【javaweb学习】XML和约束模式
xml:可扩展标记语言,w3c组织发布的,用于保存有关系的数据,作为配置文件,描述程序模块之间的关系 <?xml version="1.0" encoding="g ...
随机推荐
- 我的C++ 学习心得
创建这个博客已经是我大一下学期的暑假了,这一年里,我学习了人生第一门编程语言C++ . C++是一门当前仍然活跃于开发前沿的编程语言.在还未开始正式学习它时,早就听到我们的学长抱怨C++难学.起初,我 ...
- SWIG 基本概念和入门
C 和 C++ 被公认为(理当如此)创建高性能代码的首选平台.对开发人员的一个常见要求是向脚本语言接口公开 C/C++ 代码,这正是 Simplified Wrapper and Interface ...
- Python - 关于代码阅读的一些建议
初始能力 让阅读思路保持清晰连贯,主力关注在流程架构和逻辑实现上,不被语法.技巧和业务流程等频繁地阻碍和打断. 建议基本满足以下条件,再开始进行代码阅读: 具备一定的语言基础:熟悉基础语法,常用的函数 ...
- 3,linux入门到上手-文件权限管理与配置
linux入门-文件权限管理与配置 一.关于linux的操作命令一般格式如下: 1,一行指令中第一个输入的部分绝对是"指令(command)"或"可可执行文件案(例如批次 ...
- okHttp超时报错解决方案
Android 使用okhttp,如果客户端等待的时间超过了okHttp的默认时间,就会报错java.net.SocketTimeoutException: timeout 所以,需要在调用okHtt ...
- ubuntu设置IP地址&修改vi模式键盘上下键错位
解决ubuntu上面使用vi 出现方向键错乱的情况 编辑/etc/vim/vimrc.tiny 使用root权限操作:将“set compatible”改成“set nocompatible” 新增一 ...
- Android--使用剪切板在Activity中传值
在Activity之间传递数据还可以利用一些技巧,不管windows还是Linux操作系统,都会支持一种叫剪切板的技术,也就是某一个程序将一些数据复制到剪切板上,然后其他的任何程序都可以从剪切板中获取 ...
- Web API 处理机制剖析 --- 拨开迷雾看本质
前言 最近开发了几个项目,用到了web api,也通过项目加深了对web api的理解.本文试图从内部原理讲解web api的本质.透过重重迷雾,看清本质,就能更好的把握和利用好web api. 1 ...
- web进修之—Hibernate HQL(7)
概述 HQL是Hibernate封装成为面向对象的数据库查询语言,具有如下特点: 面向对象,包括继承.多态和关联之类的概念,SQL操作的数据库的表,HQL更像是操作对象 大小写敏感,只对对象和属性敏感 ...
- jvm的那些设置参数你都知道吗
前言 大家都知道,jvm在启动的时候,会执行默认的一些参数.一般情况下,这些设置的默认参数应对一些平常的项目也够用了.但是如果项目特别大了,需要增加一下堆内存的大小.或者是系统老是莫明的挂掉,想查看下 ...