XML文档读取-DOM

DOM(Document Object Model)，“文档对象模型”早期是为了解决不用浏览器间数据兼容问题提出的解决方案，现在已经是W3C组织推荐的处理可扩展标志语言的标准编程接口。

W3C DOM 被分为 3 个不同的部分/级别（parts / levels）：

核心 DOM：用于任何结构化文档
XML DOM：用于 XML 文档的标准模型
HTML DOM：用于 HTML 文档的标准模型

XML DOM 是：

用于 XML 的标准对象模型
用于 XML 的标准编程接口
中立于平台和语言
W3C 的标准

SUN公司的JAXP（Java API for XML Processing）提供了对dom的支持；

其解析步骤为：

创建 DOM 解析器的工厂
得到 DOM 解析器对象。

对整个XML文档进行操作

<?xml version="1.0" encoding="UTF-8"?>

<!-- <!DOCTYPE books SYSTEM "books.dtd"> -->

<books>

    <book>

        <author>joy</author>

        <title>java core</title>

        <price>100</price>

    </book>

    <book>

        <author>joy1</author>

        <title>Thinking in java</title>

        <price>100</price>

    </book>

    <book>

        <comment author="joy" id="S001" language="Chinese" price="20" title="Java"/>

        <comment author="joy" id="S002" language="Chinese" price="20" title="Thinking in Java"/>

    </book>

</books>

package com.sy;

import java.io.File;

import java.io.IOException;

import javax.xml.parsers.DocumentBuilder;

import javax.xml.parsers.DocumentBuilderFactory;

import javax.xml.parsers.ParserConfigurationException;

import javax.xml.transform.Transformer;

import javax.xml.transform.TransformerConfigurationException;

import javax.xml.transform.TransformerException;

import javax.xml.transform.TransformerFactory;

import javax.xml.transform.TransformerFactoryConfigurationError;

import javax.xml.transform.dom.DOMSource;

import javax.xml.transform.stream.StreamResult;

import org.w3c.dom.Document;

import org.w3c.dom.Element;

import org.w3c.dom.Node;

import org.w3c.dom.NodeList;

import org.xml.sax.SAXException;

public class first {

    private static void findElement() throws ParserConfigurationException,

            SAXException, IOException {

        DocumentBuilderFactory factory = DocumentBuilderFactory.newInstance();

        DocumentBuilder builder = factory.newDocumentBuilder();

        Document doc = builder.parse(new File("books.xml"));

        NodeList list = doc.getElementsByTagName("title");

        Node node = list.item(1);

        System.out.println(node.getTextContent());

    }

    // 获取属性内容

    private static void getAttribute() throws ParserConfigurationException,

            SAXException, IOException {

        DocumentBuilderFactory factory = DocumentBuilderFactory.newInstance();

        DocumentBuilder builder = factory.newDocumentBuilder();

        Document doc = builder.parse(new File("books.xml"));

        Element node = (Element) doc.getElementsByTagName("comment").item(1);

        System.out.println(node.getAttribute("title"));

    }

    // 使用递归遍历xml文档

    private static void loopNode() throws ParserConfigurationException,

            SAXException, IOException {

        DocumentBuilderFactory factory = DocumentBuilderFactory.newInstance();

        DocumentBuilder builder = factory.newDocumentBuilder();

        Document doc = builder.parse(new File("books.xml"));

        loop(doc);

    }

    private static void loop(Node doc) {

        NodeList list = doc.getChildNodes();

        for (int i = 0; i < list.getLength(); i++) {

            Node node = list.item(i);

            System.out.println(node.getNodeName());

            loop(node);

        }

    }

    // 添加节点，内容，属性

    private static void createElement() throws ParserConfigurationException,

            SAXException, IOException, TransformerFactoryConfigurationError,

            TransformerConfigurationException, TransformerException {

        DocumentBuilderFactory factory = DocumentBuilderFactory.newInstance();

        DocumentBuilder builder = factory.newDocumentBuilder();

        Document doc = builder.parse(new File("books.xml"));

        // 创建结点

        Element e = doc.createElement("language");

        // 添加内容

        e.setTextContent("Chinese");

        // 添加属性

        e.setAttribute("aa", "xxx");

        // 获取父节点，并append新创建的结点

        doc.getElementsByTagName("book").item(1).appendChild(e);

        // 使用Transformer将内存中更新过的xml文档写入实际的xml文档中

        TransformerFactory tfactory = TransformerFactory.newInstance();

        Transformer tf = tfactory.newTransformer();

        tf.transform(new DOMSource(doc),

                new StreamResult(new File("books.xml")));

    }

    // 注意：DOM的解析方式为将整个xml文档都加载入内存，因此对文档节点的添加、删除和修改操作都是只针对内存中的document对象，因此还需要使用Transformer类将修改真正写入到xml文件中！

    // 删除节点

    private static void deleteElement() throws ParserConfigurationException,

            SAXException, IOException, TransformerFactoryConfigurationError,

            TransformerConfigurationException, TransformerException {

        DocumentBuilderFactory factory = DocumentBuilderFactory.newInstance();

        DocumentBuilder builder = factory.newDocumentBuilder();

        Document doc = builder.parse(new File("books.xml"));

        // 得到待删除的结点

        Element e = (Element) doc.getElementsByTagName("language").item(0);

        // 获取结点的父节点，然后删除该子结点

        e.getParentNode().removeChild(e);

        // 使用Transformer将内存中更新过的xml文档写入实际的xml文档中

        TransformerFactory tfactory = TransformerFactory.newInstance();

        Transformer tf = tfactory.newTransformer();

        tf.transform(new DOMSource(doc),

                new StreamResult(new File("books.xml")));

    }

    public static void main(String[] args) throws ParserConfigurationException,

            SAXException, IOException, TransformerConfigurationException,

            TransformerFactoryConfigurationError, TransformerException {

        // findElement();

        // getAttribute();

        // loopNode() ;

        // createElement();

        deleteElement();

    }

}

代码解读

这个类内含七个函数（包括五个自定义功能函数，一个递归函数体，一个main函数）

五个功能函数：

JfindElement()：发现节点（输出特定节点的文本内容）

    private static void JfindElement() throws ParserConfigurationException,

            SAXException, IOException {

        DocumentBuilderFactory factory = DocumentBuilderFactory.newInstance();// ????

        DocumentBuilder builder = factory.newDocumentBuilder();// ????

        Document doc = builder.parse(new File("./WebRoot/xml/t6.xml"));// 获取页面

        NodeList list = doc.getElementsByTagName("title");// 获取tittle节点

        System.out.println(list.getLength());// 输出title节点长度

        Node node = list.item(1);// 第二个节点

        System.out.println(node.getTextContent());// 输出第二个节点的文本信息

    }

getAttribute()：获得属性值（输出特定节点的属性值）

private static void getAttribute() throws ParserConfigurationException,

            SAXException, IOException {

        DocumentBuilderFactory factory = DocumentBuilderFactory.newInstance();

        DocumentBuilder builder = factory.newDocumentBuilder();

        Document doc = builder.parse(new File("./WebRoot/xml/t6.xml"));

        Element node = (Element) doc.getElementsByTagName("comment").item(1);// 获取comment节点集合

        System.out.println(node.getAttribute("title"));// 输出node节点的tittle属性的值

    }

loop(Node doc)：递归主函数体

private static void loop(Node doc)// Document继承自Node，，，此处为向上转型

    {

        NodeList list = doc.getChildNodes();// 获取孩子节点的集合

        // 便利孩子节点集合

        // 输出每个节点的标签名

        // 递归调用，输出每一层的子节点

        for (int i = 0; i < list.getLength(); i++) {

            Node node = list.item(i);

            System.out.println(node.getNodeName());

            loop(node);

        }

    }

loopNode()递归输出所有节点

// 输出所有节点的节点名称

    private static void loopNode() throws ParserConfigurationException,

            SAXException, IOException {

        DocumentBuilderFactory factory = DocumentBuilderFactory.newInstance();

        DocumentBuilder builder = factory.newDocumentBuilder();

        Document doc = builder.parse(new File("./WebRoot/xml/t6.xml"));

        loop(doc);// 函数调用输出doc所有子孙节点

    }

createElement()：

创建新节点

把新节点添加到父节点后面

更新文档(把修改后的xml文档同步到本地)

private static void createElement() throws ParserConfigurationException,

            SAXException, IOException, TransformerFactoryConfigurationError,

            TransformerConfigurationException, TransformerException {

        DocumentBuilderFactory factory = DocumentBuilderFactory.newInstance();

        DocumentBuilder builder = factory.newDocumentBuilder();

        Document doc = builder.parse("./WebRoot/xml/t6.xml");

        // 创建结点

        Element e = doc.createElement("language");

        // 为新创建的节点添加内容

        e.setTextContent("Chinese");

        // 为新创建的节点添加属性

        e.setAttribute("aa", "xxx");

        // 为新创建的节点获取父节点，并append新创建的结点

        doc.getElementsByTagName("books").item(1).appendChild(e);

        // 使用Transformer将内存中更新过的xml文档写入实际的xml文档中

        TransformerFactory tfactory = TransformerFactory.newInstance();

        Transformer tf = tfactory.newTransformer();

        tf.transform(new DOMSource(doc), new StreamResult(new File(

                "./WebRoot/xml/t6.xml")));

    }

deleteElement()：删除节点

找到他的父节点

父节点删除要删除的节点

更新文档(把修改后的xml文档同步到本地)

private static void deleteElement() throws ParserConfigurationException,

            SAXException, IOException, TransformerFactoryConfigurationError,

            TransformerConfigurationException, TransformerException {

        DocumentBuilderFactory factory = DocumentBuilderFactory.newInstance();

        DocumentBuilder builder = factory.newDocumentBuilder();

        Document doc = builder.parse(new File("./WebRoot/xml/t6.xml"));

        // 得到待删除的结点

        Element e = (Element) doc.getElementsByTagName("language").item(0);

        // 获取结点的父节点，然后删除该子结点

        e.getParentNode().removeChild(e);

        // 使用Transformer将内存中更新过的xml文档写入实际的xml文档中

        TransformerFactory tfactory = TransformerFactory.newInstance();

        Transformer tf = tfactory.newTransformer();

        tf.transform(new DOMSource(doc), new StreamResult(new File(

                "./WebRoot/xml/t6.xml")));

    }

XML文档读取-DOM的更多相关文章

2.1 使用JAXP 对 xml文档进行DOM解析
//使用 jaxp 对xml文档进行dom解析 public class Demo2 { //必要步骤 @Test public void test() throws Exception { //1. ...
xml文档读取-SAX
由于dom采用的是将xml文档加载入内存进行处理的方式,如果xml文档较大,则会导致加载时间过长,效率降低的情况,因此,sun公司在JAXP中又添加了对SAX的支持: SAX,全称Simple API ...
Java高级特性第13节解析XML文档(1) - DOM和XPath技术
一.使用DOM解析XML文档 DOM的全称是Document Object Model,也即文档对象模型.在应用程序中,基于DOM的XML分析器将一个XML文档转换成一个对象模型的集合(通常称DOM树 ...
使用JAXP对xml文档进行DOM解析基础
XML解析方式分为两种:dom和sax dom:(Document Object Model, 即文档对象模型) 是 W3C 组织推荐的处理 XML 的一种方式. sax: ...
使用JAXP对XML文档进行DOM解析
import java.io.FileOutputStream; import javax.xml.parsers.DocumentBuilder; import javax.xml.parsers. ...
XML文档读取-DOM4j
JAXP是sun公司官方提供的java解析工具包,但很多其他企业和机构也都开发了自己的xml解析工具,甚至比JAXP更加优秀,比如DOM4J. Dom4j是一个简单.灵活的开放源代码的库.Dom4j是 ...
java: （正则表达式，XML文档，DOM和DOM4J解析方法）
常见的XML解析技术: 1.DOM(基于XML树结构,比较耗资源,适用于多次访问XML): 2.SAX(基于事件,消耗资源小,适用于数量较大的XML): 3.JDOM(比DOM更快,JDOM仅使用具体 ...
javaweb学习总结十一(JAXP对XML文档进行DOM解析)
一:将内存中写好的xml文件读取到硬盘上二:DOM方式对xml文件进行增删改查 1:添加节点(默认是在最后的子节点后面添加) @Test // 向元素中添加节点<version>1.0& ...
PHP中利用DOM和simplxml读取xml文档
实例用DOM获取下列xml文档中所有金庸小说的书名,该xml文档所在位置为 ./books.xml: <?xml version="1.0" encoding=" ...

随机推荐

使用python3的typing模块提高代码健壮性
前言:很多人在写完代码一段时间后回过头看代码,很可能忘记了自己写的函数需要传什么参数,返回什么类型的结果,就不得不去阅读代码的具体内容,降低了阅读的速度,加上Python本身就是一门弱类型的语言,这种 ...
【深度学习笔记】（一）TensorFlow安装及环境搭建
在学习了一段时间台大李宏毅关于deep learning的课程,以及一些其他机器学习的书之后,终于打算开始动手进行一些实践了. 感觉保完研之后散养状态下,学习效率太低了,于是便想白天学习,晚上对白天学 ...
基于HTML5的WebGL经典3D虚拟机房漫游动画
第一人称在 3D 中的用法要参考第一人称在射击游戏中的使用,第一人称射击游戏(FPS)是以第一人称视角为中心围绕枪和其他武器为基础的视频游戏类型 ; 也就是说,玩家通过主角的眼睛来体验动作.自从流派开 ...
Python之文件与目录
file 通常建议使用open()打开文件,file用于类型判断如果要把数据写到磁盘上,除调用flush()外,还得用sync(),以确保数据从系统缓冲区同步到磁盘.close()总是会调用这两个方 ...
markdown使用小结
初学时,对不太熟悉的markdown语法,有个简单记录公式公式一般用Latex书写,在线Latex编辑器可以使用,有以下几种方法供选择有然后保存为图片gif格式,使用img标签进行引用. 使用G ...
[转]Android应用安装包apk文件的反编译与重编译、重签名
背景介绍: 最近在做Robotium自动化测试,使用到solo.takeScreenshot()函数以在测试过程中截图,但此函数需要被测试APP具有<uses-permission androi ...
jq实现全选或者全不选
$("#all").click(function () { if($(this).is(":checked")){ $("input[name='pr ...
Maven创建父子工程(简单、完整)
Eclipse创建Maven父子工程(书中有的叫聚合工程,因为看了网上很多教程,实际操作总会有这样那样的小问题,有时候包结构还不对,创建成功后索性就自己写一篇帮助小白,有不对请指教) 1 file-n ...
TFboy养成记简单小程序（Variable & placeholder）
学习参考周莫烦的视频. Variable:主要是用于训练变量之类的.比如我们经常使用的网络权重,偏置. 值得注意的是Variable在声明是必须赋予初始值.在训练过程中该值很可能会进行不断的加减操作变 ...
PHP面向对象之const常量修饰符
在PHP中定义常量是通过define()函数来完成的,但在类中定义常量不能使用define(),而需要使用const修饰符.类中的常量使用const定义后,其访问方式和静态成员类似,都是通过类名或在成 ...

XML文档读取-DOM

五个功能函数：

XML文档读取-DOM的更多相关文章

随机推荐

热门专题