JavaEE XML XPath

@author ixenos

XPath技术

1 引入

问题：当使用dom4j查询比较深的层次结构的节点（标签，属性，文本），比较麻烦！！！需要遍历DOM树的众多节点来进行查找！

比如rootEle.element(“dsfs”).element(“sdfsf”)element(“sdfsf”). element(“aim”)

2 xPath作用

主要是用于快速获取所需的节点对象。

(XSLT中的match属性的值就使用XPath！！！)

3 在dom4j中如何使用xPath技术

1）导入xPath支持jar包。 jaxen-1.1-beta-6.jar

2）使用xpath方法

List<Node> selectNodes("xpath表达式"); 查询多个节点对象

Node selectSingleNode("xpath表达式"); 查询一个节点对象

4 xPath语法

/ 绝对路径表示从xml的根位置开始或子元素（一个层次结构）

// 相对路径表示不分任何层次结构的选择元素。

* 通配符表示匹配所有元素

[] 条件表示选择什么条件下的元素

@ 属性表示选择属性节点

and 关系表示条件的与关系（等价于&&）

text() 文本表示选择文本内容

示例：

XPath可以描述XML文档中的一个节点集

/grib/row

描述了grib的子元素（每一个grib）中所有的row元素

/grib/row[1]

用[]选择特定元素，这表示第一行（索引从1开始）

/grib/row[1]/cell[1]/@anchor

用@得到属性值，这描述了第一行第一个单元格的anchor属性

/grib/row/cell/@anchor

描述了作为根元素的grib的子元素的那些row元素中所有cell的anchor属性

		/**

		 * 1.  	/      绝对路径      表示从xml的根位置开始或子元素（一个层次结构）

		 */

		xpath = "/contactList";

		xpath = "/contactList/contact";

		/**

		 * 2. //     相对路径       表示不分任何层次结构的选择元素。

		 */

		xpath = "//contact/name";

		xpath = "//name";

		/**

		 * 3. *      通配符         表示匹配所有元素

		 */

		xpath = "/contactList/*"; //根标签contactList下的所有子标签

		xpath = "/contactList//*";//根标签contactList下的所有标签（不分层次结构）

		/**

		 * 4. []      条件           表示选择什么条件下的元素

		 */

		//带有id属性的contact标签

		xpath = "//contact[@id]";

		//第二个的contact标签

		xpath = "//contact[2]";

		//选择最后一个contact标签

		xpath = "//contact[last()]";

		/**

		 * 5. @     属性            表示选择属性节点

		 */

		xpath = "//@id"; //选择id属性节点对象，返回的是Attribute对象

		xpath = "//contact[not(@id)]";//选择不包含id属性的contact标签节点

		xpath = "//contact[@id='002']";//选择id属性值为002的contact标签

		xpath = "//contact[@id='001' and @name='eric']";//选择id属性值为001，且name属性为eric的contact标签

		/**

		 *6.  text()   表示选择文本内容

		 */

		//选择name标签下的文本内容，返回Text对象

		xpath = "//name/text()";

		xpath = "//contact/name[text()='张三']";//选择姓名为张三的name标签

　　更多XPath表达式请看XPath Tutorial

Demo:

import java.io.File;

import java.io.FileOutputStream;

import org.dom4j.Document;

import org.dom4j.Element;

import org.dom4j.io.OutputFormat;

import org.dom4j.io.SAXReader;

import org.dom4j.io.XMLWriter;

/**

 * 第一个xpath程序

 * @author ixenos

 *

 */

public class Demo1 {

	public static void main(String[] args) throws Exception{

		/**

		 * 需求: 删除id值为2的学生标签

		 */

		Document doc = new SAXReader().read(new File("e:/student.xml"));

		//1.查询id为2的学生标签

		//使用xpath技术

		Element stuElem = (Element)doc.selectSingleNode("//Student[@id='2']");

		//2.删除标签

		stuElem.detach();

		//3.写出xml文件

		FileOutputStream out = new FileOutputStream("e:/student.xml");

		OutputFormat format = OutputFormat.createPrettyPrint();

		format.setEncoding("utf-8");

		XMLWriter writer = new XMLWriter(out,format);

		writer.write(doc);

		writer.close();

	}

}

简要示例

1) 用XPath定位标签，进行修改操作

package com.ixenos.xpath;

import java.util.List;

import org.dom4j.Document;

import org.dom4j.Element;

import org.dom4j.io.SAXReader;

import com.ixenos.dom4j.CreateXML;

/**

 * 在TestXPath的基础上改进了：

 * 将精准定位全交给XPath去做，因此删除了modEle多余的属性定位判断

 *

 * @author ixenos

 *

 */

public class TestXPath2 {

	/**

	 * 读取XML文件生成Docment

	 *

	 * @throws Exception

	 */

	public static Document getDoc(String path) throws Exception {

		Document doc = new SAXReader().read(path);

		return doc;

	}

	/**

	 * XPath定位标签

	 */

	@SuppressWarnings("unchecked")

	public static List<Element> getEle(Document doc, String xpath) {

		return (List<Element>)doc.selectNodes(xpath);

	}

	/**

	 * 对指定标签的子节点进行修改

	 *

	 * @param func

	 *            修改功能选择

	 * @param eleList

	 *            被修改的标签list

	 * @param aimChild

	 *            想要修改的子标签

	 * @param aimChildText

	 *            想要修改的新的子标签文本值

	 */

	public static void modEle(String func, List<Element> eleList, String aimChild, String aimChildText) {

		// 取出

		for (Element ele : eleList) {

			// 修改功能选择

			if ("delete".equals(func)) {

				ele.detach();

			} else if ("modify".equals(func)) {

				// 修改指定子节点的文本值

				// element(name)指定第一个标签名为name的标签

				// setText修改Text，addText追加Text

				ele.element(aimChild).setText(aimChildText);

			}

		}

	}

	/**

	 * 将DOM树输出为XML文件

	 *

	 * @throws Exception

	 */

	public static void writeXML(Document doc, Boolean pretty, String encoding) throws Exception {

		CreateXML.writeXML(doc, pretty, encoding);

	}

	/**

	 * 测试

	 *

	 * @param args

	 * @throws Exception

	 */

	public static void main(String[] args) throws Exception {

		Document doc = getDoc("demo.xml");

		//得到所有id属性值为2的Student标签

		List<Element> eleList = getEle(doc, "//Student[@id='2']");

		modEle("modify", eleList, "name", "尔雅");

		// modEle("delete", eleList, null, null);

		writeXML(doc, true, "utf-8");

	}

}

修改结果：

<?xml version="1.0" encoding="utf-8"?>

<Students>

  <Student id="1">

    <name>张三</name>

    <gender>男</gender>

    <grade>物联网一般</grade>

    <address>广州白云</address>

  </Student>

  <Student id="2">

    <name>尔雅</name>

    <gender>女</gender>

    <grade>物联网二班</grade>

    <address>广州海珠</address>

  </Student>

</Students>

2) 用XPath读取一个规范的html文件（比如xhtml）

import java.io.File;

import java.util.Iterator;

import java.util.List;

import org.dom4j.Document;

import org.dom4j.Element;

import org.dom4j.io.SAXReader;

/**

 * 使用xpath技术读取一个规范的html文档

 * @author ixenos

 *

 */

public class Demo4 {

	public static void main(String[] args) throws Exception{

		Document doc = new SAXReader().read(new File("./src/personList.html"));

		//System.out.println(doc);

		//读取title标签

		Element titleElem = (Element)doc.selectSingleNode("//title");

		String title = titleElem.getText();

		System.out.println(title);

		/**

		 * 练习：读取联系人的所有信息

		 * 按照以下格式输出：

		 * 		 编号:001 姓名:张三 性别:男 年龄:18 地址：xxxx 电话： xxxx

		 *       编号:002 姓名:李四 性别:女 年龄:20 地址：xxxx 电话： xxxx

		 *       ......

		 */

		//1.读取出所有tbody中的tr标签

		List<Element> list = (List<Element>)doc.selectNodes("//tbody/tr");

		//2.遍历

		for (Element elem : list) {

			//编号

			//String id = ((Element)elem.elements().get(0)).getText();

			String id = elem.selectSingleNode("td[1]").getText();

			//姓名

			String name = ((Element)elem.elements().get(1)).getText();

			//性别

			String gender = ((Element)elem.elements().get(2)).getText();

			//年龄

			String age = ((Element)elem.elements().get(3)).getText();

			//地址

			String address = ((Element)elem.elements().get(4)).getText();

			//电话

			String phone = ((Element)elem.elements().get(5)).getText();

			System.out.println("编号："+id+"\t姓名："+name+"\t性别："+

								gender+"\t年龄："+

								age+"\t地址："+address+

								"\t电话："+phone);

		}

	}

}

JavaEE XML XPath的更多相关文章

JavaEE XML 基础知识
JavaEE XML 基础知识 @author ixenos 1. XML开头都需要一个声明 <?和?>表明这是一个处理指令 <?xml version=”1.0” encod ...
WP8 中使用HTML Agility Pack与友盟分享SDK遇到的 System.Xml.XPath加载问题
今晚在尝试使用友盟最新的社交分享SDK时,按照官方Demo,并未做多少多少改动,就是去除了对微信.脸书和推特的分享.然后运行之后就一直报错 : {System.IO.FileLoadException ...
XML & XPath & XQuery
XML & XPath & XQuery full XPath demo https://www.w3.org/TR/xpath-full-text-30/ https://www.w ...
XML Xpath学习
Xpath是一门在xml文档中查找信息的语言. Xpath可用来在xml文档中对元素和属性进行遍历. <1>路径表达式1: 斜杠(/)作为路径内部的分隔符同一个路径有绝对路径和相对路径两 ...
XML, XPath, Xslt及解析/Parse
XML及解析/Parse "Programming with libxml2 is like the thrilling embrace of an exotic stranger.&quo ...
JavaEE XML DOM解析之DOM4J
DOM解析之DOM4J @author ixenos DOM4J常用API 读取xml文档: Document doc = new SAXReader().read("xml文件" ...
JavaEE XML DOM创建
DOM创建XML @author ixenos 1.思路: 先封装构建一颗DOM树,然后将DOM树转换成XML文件 2.三种写DOM树到XML文件的方式: 1)使用DOM(或DOM4J.JDOM) 2 ...
JavaEE XML XSL转换（XSLT）
XSL转换(XSLT) @author ixenos 定义: XSL转换机制可以指定将XML文档转换为其他格式的规则,例如,txt纯文本.XHTML或其他任何XML格式. 用途: XSLT通常用来将某 ...
HTML/XML/XPATH基础
Html超文本标记语言网页上单击右键→查看源文件/查看源代码 Html基本结构 <html> 为文档根元素,所有元素都在内部进行 <head> ...

随机推荐

document对象属性documentMode与CompatMode
DOCTYPE DOCTYPE全称Document Type Declaration(文档类型声明,缩写DTD) DTD的声明影响浏览器对于CSS代码及Javascript脚本的解析. 渲染模式渲染 ...
sqlite3结合ios开发
简介: SQLite是遵守ACID的关系数据库管理系统,它包含在一个相对小的C库中.它是D.RichardHipp创建的公有领域项目. 不像常见的客户端/服务器结构范例,SQLite引 ...
运动检测（前景检测）之（一）ViBe
运动检测(前景检测)之(一)ViBe zouxy09@qq.com http://blog.csdn.net/zouxy09 因为监控发展的需求,目前前景检测的研究还是很多的,也出现了很多新的方法和思 ...
Html Agility Pack解析HTML页
文章来源:Html Agility Pack解析HTML页现在,在不少应用场合中都希望做到数据抓取,特别是基于网页部分的抓取.其实网页抓取的过程实际上是通过编程的方法,去抓取不同网站网页后,再进行分 ...
Paint.NET
http://www.dotpdn.com/downloads/pdn.html Paint.NET To download, please click the Free Download Now l ...
wpf中xps文档合并功能实现
跟着上一篇的xps文档套打的文章,近期一直在研究xps打印技术,其中用户提到了一个需求,要求能够多页面进行打印,我的想法是,先生成xps文件,然后将文件读取出来以后,合并成一个文件来处理. 如果要是直 ...
【hanoi】hanoi移动次数和移动步骤
#include<stdio.h> #include<stdlib.h> //移动次数 int hanoi(int num) { ; ) { ; } else { all = ...
指定url和深度的广度优先算法爬虫的python实现
本文参考http://zoulc001.iteye.com/blog/1186996 广度优先算法介绍整个的广度优先爬虫过程就是从一系列的种子节点开始,把这些网页中的"子节点"( ...
ASP.NET MVC 用户登录Login
ASP.NET MVC 用户登录Login一.先来看个框架例子:(这个是网上收集到的) 第一步:创建一个类库ClassLibrary831. 第二步:编写一个类实现IHttpM ...
Oracle和Mysql分别生成sequence序列
有时候在往数据库中插入数据的时候,如果ID值是32位的UUID, 而自己随便写个字符又不合适,这时就要用到函数来产生一个序列值 Oracle: select sys_guid() from dual; ...

JavaEE XML XPath

JavaEE XML XPath

XPath技术

1 引入

2 xPath作用

3 在dom4j中如何使用xPath技术

4 xPath语法

Demo:

简要示例

JavaEE XML XPath的更多相关文章

随机推荐

热门专题