利用XPath读取Xml文件

之所以要引入XPath的概念，目的就是为了在匹配XML文档结构树时能够准确地找到某一个节点元素。可以把XPath比作文件管理路径：通过文件管理路径，可以按照一定的规则查找到所需要的文件；同样，依据XPath所制定的规则，也可以很方便地找到XML结构文档树中的任何一个节点.

不过，由于XPath可应用于不止一个的标准，因此W3C将其独立出来作为XSLT的配套标准颁布，它是XSLT以及我们后面要讲到的XPointer的重要组成部分。

　　在介绍XPath的匹配规则之前，我们先来看一些有关XPath的基本概念。

　　首先要说的是XPath数据类型。XPath可分为四种数据类型：

节点集（node-set）
节点集是通过路径匹配返回的符合条件的一组节点的集合。其它类型的数据不能转换为节点集。
布尔值(boolean)
由函数或布尔表达式返回的条件匹配值，与一般语言中的布尔值相同，有true和false两个值。布尔值可以和数值类型、字符串类型相互转换。
字符串(string)
字符串即包含一系列字符的集合，XPath中提供了一系列的字符串函数。字符串可与数值类型、布尔值类型的数据相互转换。
数值(number)
在XPath 中数值为浮点数，可以是双精度64位浮点数。另外包括一些数值的特殊描述，如非数值NaN（Not-a-Number）、正无穷大infinity、负无穷大-infinity、正负0等等。number的整数值可以通过函数取得，另外，数值也可以和布尔类型、字符串类型相互转换。

　　其中后三种数据类型与其它编程语言中相应的数据类型差不多，只是第一种数据类型是XML文档树的特有产物。

　　另外，由于XPath包含的是对文档结构树的一系列操作，因此搞清楚XPath节点类型也是很必要的。回忆一下第二章中讲到的XML文档的逻辑结构，一个XML文件可以包含元素、CDATA、注释、处理指令等逻辑要素，其中元素还可以包含属性，并可以利用属性来定义命名空间。相应地，在XPath中，将节点划分为七种节点类型：

根节点（Root Node）
根节点是一棵树的最上层，根节点是唯一的。树上其它所有元素节点都是它的子节点或后代节点。对根节点的处理机制与其它节点相同。在XSLT中对树的匹配总是先从根节点开始。
元素节点（Element Nodes）
元素节点对应于文档中的每一个元素，一个元素节点的子节点可以是元素节点、注释节点、处理指令节点和文本节点。可以为元素节点定义一个唯一的标识id。
元素节点都可以有扩展名，它是由两部分组成的：一部分是命名空间URI，另一部分是本地的命名。
文本节点（Text Nodes）
文本节点包含了一组字符数据，即CDATA中包含的字符。任何一个文本节点都不会有紧邻的兄弟文本节点，而且文本节点没有扩展名。
属性节点（Attribute Nodes）
每一个元素节点有一个相关联的属性节点集合，元素是每个属性节点的父节点，但属性节点却不是其父元素的子节点。这就是说，通过查找元素的子节点可以匹配出元素的属性节点，但反过来不成立，只是单向的。再有，元素的属性节点没有共享性，也就是说不同的元素节点不共有同一个属性节点。
对缺省属性的处理等同于定义了的属性。如果一个属性是在DTD声明的，但声明为#IMPLIED，而该属性没有在元素中定义，则该元素的属性节点集中不包含该属性。
此外，与属性相对应的属性节点都没有命名空间的声明。命名空间属性对应着另一种类型的节点。
命名空间节点（Namespace Nodes）
每一个元素节点都有一个相关的命名空间节点集。在XML文档中，命名空间是通过保留属性声明的，因此，在XPath中，该类节点与属性节点极为相似，它们与父元素之间的关系是单向的，并且不具有共享性。
处理指令节点（Processing Instruction Nodes）
处理指令节点对应于XML文档中的每一条处理指令。它也有扩展名，扩展名的本地命名指向处理对象，而命名空间部分为空。
注释节点（Comment Nodes）
注释节点对应于文档中的注释。

下面，我们来构造一棵XML文档树，作为后面举例的依托：

现在，我们就来介绍一些XPath中节点匹配的基本方法。

路径匹配
路径匹配与文件路径的表示相仿，比较好理解。有以下几个符号：

符号	含义	举例	匹配结果
/	指示节点路径	/A/C/D	节点"A"的子节点"C"的子节点"D"，即id值为d2的D节点
/	指示节点路径	/	根节点
//	所有路径以"//"后指定的子路径结尾的元素	//E	所有E元素，结果是所有三个E元素
//	所有路径以"//"后指定的子路径结尾的元素	//C/E	所有父节点为C的E元素，结果是id值为e1和e2的两个E元素
*	路径的通配符	/A/B/C/*	A元素→B元素→C元素下的所有子元素，即name值为b的B元素、id值为d1的D元素和id值为e1和e2的两个E元素
		///D	上面有两级节点的D元素，匹配结果是id值为d2的D元素
		//*	所有的元素
\|	逻辑或	//B \| //C	所有B元素和C元素

位置匹配
对于每一个元素，它的各个子元素是有序的。如：

举例	含义	匹配结果
/A/B/C[1]	A元素→B元素→C元素的第一个子元素	name值为b的B元素
/A/B/C[last()]	A元素→B元素→C元素的最后一个子元素	id值为e2的E元素
/A/B/C[position()>1]	A元素→B元素→C元素之下的位置号大于1的元素	id值为d1的D元素和两个具有id值的E元素

属性及属性
在XPath中可以利用属性及属性值来匹配元素，要注意的是，元素的属性名前要有"@"前缀。例如：

举例	含义	匹配结果
//B[@id]	所有具有属性id的B元素	id值为b1和b2的两个B元素
//B[@*]	所有具有属性的B元素	两个具有id属性的B元素和一个具有name属性B元素
//B[not(@*)]	所有不具有属性的B元素	A元素→C元素下的B元素
//B[@id="b1"]	id值为b1的B元素	A元素下的B元素

亲属关系匹配
XML文档可归结为树型结构，因此任何一个节点都不是孤立的。通常我们把节点之间的归属关系归结为一种亲属关系，如父亲、孩子、祖先、后代、兄弟等等。在对元素进行匹配时，同样可以用到这些概念。例如：

举例	含义	匹配结果
//E/parent::*	所有E节点的父节点元素	id值为a1的A元素和id值为c1的C元素
//F/ancestor::*	所有F元素的祖先节点元素	id值为a1的A元素和id值为c2的C元素
/A/child::*	A的子元素	id值为b1、b2的B元素，id值为c2的C元素，以及没有任何属性的E元素
/A/descendant::*	A的所有后代元素	除A元素以外的所有其它元素
//F/self::*	所有F的自身元素	F元素本身
//F/ancestor-or-self::*	所有F元素及它的祖先节点元素	F元素、F元素的父节点C元素和A元素
/A/C/descendant-or-self::*	所有A元素→C元素及它们的后代元素	id值为c2的C元素、该元素的子元素B、D、F元素
/A/C/following-sibling::*	A元素→C元素的紧邻的后序所有兄弟节点元素	没有任何属性的E元素
/A/C/preceding-sibling::*	A元素→C元素的紧邻的前面所有兄弟节点元素	id值为b1和b2的两个B元素
/A/B/C/following::*	A元素→B元素→C元素的后序的所有元素	id为b2的B元素、无属性的C元素、无属性的B元素、id为d2的D元素、无属性的F元素、无属性的E元素。
/A/C/preceding::*	A元素→C元素的前面的所有元素	id为b2的B元素、id为e2的E元素、id为e1的E元素、id为d1的D元素、name为b的B元素、id为c1的C元素、id为b1的B元素

条件匹配
条件匹配就是利用一些函数的运算结果的布尔值来匹配符合条件的节点。常用于条件匹配的函数有四大类：节点函数、字符串函数、数值函数、布尔函数。例如前面提到的last()、position()等等。这些功能函数可以帮助我们精确寻找需要的节点。

函数及功能作用

count()功能
统计计数，返回符合条件的节点的个数

number()功能
将属性的值中的文本转换为数值

substring() 功能

语法：substring(value, start, length)

截取字符串

sum()功能

求和

这些功能只是XPath语法中的一部分，还有大量的功能函数没有介绍，而且目前XPath的语法仍然在不断发展中。通过这些函数我们可以实现更加复杂的查询和操作。

以上这些匹配方法中，用得最多的还要数路径匹配。依靠给出相对于当前路径的子路径来定位节点的。

用SelectSingleNode()和SelectNodes()搜索结点

namespace ConsoleApplication1
{
    class Program
    {
        static void Main(string[] args)
        {
            XmlDocument doc = new XmlDocument();//建立文档对象
            try
            {
                doc.Load("http://www.cnblogs.com/myOrder.xml");
                XmlNode root = doc.DocumentElement;//获取文档的根节点
                XmlNode temp;
                temp = root.SelectSingleNode("姓名");
                Console.WriteLine("(查找1)" + temp);
                temp = root.SelectSingleNode("定购人信息/姓名");
                Console.WriteLine("(查找2)" + temp.Name+":"+temp.InnerText);
                temp = root.SelectSingleNode("订货信息/商品/品名");
                Console.WriteLine("(查找3)" + temp.Name + ":" + temp.InnerText);
                XmlNodeList templist = root.SelectNodes("订货信息/商品/品名");
                Console.WriteLine("(查找4)");
                foreach (XmlNode nodeinlist in templist)
                {
                    Console.WriteLine(nodeinlist.Name + ":" + nodeinlist.InnerText);
                }
            }
            catch (Exception ex)
            {
                Console.WriteLine(ex.Message);
            }
            Console.ReadLine();//辅助代码，用于保留控制台窗口
        }
    }
}

在xml搜索节点（两种方法）

namespace ConsoleApplication1
{
 class Program
 {
 static void Main(string[] args)
 {
 XmlDocument doc = new XmlDocument();//建立文档对象
 try
 {
 doc.Load("http://www.cnblogs.com/myOrder.xml");
 //在xmlDocument对象中搜索元素
 Console.WriteLine("");
 XmlNodeList myNodeList = doc.GetElementsByTagName("品名");
 for (int i = 0; i < myNodeList;i++ )
 {
 Console.WriteLine(myNodeList[i].Name+":"+myNodeList[i].InnerText);
 }
 //在xmlElement对象中搜索元素
 Console.WriteLine("在xmlElement对象中搜索元素");
 XmlElement myElement = doc.DocumentElement;
 myElement = (XmlElement)myElement.LastChild;
 myNodeList = myElement.GetElementsByTagName("品名");
 for (int i = 0; i < myNodeList; i++)
 {
 Console.WriteLine(myNodeList[i].Name + ":" + myNodeList[i].InnerText);

}
            }
            catch (Exception ex)
            {
                Console.WriteLine(ex.Message);
            }
            Console.ReadLine();//辅助代码，用于保留控制台窗口
        }
    }
}

利用XPath读取Xml文件的更多相关文章

XPath读取xml文件
1.创建解析工厂 2.创建解析器 3.读xml文件,生成w3c.docment对象树 4.创建XPath对象 5.通过路径查找对象例子: import javax.xml.parsers.Docum ...
利用dom4j读取xml文件
对于xml文件的读取,其实有很多方法,例如:SAX实现方法,DOM4J实现方法 ,DOM 实现方法,JDOM实现方法等等. 下面,我就说下dom4j的读取方法: 1.首先,肯定要引入第三方jar包. ...
菜鸟学Java（八）——dom4j详解之读取XML文件
dom4j是一个Java的XML API,类似于jdom,用来读写XML文件的.dom4j是一个非常非常优秀的Java XML API,具有性能优异.功能强大和极端易用使用的特点,同时它也是一个开放源 ...
Js读取XML文件为List结构
习惯了C#的List集合,对于Javascript没有list 极为不舒服,在一个利用Js读取XML文件的Demo中,决定自己构建List对象,将数据存入List. 第一步,Js读取XML文件知识 X ...
利用SAX解析读取XML文件
xml 这是我的第一个BLOG,今天在看<J2EE应用开发详解>一书,书中讲到XML编程,于是就按照书中的步骤自己测试了起来,可是怎么测试都不成功,后来自己查看了一遍源码,发现在读 ...
DOM4J读取XML文件
最近在做DRP的项目,其中涉及到了读取配置文件,用到了DOM4J,由于是刚开始接触这种读取xml文件的技术,好奇心是难免的,于是在网上又找了一些资料,这里就结合找到的资料来谈一下读取xml文件的4中方 ...
IE下JS读取xml文件示例代码
JS读取xml文件具体步骤为:创建DOM对象.加载xml文件(仅适用于IE)附示例代码,感兴趣的朋友可以参考下,希望对大家有所帮助使用javascript脚本读取xml文件,这里暂只考虑IE浏览器st ...
在java项目中怎样利用Dom4j解析XML文件获取数据
在曾经的学习.net时常常会遇到利用配置文件来解决项目中一些须要常常变换的数据.比方数据库的连接字符串儿等.这个时候在读取配置文件的时候.我们一般会用到一个雷configuration,通过这个类来进 ...
在C#中创建和读取XML文件
1.创建简单的XML文件为了便于测试,我们首先创建控制台应用程序,项目命名为CreateXml,Program.cs代码如下: 这样会在C盘根目录下创建data2.xml文件,文件内容为 using ...

随机推荐

系统集成之用户统一登录( LDAP + wso2 Identity Server)
本文场景: LDAP + wso2 Identity Server + asp.net声明感知场景 ,假定读者已经了解过ws-*协议族,及 ws-trust 和 ws-federation. 随着开 ...
JAVA swing中JPanel如何实现分组框的效果以及设置边框颜色分类： Java Game 2014-08-16 12:21 198人阅读评论(0) 收藏
代码如下: import java.awt.FlowLayout; import java.awt.Frame; import java.awt.GridLayout; import javax.sw ...
PIX的使用
这几天pix的一个问题可坑死我了,之前用的时候有蓝色的链接,点过去就可以查看相应资源,后来都是黑色的了没有可以点的链接. 看文档翻来翻去也没进展,后来找到了, 先打开render那个窗口这样even ...
ios 环境配置网址
http://blog.csdn.net/cwb1128/article/details/18019751
SOA之（1）——SOA架构基础概念
在深入探讨什么是面向服务的架构(SOA)之前,先建立一些基本的概念和术语的基本描述而非严格定义,所以也许有些定义在业内还存留争议,此处暂且忽略. 架构基础技术架构(Technology Archit ...
Scrum敏捷软件开发之技术实践——测试驱动开发TDD
重复无聊的定义测试驱动开发,英文全称Test-Driven Development,简称TDD,是一种不同于传统软件开发流程的新型的开发方法.它要求在编写某个功能的代码之前先编写测试代码,然后只编写 ...
结合NGUI做的手机拍照（可自定义相框）
原地址:http://www.unity蛮牛.com/thread-18220-1-1.html 在次此之前我们先要了解一下下面的我要讲的几个内容: 一.为什么要用NGUI,因为NGUI的可以做屏幕自 ...
jquery offset() 与position()方法的区别
jquery 中有两个获取元素位置的方法offset()和position(),这两个方法之间有什么异同?使用的时候应该注意哪些问题?什么时候使用offset(),什么时候又使用position()呢 ...
小圣求职记B：总集篇
1. 搜狐sohu 搜狐在正式招聘前邀请了部分应聘者到武汉研发中心开座谈会(因此简历尽量早投,机会多些),有研发的也有产品的,40人左右,座谈会期间介绍了搜狐汽车.北京研发中心.武汉研发中心和搜狐媒体 ...
Manacher算法 O(n) 求最长回文子串
转自:http://bbs.dlut.edu.cn/bbstcon.php?board=Competition&gid=23474 其实原文说得是比较清楚的,只是英文的,我这里写一份中文的吧. ...

利用XPath读取Xml文件

利用XPath读取Xml文件的更多相关文章

随机推荐

热门专题