XPath是一种节点查找手段,对比之前使用标准DOM去查找XML中的节点方式,大大降低了查找难度,方便开发者使用。但是,DOM3级以前的标准并没有就XPath做出规范;直到DOM3在首次推荐到标准规范行列。大部分浏览器实现了这个标准,IE则以自己的方式实现了XPath。

 

一.IE中的XPath

在IE8及之前的浏览器,XPath是采用内置基于ActiveX的XML DOM文档对象实现的。在每一个节点上提供了两个方法:selectSingleNode()和selectNodes()。

selectSingleNode()方法接受一个XPath模式(也就是查找路径),找到匹配的第一个节点并将它返回,没有则返回null。

var user = xmlDom.selectSingleNode('root/user'); //得到第一个user节点

alert(user.xml); //查看xml序列

alert(user.tagName); //节点元素名

alert(user.firstChild.nodeValue); //节点内的值

上下文节点:我们通过xmlDom这个对象实例调用方法,而xmlDom这个对象实例其实就是一个上下文节点,这个节点指针指向的是根,也就是root元素之前。那么如果我们把这个指针指向user元素之前,那么结果就会有所变化。

//通过xmlDom,并且使用root/user的路径

var user = xmlDom.selectSingleNode('root/user');

alert(user.tagName); //user

//通过xmlDom.documentElement,并且使用user路径,省去了root

var user = xmlDom.documentElement.selectSingleNode('user');

alert(user.tagName); //user

//通过xmlDom,并且使用user路径,省去了root

var user = xmlDom.selectSingleNode('user');

alert(user.tagName); //找不到了,出错

PS:xmlDom和xmlDom.documentElement都是上下文节点,主要就是定位当前路径查找的指针,而xmlDom对象实例的指针就是在最根上。

XPath常用语法

//通过user[n]来获取第n+1条节点,PS:XPath其实是按1为起始值的

var user = xmlDom.selectSingleNode('root/user[1]');

alert(user.xml);

//通过text()获取节点内的值

var user = xmlDom.selectSingleNode('root/user/text()');

alert(user.xml);

alert(user.nodeValue);

//通过//user表示在整个xml获取到user节点,不关心任何层次

var user = xmlDom.selectSingleNode('//user');

alert(user.xml);

//通过root//user表示在root包含的层次下获取到user节点,在root内不关心任何层次

var user = xmlDom.selectSingleNode('root//user');

alert(user.tagName);

//通过root/user[@id=6]表示获取user中id=6的节点

var user = xmlDom.selectSingleNode('root/user[@id=6]');

alert(user.xml);

PS:更多的XPath语法,可以参考XPath手册或者XML DOM手册进行参考,这里只提供了最常用的语法。

selectSingleNode()方法是获取单一节点,而selectNodes()方法则是获取一个节点集合。

var users = xmlDom.selectNodes('root/user'); //获取user节点集合

alert(users.length);

alert(users[1].xml);

 

二.W3C下的XPath

在DOM3级XPath规范定义的类型中,最重要的两个类型是XPathEvaluator和XPathResult。其中,XPathEvaluator用于在特定上下文对XPath表达式求值。

XPathEvaluator的方法

方法

说明

createExpression(e, n)

将XPath表达式及命名空间转化成XPathExpression

createNSResolver(n)

根据n命名空间创建一个新的XPathNSResolver对象

evaluate(e, c, n ,t ,r)

结合上下文来获取XPath表达式的值

W3C实现XPath查询节点比IE来的复杂,首先第一步就是需要得到XPathResult对象的实例。得到这个对象实例有两种方法,一种是通过创建XPathEvaluator对象执行evaluate()方法,另一种是直接通过上下文节点对象(比如xmlDom)来执行evaluate()方法。

//使用XPathEvaluator对象创建XPathResult

var eva = new XPathEvaluator();

var result = eva.evaluate('root/user', xmlDom, null,

XPathResult.ORDERED_NODE_ITERATOR_TYPE, null);

alert(result);

//使用上下文节点对象(xmlDom)创建XPathResult

var result = xmlDom.evaluate('root/user', xmlDom, null,

XPathResult.ORDERED_NODE_ITERATOR_TYPE, null);

alert(result);

相对而言,第二种简单方便一点,但evaluate方法有五个属性:1.XPath路径、2.上下文节点对象、3.命名空间求解器(通常是null)、4.返回结果类型、5保存结果的XPathResult对象(通常是null)。

对于返回的结果类型,有10中不同的类型

常量

说明

XPathResult.ANY_TYPE

返回符合XPath表达式类型的数据

XPathResult.ANY_UNORDERED_NODE_TYPE

返回匹配节点的节点集合,但顺序可能与文档中的节点的顺序不匹配

XPathResult.BOOLEAN_TYPE

返回布尔值

XPathResult.FIRST_ORDERED_NODE_TYPE

返回只包含一个节点的节点集合,且这个节点是在文档中第一个匹配的节点

XPathResult.NUMBER_TYPE

返回数字值

XPathResult.ORDERED_NODE_ITERATOR_TYPE

返回匹配节点的节点集合,顺序为节点在文档中出现的顺序。这是最常用到的结果类型

XPathResult.ORDERED_NODE_SNAPSHOT_TYPE

返回节点集合快照,在文档外捕获节点,这样将来对文档的任何修改都不会影响这个节点列表

XPathResult.STRING_TYPE

返回字符串值

XPathResult.UNORDERED_NODE_ITERATOR_TYPE

返回匹配节点的节点集合,不过顺序可能不会按照节点在文档中出现的顺序排列

XPathResult.UNORDERED_NODE_SNAPSHOT_TYPE

返回节点集合快照,在文档外捕获节点,这样将来对文档的任何修改都不会影响这个节点列表

PS:上面的常量过于繁重,对于我们只需要学习了解,其实也就需要两个:1.获取一个单一节、2.获取一个节点集合。

1.获取一个单一节点

var result = xmlDom.evaluate('root/user', xmlDom, null,

XPathResult.FIRST_ORDERED_NODE_TYPE, null);

if (result !== null) {

alert(result.singleNodeValue.tagName); //singleNodeValue属性得到节点对象

}

2.获取节点集合

var result = xmlDom.evaluate('root/user', xmlDom, null,

XPathResult.ORDERED_NODE_ITERATOR_TYPE, null);

var nodes = [];

if (result !== null) {

while ((node = result.iterateNext()) !== null) {

nodes.push(node);

}

}

PS:节点集合的获取方式,是通过迭代器遍历而来的,我们保存到数据中就模拟出IE相似的风格。

 

三.XPath跨浏览器兼容

如果要做W3C和IE的跨浏览器兼容,我们要思考几个问题:1.如果传递一个节点的下标,IE是从0开始计算,W3C从1开始计算,可以通过传递获取下标进行增1减1的操作来进行。2.独有的功能放弃,为了保证跨浏览器。3.只获取单一节点和节点列表即可,基本可以完成所有的操作。

//跨浏览器获取单一节点

function selectSingleNode(xmlDom, xpath) {

var node = null;

if (typeof xmlDom.evaluate != 'undefined') {

var patten = /\[(\d+)\]/g;

var flag = xpath.match(patten);

var num = 0;

if (flag !== null) {

num = parseInt(RegExp.$1) + 1;

xpath = xpath.replace(patten, '[' + num + ']');

}

var result = xmlDom.evaluate(xpath, xmlDom, null,

XPathResult.FIRST_ORDERED_NODE_TYPE, null);

if (result !== null) {

node = result.singleNodeValue;

}

} else if (typeof xmlDom.selectSingleNode != 'undefined') {

node = xmlDom.selectSingleNode(xpath);

}

return node;

}

//跨浏览器获取节点集合

function selectNodes(xmlDom, xpath) {

var nodes = [];

if (typeof xmlDom.evaluate != 'undefined') {

var patten = /\[(\d+)\]/g;

var flag = xpath.match(patten);

var num = 0;

if (flag !== null) {

num = parseInt(RegExp.$1) + 1;

xpath = xpath.replace(patten, '[' + num + ']');

}

var node = null;

   var result = xmlDom.evaluate('root/user', xmlDom, null,

XPathResult.ORDERED_NODE_ITERATOR_TYPE, null);

   if (result !== null) {

   while ((node = result.iterateNext()) !== null) {

   nodes.push(node);

   }

    }

} else if (typeof xmlDom.selectNodes != 'undefined') {

nodes = xmlDom.selectNodes(xpath);

}

return nodes;

}

PS:在传递xpath路径时,没有做验证判断是否合法,有兴趣的同学可以自行完成。在XML还有一个重要章节是XSLT和EX4,由于在使用频率的缘故,我们暂且搁置。

JavaScript(第三十天)【XPath】的更多相关文章

  1. BizTalk开发系列(三十四) Xpath

    XPath 是在 XML 文档中查找信息的语言,在BizTalk的开发中应用非常广泛,当然你可以不必先学Xpath再去学BizTalk.但是如果对Xpath有一定了解的 话,在很多应用下会使你的开发更 ...

  2. 第三百三十九节,Python分布式爬虫打造搜索引擎Scrapy精讲—Scrapy启动文件的配置—xpath表达式

    第三百三十九节,Python分布式爬虫打造搜索引擎Scrapy精讲—Scrapy启动文件的配置—xpath表达式 我们自定义一个main.py来作为启动文件 main.py #!/usr/bin/en ...

  3. 第三百三十六节,web爬虫讲解2—urllib库中使用xpath表达式—BeautifulSoup基础

    第三百三十六节,web爬虫讲解2—urllib库中使用xpath表达式—BeautifulSoup基础 在urllib中,我们一样可以使用xpath表达式进行信息提取,此时,你需要首先安装lxml模块 ...

  4. 《手把手教你》系列技巧篇(三十九)-java+ selenium自动化测试-JavaScript的调用执行-上篇(详解教程)

    1.简介 在做web自动化时,有些情况selenium的api无法完成,需要通过第三方手段比如js来完成实现,比如去改变某些元素对象的属性或者进行一些特殊的操作,本文将来讲解怎样来调用JavaScri ...

  5. JavaScript 获取 当前日期和三十天以前日期

    //获取当前日期 var myDate = new Date(); var nowY = myDate.getFullYear(); var nowM = myDate.getMonth()+1; v ...

  6. Bootstrap <基础三十二>模态框(Modal)插件

    模态框(Modal)是覆盖在父窗体上的子窗体.通常,目的是显示来自一个单独的源的内容,可以在不离开父窗体的情况下有一些互动.子窗体可提供信息.交互等. 如果您想要单独引用该插件的功能,那么您需要引用  ...

  7. Web 开发人员和设计师必读文章推荐【系列三十】

    <Web 前端开发精华文章推荐>2014年第9期(总第30期)和大家见面了.梦想天空博客关注 前端开发 技术,分享各类能够提升网站用户体验的优秀 jQuery 插件,展示前沿的 HTML5 ...

  8. Bootstrap入门(三十)JS插件7:警告框

    Bootstrap入门(三十)JS插件7:警告框 通过这个插件可以为警告信息添加点击以及消失的功能. 当使用一个.close按钮,它必须是第一个子元素.alert-dismissible,并没有文字内 ...

  9. 第三百三十五节,web爬虫讲解2—Scrapy框架爬虫—豆瓣登录与利用打码接口实现自动识别验证码

    第三百三十五节,web爬虫讲解2—Scrapy框架爬虫—豆瓣登录与利用打码接口实现自动识别验证码 打码接口文件 # -*- coding: cp936 -*- import sys import os ...

随机推荐

  1. Luogu3118:[USACO15JAN]Moovie Mooving

    题面 传送门 Sol 设\(f[S]\)表示看过的电影集合为\(S\),当前电影的最大结束时间 枚举电影和电影的开始时间转移 可以对开始时间\(sort\) 二分一下转移即可 # include &l ...

  2. Poj3321 Apple tree

    翻译: 卡卡屋前有一株苹果树,每年秋天,树上长了许多苹果.卡卡很喜欢苹果.树上有N个节点,卡卡给他们编号1到N,根的编号永远是1.每个节点上最多结一个苹果.卡卡想要了解某一个子树上一共结了多少苹果. ...

  3. RBM如何训练?

    RBM(Restricted Boltzman Machine,受限玻尔兹曼机)是深度学习的基础,虽然原理比较简单,但实际训练中用到了很多trick,在参考文献中,Hinton为我们披露了几个训练的细 ...

  4. 开发中使用mongoTemplate进行Aggregation聚合查询

    笔记:使用mongo聚合查询(一开始根本没接触过mongo,一点一点慢慢的查资料完成了工作需求) 需求:在订单表中,根据buyerNick分组,统计每个buyerNick的电话.地址.支付总金额以及总 ...

  5. RPC vs RESTful

    在微服务中,使用什么协议来构建服务体系,一直是个热门话题. 争论的焦点集中在两个候选技术: (binary) RPC or Restful. 以Apache Thrift为代表的二进制RPC,支持多种 ...

  6. BaaS 的由来(1)

    百度百科是这么定义的, BaaS(后端即服务:Backend as a Service)公司为移动应用开发者提供整合云后端的边界服务.其实不仅是移动应用,现在更多的PC应用也同样适用移动端的标准. 在 ...

  7. ZOJ3946:Highway Project(最短路变形)

    本文转载自:http://www.javaxxz.com/thread-359442-1-1.html Edward, the emperor of the Marjar Empire, wants ...

  8. 转: web 页面加载速度优化实战-100% 的飞跃提升

    前言 一个网站的加载速度有多重要? 反正我相信之前来 博主网站 的人至少有 50% 在加载完成前关闭了本站. 为啥捏? 看图 首页完整加载时间 8.18s,看来能进来看博主网站的人都是真爱呀,哈哈. ...

  9. 自签名证书和私有CA签名的证书的区别 创建自签名证书 创建私有CA 证书类型 证书扩展名【转】

    自签名的证书无法被吊销,CA签名的证书可以被吊销 能不能吊销证书的区别在于,如果你的私钥被黑客获取,如果证书不能被吊销,则黑客可以伪装成你与用户进行通信   如果你的规划需要创建多个证书,那么使用私有 ...

  10. HDFS基本原理总结

    HDFS由三个基本组件组成:NameNode,SecondaryName,DataNode,其思想类似于Linux的文件系统,可以进行类比. 1.NameNode介绍: 1.管理整个文件系统的命名空间 ...