Xpath—解决这个问题的良药
何为良药?
因为在XML中存在一些问题和缺陷,针对这些问题就产生了响应的解决方式。如:
getElementById方法在解析XML时因为一些原因适不适合的:
首先XML中每一个元素节点不一定有id属性。
其次XML中的两个元素节点可能有同样的id属性。这样getElementById这种方法就不再能保证找到我们须要的唯一节点了。
针对这个原因Xpath就诞生了。
Xpath是什么?
Xpath是怎样产生的呢?它存在的必要是什么呢?接下来就让我们一一解答自己心中的疑问:
首先Xpath全称是XML Path Language(XML路径语言)。适用于确定XML文档中某节点位置的语言。XPath是
W3C XSLT 标准的主要元素。而且 XQuery 和 XPointer 都构建于 XPath 表达之上。
因此。对 XPath 的理解是非常多高级 XML应用的基础。
我们能够把它当作类似于SQL一样的查询语言。通过给出的Xpath路径信息(就像SQL命令一样)就能够从XML中查找出符合条件的节点(就像从数据库中返回须要的数据一样)
Xpath怎样用?(XPath 路径表达式具体解释 )
一.路径表达式语法
1.路径 = 相对路径 |绝对路径
2.XPath路径表达式 =步进表达式 | 相对路径 "/"步进表达式。
3.步进表达式=轴 节点測试谓词
说明:
1.当中轴表示步进表达式选择的节点和当前上下文节点间的树状关系(层次关系),节点測试指定步进表达式选择的节点名称扩展名。谓词即相当于过滤表达式以进一步过滤细化节点集。
2.谓词能够是0个或多个。
多个多个谓词用逻辑操作符and。or连接。
取逻辑非用not()函数。请看一个典型的XPath查询表达式:/messages/message//child::node()[@id=0],当中/messages/message是路径(绝对路径以"/"開始),child::是轴表示在子节点下选择,node()是节点測试表示选择全部的节点。[@id=0]是谓词,表示选择全部有属性id而且值为0的节点。
二.相对/绝对路径
如果"/"处在XPath表达式开头则表示文档根元素(表达式中间作为分隔符用以切割每个步进表达式)如:/messages/message/subject是一种绝对路径表示法,它表明是从文档根開始查找节点。如果当前节点是在第一个message节点【/messages/message[1]】。则路径表达式subject(路径前没有"/")这样的表示法称为相对路径,表明从当前节点開始查找。
详细请见以下所述的"表达式上下文"。
三.表达式上下文
上下文事实上表示一种环境。
以明白当前XPath路径表达式处在什么样的环境下运行。比如相同一个路径表达式处在对根节点操作的环境和处在对某一个特定子节点操作的环境下运行所获得的结果可能是全然不一样的。
也就是说XPath路径表达式计算结果取决于它所处的上下文。
XPath上下文基本有下面几种:
1.当前节点(./):
如./sender表示选择当前节点下的sender节点集合(等同于以下所讲的"特定元素",如:sender)
2.父节点(../):
如../sender表示选择当前节点的父节点下的sender节点集合
3.根元素(/):
如/messages表示选择从文档根节点下的messages节点集合.
4.根节点(/*):
这里的*是代表全部节点,可是根元素仅仅有一个。所以这里表示根节点。/*的返回结果和/messages返回的结果一样都是messages节点。
5.递归下降(//):
如当前上下文是messages节点。则//sender将返回下面结果:
/messages//sender:
gkt1980@gmail.com
111@gmail.com
333@gmail.com
/messages/message[1]//sender:
gkt1980@gmail.com
111@gmail.com
我们能够看出XPath表达式返回的结果是:从当前节点開始递归步进搜索当前节点下的全部子节点找到满足条件的节点集。
6.特定元素
如sender:表示选择当前节点下的sender节点集合,等同于(./sender)
注意:在运行XPath时一定要注意上下文。
即当前是在哪个节点下运行XPath表达式。这在XMLDOM中非常重要。
如:在XMLDOM中的selectNodes,selectSingleNode方法的參数都是一个XPath表达式,此时这个XPath表达式的运行上下文就是调用这种方法的节点及它所在的环境。
长处:
在IE6.0及其以上版本号中我们能够使用相同的方式来訪问随意深度的XML数据,这给XML数据的解析操作带来了便利。
缺点:
在Firefox等浏览器中。则是使用了w3c标准的Xpath处理方式。没有IE这么简单的方式。
Xpath—解决这个问题的良药的更多相关文章
- python学习之——selenium元素定位
web自动化测试按步骤拆分,可以分为四步操作:定位元素,操作元素,获取返回结果,断言(返回结果与期望结果是否一致),最后自动出测试报告. 其中定位元素尤为关键,此篇是使用webdriver通过页面各个 ...
- 【PHP对XML文件的操作技术【完整版】】
无论是c/c++还是java.c#均有对XML文件操作的技术,PHP对XML文件的操作的技术主要有三种: DOM.XPath.SimpleXml. 一.DOM DOM:Document Object ...
- Selenium2+python自动化6-八种元素元素定位(Firebug和firepath)
前言 自动化只要掌握四步操作:获取元素,操作元素,获取返回结果,断言(返回结果与期望结果是否一致),最后自动出测试报告.本篇主要讲如何用firefox辅助工具进行元素定位. 元素定位在这四个环节中是至 ...
- selenium+python自动化之元素定位
自动化按步骤拆分的话,可以分为四步操作:定位元素,操作元素,获取返回结果,断言(返回结果与期望结果是否一致),最后自动出测试报告.本篇接下来讲基本的八种元素定位方法.说的通俗一点,就是教大家找对象. ...
- 深入理解AngularJs-scope(一)
进入正文前的说明:本文中的示例代码并非AngularJs源码,而是来自书籍<<Build Your Own AngularJs>>, 这本书的作者仅依赖jquery和lodas ...
- python+selenium自动化软件测试(第2章):WebDriver API
2.1 操作元素基本方法 前言前面已经把环境搭建好了,从这篇开始,正式学习selenium的webdriver框架.我们平常说的 selenium自动化,其实它并不是类似于QTP之类的有GUI界面的可 ...
- selenium python 一些操作和定位收集
(—)滚动条操作 python中selenium操作下拉滚动条方法汇总 selenium_webdriver(python)控制浏览器滚动条 selenium+Python(select定位) Sel ...
- 自动化测试-3.selenium8种常用元素定位
自动化只要掌握四步操作:获取元素,操作元素,获取返回结果,断言(返回结果与期望结果是否一致),最后自动出测试报告.本篇主要讲如何用firefox辅助工具进行元素定位. 元素定位在这四个环节中是至关重要 ...
- Selenium2+python自动化-八种元素定位(Firebug和Firepath)
前言 自动化只要掌握四步操作:获取元素,操作元素,获取返回结果,断言(返回结果与期望结果是否一致),最后自动出测试报告.本篇主要讲如何用firefox辅助工具进行元素定位.元素定位在这四个环节中 ...
随机推荐
- CPP-STL:vector容器
1. vector容器简介: vector向量容器是一种随机访问的数组类型,它提供了对数组元素的快速访问.随机访问,以及在序列尾部快速.随机地插入和删除操作.它类似于数据结构中的队列.数组和堆 ...
- win10x64下的redis安装与使用
先引用百度百科的一段话吧,具体可以到百科查看吧. Redis是一个开源的使用ANSI C语言编写.支持网络.可基于内存亦可持久化的日志型.Key-Value数据库,并提供多种语言的API.从2010年 ...
- JavaEE-06 Servlet基础
学习要点 Servlet生命周期 Servlet API的常用接口和类 Servlet的部署和配置 Servlet处理用户请求 Servlet JSP回顾 JSP技术开发web应用在服务器端生成网页的 ...
- luogu P1455 搭配购买
题目描述 明天就是母亲节了,电脑组的小朋友们在忙碌的课业之余挖空心思想着该送什么礼物来表达自己的心意呢?听说在某个网站上有卖云朵的,小朋友们决定一同前往去看看这种神奇的商品,这个店里有n朵云,云朵已经 ...
- rc-local.service服务启动失败,导致rc.local中的开机启动服务不能启动
chmod +x /etc/rc.d/rc.local 打开/etc/rc.local文件,将启动非后台执行的指令的最后添加 &,以使相关指令后台运行,然后启动服务 systemctl ...
- 条款22:将成员变量声明为private(Declare data members private)
NOTE: 1.切记将成员变量声明为private.这可赋予客户访问数据的一致性 可细微划分访问控制 允诺约束条件获得保证,并提供class作者以充分的实现弹性. 2.protected 并不比pub ...
- Mysql ICP(翻译)
英文版原文链接 https://mariadb.com/kb/en/library/index-condition-pushdown/ ICP 全称 Index Condition Pushdown. ...
- python中unicode, hex, bin之间的转换
python中unicode, hex, bin之间的转换 背景 在smb中有个feature change notify, 需要改动文件权限dacl,然后确认是否有收到notify.一直得不到这个d ...
- win10修改文件管理器默认打开我的电脑
- POJ 1383 Labyrinth (树的直径求两点间最大距离)
Description The northern part of the Pyramid contains a very large and complicated labyrinth. The la ...