Xpath—解决这个问题的良药
何为良药?
因为在XML中存在一些问题和缺陷,针对这些问题就产生了响应的解决方式。如:
getElementById方法在解析XML时因为一些原因适不适合的:
首先XML中每一个元素节点不一定有id属性。
其次XML中的两个元素节点可能有同样的id属性。这样getElementById这种方法就不再能保证找到我们须要的唯一节点了。
针对这个原因Xpath就诞生了。
Xpath是什么?
Xpath是怎样产生的呢?它存在的必要是什么呢?接下来就让我们一一解答自己心中的疑问:
首先Xpath全称是XML Path Language(XML路径语言)。适用于确定XML文档中某节点位置的语言。XPath是
W3C XSLT 标准的主要元素。而且 XQuery 和 XPointer 都构建于 XPath 表达之上。
因此。对 XPath 的理解是非常多高级 XML应用的基础。
我们能够把它当作类似于SQL一样的查询语言。通过给出的Xpath路径信息(就像SQL命令一样)就能够从XML中查找出符合条件的节点(就像从数据库中返回须要的数据一样)
Xpath怎样用?(XPath 路径表达式具体解释 )
一.路径表达式语法
1.路径 = 相对路径 |绝对路径
2.XPath路径表达式 =步进表达式 | 相对路径 "/"步进表达式。
3.步进表达式=轴 节点測试谓词
说明:
1.当中轴表示步进表达式选择的节点和当前上下文节点间的树状关系(层次关系),节点測试指定步进表达式选择的节点名称扩展名。谓词即相当于过滤表达式以进一步过滤细化节点集。
2.谓词能够是0个或多个。
多个多个谓词用逻辑操作符and。or连接。
取逻辑非用not()函数。请看一个典型的XPath查询表达式:/messages/message//child::node()[@id=0],当中/messages/message是路径(绝对路径以"/"開始),child::是轴表示在子节点下选择,node()是节点測试表示选择全部的节点。[@id=0]是谓词,表示选择全部有属性id而且值为0的节点。
二.相对/绝对路径
如果"/"处在XPath表达式开头则表示文档根元素(表达式中间作为分隔符用以切割每个步进表达式)如:/messages/message/subject是一种绝对路径表示法,它表明是从文档根開始查找节点。如果当前节点是在第一个message节点【/messages/message[1]】。则路径表达式subject(路径前没有"/")这样的表示法称为相对路径,表明从当前节点開始查找。
详细请见以下所述的"表达式上下文"。
三.表达式上下文
上下文事实上表示一种环境。
以明白当前XPath路径表达式处在什么样的环境下运行。比如相同一个路径表达式处在对根节点操作的环境和处在对某一个特定子节点操作的环境下运行所获得的结果可能是全然不一样的。
也就是说XPath路径表达式计算结果取决于它所处的上下文。
XPath上下文基本有下面几种:
1.当前节点(./):
如./sender表示选择当前节点下的sender节点集合(等同于以下所讲的"特定元素",如:sender)
2.父节点(../):
如../sender表示选择当前节点的父节点下的sender节点集合
3.根元素(/):
如/messages表示选择从文档根节点下的messages节点集合.
4.根节点(/*):
这里的*是代表全部节点,可是根元素仅仅有一个。所以这里表示根节点。/*的返回结果和/messages返回的结果一样都是messages节点。
5.递归下降(//):
如当前上下文是messages节点。则//sender将返回下面结果:
/messages//sender:
gkt1980@gmail.com
111@gmail.com
333@gmail.com
/messages/message[1]//sender:
gkt1980@gmail.com
111@gmail.com
我们能够看出XPath表达式返回的结果是:从当前节点開始递归步进搜索当前节点下的全部子节点找到满足条件的节点集。
6.特定元素
如sender:表示选择当前节点下的sender节点集合,等同于(./sender)
注意:在运行XPath时一定要注意上下文。
即当前是在哪个节点下运行XPath表达式。这在XMLDOM中非常重要。
如:在XMLDOM中的selectNodes,selectSingleNode方法的參数都是一个XPath表达式,此时这个XPath表达式的运行上下文就是调用这种方法的节点及它所在的环境。
长处:
在IE6.0及其以上版本号中我们能够使用相同的方式来訪问随意深度的XML数据,这给XML数据的解析操作带来了便利。
缺点:
在Firefox等浏览器中。则是使用了w3c标准的Xpath处理方式。没有IE这么简单的方式。
Xpath—解决这个问题的良药的更多相关文章
- python学习之——selenium元素定位
web自动化测试按步骤拆分,可以分为四步操作:定位元素,操作元素,获取返回结果,断言(返回结果与期望结果是否一致),最后自动出测试报告. 其中定位元素尤为关键,此篇是使用webdriver通过页面各个 ...
- 【PHP对XML文件的操作技术【完整版】】
无论是c/c++还是java.c#均有对XML文件操作的技术,PHP对XML文件的操作的技术主要有三种: DOM.XPath.SimpleXml. 一.DOM DOM:Document Object ...
- Selenium2+python自动化6-八种元素元素定位(Firebug和firepath)
前言 自动化只要掌握四步操作:获取元素,操作元素,获取返回结果,断言(返回结果与期望结果是否一致),最后自动出测试报告.本篇主要讲如何用firefox辅助工具进行元素定位. 元素定位在这四个环节中是至 ...
- selenium+python自动化之元素定位
自动化按步骤拆分的话,可以分为四步操作:定位元素,操作元素,获取返回结果,断言(返回结果与期望结果是否一致),最后自动出测试报告.本篇接下来讲基本的八种元素定位方法.说的通俗一点,就是教大家找对象. ...
- 深入理解AngularJs-scope(一)
进入正文前的说明:本文中的示例代码并非AngularJs源码,而是来自书籍<<Build Your Own AngularJs>>, 这本书的作者仅依赖jquery和lodas ...
- python+selenium自动化软件测试(第2章):WebDriver API
2.1 操作元素基本方法 前言前面已经把环境搭建好了,从这篇开始,正式学习selenium的webdriver框架.我们平常说的 selenium自动化,其实它并不是类似于QTP之类的有GUI界面的可 ...
- selenium python 一些操作和定位收集
(—)滚动条操作 python中selenium操作下拉滚动条方法汇总 selenium_webdriver(python)控制浏览器滚动条 selenium+Python(select定位) Sel ...
- 自动化测试-3.selenium8种常用元素定位
自动化只要掌握四步操作:获取元素,操作元素,获取返回结果,断言(返回结果与期望结果是否一致),最后自动出测试报告.本篇主要讲如何用firefox辅助工具进行元素定位. 元素定位在这四个环节中是至关重要 ...
- Selenium2+python自动化-八种元素定位(Firebug和Firepath)
前言 自动化只要掌握四步操作:获取元素,操作元素,获取返回结果,断言(返回结果与期望结果是否一致),最后自动出测试报告.本篇主要讲如何用firefox辅助工具进行元素定位.元素定位在这四个环节中 ...
随机推荐
- 内置函数filter和map
filter filter()函数接收一个函数 f 和一个list,这个函数 f 的作用是对每个元素进行判断,返回 True或 False,filter()根据判断结果自动过滤掉不符合条件的元素,返回 ...
- js hover 下拉框
<div class="box"> <div class="a f">111111</div> <div class= ...
- 普通平衡树(treap)
题干:6种操作: 1. 插入x数 2. 删除x数(若有多个相同的数,因只删除一个) 3. 查询x数的排名(若有多个相同的数,因输出最小的排名) 4. 查询排名为x的数 5. 求x的前驱(前驱定义为小于 ...
- Properties类操作.properties配置文件方法总结
一.properties文件 Properties文件是java中很常用的一种配置文件,文件后缀为“.properties”,属文本文件,文件的内容格式是“键=值”的格式,可以用“#”作为注释,jav ...
- Linux中vim编辑器常用命令
移动光标 Ctrl+f:屏幕向下移动一页,相当于[Page Down]按键Ctrl+b:屏幕向上移动一页,相当与[PageUp]按键 0或功能键[Home]:数字‘0’:移动到这一行的最前面的字符处$ ...
- 分享一款非常好用的Fatkun图片批量下载工具
Fatkun图片批量下载 相信大家一定遇到过有着大量精美图片的网页,譬如美女照片.各种壁纸.设计素材.甚至是1024套图等等,但常常几十上百张的图要一张张手工去点击下载实在能让人抓狂!小编的工作中也常 ...
- 基于flask的网页聊天室(四)
基于flask的网页聊天室(四) 前言 接前天的内容,今天完成了消息的处理 具体内容 上次使用了flask_login做用户登录,但是直接访问login_requare装饰的函数会报401错误,这里可 ...
- python 装饰器模拟京东登陆
要求: 1.三个页面:主页面(home).书店(book).金融页面(finance)2.有两种登陆方式:主页面和书店页面使用京东账户登陆,金融页面使用微信账户登录2.输入:1 ,进入主页面,以此类推 ...
- Linux mint xfce 19 使用记录
创建系统快照 创建系统快照是 Linux Mint 19 的重要建议,可以使用与更新管理器捆绑的 Timeshift 应用程序轻松完成创建与恢复. 这个阶段很重要,万一出现令人遗憾的事件,比如安装破坏 ...
- 3.3.2 使用 cut 选定字段
cut 命令是用来剪下文本文件里的数据,文本文件可以是字段类型或是字符类型.后一种数据类型在遇到需要从文件里剪下特定的列时,特别方便.请注意:一个制表字符在此被视为单个字符. ...