贴几个我学习Xpath的参考

1 基本使用的参考

XPath学习:基本语法(一)

2 较为详细且清晰例子参考,推荐

XPath 详解,总结

3 详细语法参考

Xpath语法格式整理

4 官方参考

XPath 教程

5 XSD (xml Schema Definition)

XML中有几种符号需要使用转义字符,分别是:

实体值字符串 特殊字符

&     &

&lt;       <

&gt;      >

&quot;     "

&apos;     '

说明:

1、实体的引用过到“&”来引用,末尾要加“;”。

2、XML文档中,以上5个特殊字符以实体值字符串形式出现。

自己用过的例子:

1 查找VirtualMachineSnapshotInfo节点下,任意一个VirtualMachineSnapshot节点
VirtualMachineSnapshotInfo//VirtualMachineSnapshot
2 选择多个并列的路径,用“|”
VirtualMachineSnapshotInfo//id|VirtualMachineSnapshotInfo//name
3 选取节点值为某某的节点,并取该节点的父节点的相关值
/A/B[.='AAA']
VirtualMachineSnapshotInfo//VirtualMachineSnapshot[.='snapshot-2309']/parent::node()/id

其中//VirtualMachineSnapshot[.='snapshot-2309']是获取VirtualMachineSnapshot节点为snapshot-2309的节点

//VirtualMachineSnapshot[VirtualMachineSnapshot='snapshot-2309']

4 获取属性的值

<entry id="000000000000002">
<field name="EsxiName">10.200.236.4</field>
</entry>

要获取上面的id值,需用://entry//@id

5 xpath解析带命名空间前缀的xml

样例xml如下,需要解析出Time Machine的值:

<bk:BookStore xmlns:bk="http://www.bookstore.com/book#">
    <bk:Books>
        <bk:Book id=">Time Machine</bk:Book>
    </bk:Books>
</bk:BookStore>        

解析方法:

/*/*[name()='bk:Books']/*[name()='bk:Book' and text()='Time Machine']

6 使用[]过滤当前节点的内容

如下,样例xml中有多个类似如下结构的内容,需要根据给定的name,解析id的值

<result>
  <ax256:addressPools xmlns:ax256="http://dto.bcan.bmc.com/xsd" xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance" xsi:type="ax256:ContainerAddressPoolDTO">
    <ax256:acquiredFlag>true</ax256:acquiredFlag>
    <ax256:condition xsi:nil="true" />
    <ax256:dnsInfo xsi:type="ax256:DNSInfoDTO">
      <ax256:primaryDnsServer />
      <ax256:primaryDomainSuffixForNic />
      <ax256:reverseDnsServer />
      <ax256:reverseDnsZone />
      <ax256:secondaryDnsServer />
    </ax256:dnsInfo>
    <ax256:endAddress>10.200.160.254</ax256:endAddress>
    <ax256:freeAddressCount></ax256:freeAddressCount>
    <ax256:gatewayAddress>10.200.160.254</ax256:gatewayAddress>
    <ax256:id>CD11D561-DBEA--B51A-5761F977FAFA</ax256:id>
    <ax256:linkId></ax256:linkId>
    <ax256:name>ZH_Vlan160 Address Pool</ax256:name>
    <ax256:natPoolName xsi:nil="true" />
    <ax256:poolAddress>10.200.160.0</ax256:poolAddress>
    <ax256:poolMask>255.255.255.0</ax256:poolMask>
    <ax256:publicFlag>false</ax256:publicFlag>
    <ax256:rangeName xsi:nil="true" />
    <ax256:spaceName>ZH_Vlan160 Address Space</ax256:spaceName>
    <ax256:startAddress>10.200.160.1</ax256:startAddress>
    <ax256:totalAddressCount></ax256:totalAddressCount>
    <ax256:usedAddressCount></ax256:usedAddressCount>
  </ax256:addressPools>
</result>

解析方法:

//*[name()='ax256:addressPools']/.[*="ZH_Vlan160 Address Pool"]/*[name()='ax256:id'])

 7 多个相同的父节点,根据父节点的子节点信息定位某个父节点

<returnval>
      <HostSystem>host-1503</HostSystem>
      <propSet>
        <name>hardware.memorySize</name>
        <val>412243603456</val>
      </propSet>
      <propSet>
        <name>summary.quickStats.overallMemoryUsage</name>
        <val>395960123392</val>
      </propSet>
      <propSet>
        <name>systemResources.config.memoryAllocation.reservation</name>
        <val>392761</val>
      </propSet>
</returnval>

如果我想获取黄色部分的值,则可以如下解析:

//returnval/propSet[./name='hardware.memorySize']/val

Xpath语法学习的更多相关文章

  1. Xpath语法学习记录

    高级参考:https://blog.csdn.net/wudaoshihun/article/details/82226122 举例: 1 <!DOCTYPE html> 2 <ht ...

  2. Python爬虫利器三之Xpath语法与lxml库的用法

    前面我们介绍了 BeautifulSoup 的用法,这个已经是非常强大的库了,不过还有一些比较流行的解析库,例如 lxml,使用的是 Xpath 语法,同样是效率比较高的解析方法.如果大家对 Beau ...

  3. Xpath语法-爬虫(一)

    前言 这一章节主要讲解Xpath的基础语法,学习如何通过Xpath获取网页中我们想要的内容;为我们的后面学习Java网络爬虫基础准备工作. 备注:此章节为基础核心章节,未来会在网络爬虫的数据解析环节经 ...

  4. Xpath语法与lxml库的用法

    BeautifulSoup 已经是非常强大的库了,不过还有一些比较流行的解析库,例如 lxml,使用的是 Xpath 语法,同样是效率比较高的解析方法. 1.安装 pip install lxml 2 ...

  5. xpath语法速查

    xpath的具体学习可以通过w3c查看(链接:http://www.w3school.com.cn/xpath/index.asp) 这里只是将平时用到的几个表格贴出来,以后查询: 这里的xpath我 ...

  6. 网页结构的简介和Xpath语法的入门教程

    相信很多小伙伴已经听说过Xpath,之前小编也写过一篇关于Xpath的文章,感兴趣的小伙伴可以戳这篇文章如何利用Xpath抓取京东网商品信息以及Python网络爬虫四大选择器(正则表达式.BS4.Xp ...

  7. Golang 语法学习笔记

    Golang 语法学习笔记 包.变量和函数. 包 每个 Go 程序都是由包组成的. 程序运行的入口是包 main. 包名与导入路径的最后一个目录一致."math/rand" 包由 ...

  8. Swift高级语法学习总结(转)

    Swift高级语法学习总结 1.函数 1.1 func funcNmae()->(){} 这样就定义了一个函数,它的参数为空,返回值为空,如果有参数和返回值直接写在两个括号里就可以了 1.2 参 ...

  9. Swift基础语法学习总结(转)

    Swift基础语法学习总结 1.基础  1.1) swift还是使用// 和/* */ 来注释,并且/* */允许多行注释. 1.2) swift使用print和println打印,它的传参是一个泛型 ...

随机推荐

  1. 使用ajax调用webservice加载table

    写了个ajax调用webservice动态加载表格的案例 不废话直接上代码 webservice代码: /// <summary> /// 首页显示会员信息 /// </summar ...

  2. CSS3 动画 cheatsheet

    Transition 实例 .box { height: 100px; width: 100px; background: #212121; transition: width 1s ease, he ...

  3. IO流与IO缓冲

    1.字节与字符的演变 public class inputStream { public static void test1() throws Exception{ File file= new Fi ...

  4. H5中的web worker示例demo分析

    web worker 是运行在后台的 JavaScript,不会影响页面的性能. 什么是 Web Worker? 当在 HTML 页面中执行脚本时,页面的状态是不可响应的,直到脚本已完成. web w ...

  5. linux数据库环境搭建

    linux数据库源码下载地址:http://www3.sqlite.org/download.html 下载完成之后,把源码放到linux下的目录,我们一步一步来搭建环境: 1.使用命令解压源码包 u ...

  6. visual core 运行 .net core bug处理

    launch: program 'launch: launch.json must be configured. Change 'program' to the path to the executa ...

  7. sql server 2008 r2 数据库操作时提示 9002错误“事物日志已满”问题

    事务日志截断 若要避免数据库的事务日志被填满,例行备份至关重要.在简单恢复模式下,备份了数据库后会自动截断日志,而在完整恢复模式下,只有备份了事务日志后方才截断日志.但是,截断过程有时也可能发生延迟. ...

  8. Fiddler显示服务器IP的方法

    Fiddler默认配置中是看不到服务器IP的,接下来简单介绍下在fiddler上也能够看到请求的服务器IP: 1.Fiddler--->Rules--->Customize Rules , ...

  9. md5加密以及可逆的加密解密算法

    md5加密 package gov.mof.fasp2.gcfr.adjustoffset.adjust; import java.security.MessageDigest; public cla ...

  10. [C#]使用控制台获取天气预报

    本例子主要是使用由中央气象局网站(http://www.nmc.gov.cn)提供的JSON API,其实现思路如下: 1.访问获取省份(包含直辖市.自治区等,以下简称省份)的网址(http://ww ...