xPath在C#中运用
<?
xml
version="1.0" encoding="utf-8" ?>
<
pets
>
<
cat
color="black" weight="10">
<
price
>100</
price
>
<
desc
>this is a black cat</
desc
>
</
cat
>
<
cat
color="white" weight="9">
<
price
>80</
price
>
<
desc
>this is a white cat</
desc
>
</
cat
>
<
cat
color="yellow" weight="15">
<
price
>80</
price
>
<
desc
>this is a yellow cat</
desc
>
</
cat
>
<
dog
color="black" weight="10">
<
price
>100</
price
>
<
desc
>this is a black dog</
desc
>
</
dog
>
<
dog
color="white" weight="9">
<
price
>80</
price
>
<
desc
>this is a white dog</
desc
>
</
dog
>
<
dog
color="yellow" weight="15">
<
price
>80</
price
>
<
desc
>this is a yellow dog</
desc
>
</
dog
>
</
pets
>
符号 |
说明 |
示例 |
示例说明 |
/ |
表示从根节点开始选择 |
/pets |
选择根节点pets |
表示节点和子节点之间的间隔符 |
/pets/dog |
选择pets节点下的dog节点 |
|
//xx |
表示从整个xml文档中查找,而不考虑当前节点位置 |
//price |
选择文档中所有的price节点 |
. |
单个英文半角句点表示选择当前节点 |
/pets/. |
选择pets节点 |
.. |
双点,表示选择父节点 |
/pets/dog[0]/.. |
表示pets节点,也就是第一个dog节点的父节点 |
@xx |
表示选择属性 |
//dog/@color |
表示选择所有dog节点的color属性集合 |
[…] |
中括号表示选择条件,括号内为条件 |
//dog[@color=’white’] |
所有color为white的dog节点 |
//dog[/price<100] |
所有price字节点值小于100的dog节点 |
||
中括号内数字为节点索引,类似c#等语言中的数组,数组下标是从1开始的 |
//dog[1] |
第1个dog节点 |
|
//dog[last()] |
最后一个dog节点,last()是xPath内置函数 |
||
| |
单竖杠表示合并节点结合 |
//dog[@color=’white’] | //cat[@color=’white’] |
color属性为white的dog节点和color属性为white的cat节点 |
* |
星号表示任何名字的节点或者属性 |
//dog/* |
表示dog节点的所有子节点 |
//dog/@* |
表示dog节点的所有属性节点 |
关键字
|
说明 |
示例 |
示例说明 |
ancestor |
当前节点的父祖节点 |
ancestor::pig |
当前节点的祖先节点中的pig节点 |
ancestor-or-self |
当前节点以及其父祖节点 |
ancestor::pig |
|
attribute |
当前节点的所有属性 |
attribute::weight |
相当于@weight,attribute::和@是等价的 |
child |
当前节点的所有字节点 |
child::*[name()!=’price’] |
选择名字不是price的子节点 |
descendant |
子孙节点 |
descendant::*[@*] |
有属性的子孙节点 |
descendant-or-self |
子孙节点以及当前节点 |
descendant-or-self::* |
|
following |
Xml文档中当前节点之后的所有节点 |
following::* |
|
following-sibling |
当前节点的同父弟弟节点 |
following-sibling:: |
|
preceding |
Xml文档中当前节点之前的所有节点 |
preceding::* |
|
namespace |
选取当前节点的所有命名空间节点 |
namespace::* |
|
parent |
当前节点的父节点 |
parent:: |
相当于双点.. |
preceding-sibling |
当前节点之后的同父兄节点 |
preceding-sibling::* |
|
self |
当前节点 |
self::* |
相当于单点. |
xPath在C#中运用的更多相关文章
- 使用Xpath从网页中获取数据
/// <summary> /// 从官方网站中抓取产品信息存放在本地数据库中 /// </summary> /// <returns></returns&g ...
- 爬取伯乐在线文章(二)通过xpath提取源文件中需要的内容
爬取说明 以单个页面为例,如:http://blog.jobbole.com/110287/ 我们可以提取标题.日期.多少个评论.正文内容等 Xpath介绍 1. xpath简介 (1) xpath使 ...
- Xpath在选择器中正确,在代码中返回的是空列表问题
一.问题: 在进行爬虫的时候我们会用到xpath解析html文件,但是会有一种情况就是在xpath选择器中可以使用,但是在代码中就无法使用的情况. 二.原因: 1.是元素中有tbody的原因,这个元素 ...
- 正则和xpath在网页中匹配字段的效率比较
1. 测试页面是 https://www.hao123.com/,这个是百度的导航 2. 为了避免网络请求带来的差异,我们把网页下载下来,命名为html,不粘贴其代码. 3.测试办法: 我们在页面中 ...
- XPath在python中的高级应用
XPath在python的爬虫学习中,起着举足轻重的地位,对比正则表达式 re两者可以完成同样的工作,实现的功能也差不多,但XPath明显比re具有优势,在网页分析上使re退居二线. XPath介绍: ...
- scrapy xpath 从response中获取li,然后再获取li中img的src
lis = response.xpath("//ul/li") for li in lis: src = li.xpath("img/@src") # 如果xp ...
- java:利用xpath删除xml中的空节点
原始xml内容: <data> <a> </a> <b>b1</b> <awb> <awbpre>123</a ...
- [Java] 通过XPath获取XML中某个节点的属性
/** * Get PA Url * @author jzhang6 * @return url */ public String getPAUrl(){ String PAUrl = "& ...
- XPath语法 在C#中使用XPath示例 【转http://www.cnblogs.com/yukaizhao/archive/2011/07/25/xpath.html】非常详细的文章
XPath语法 在C#中使用XPath示例 XPath可以快速定位到Xml中的节点或者属性.XPath语法很简单,但是强大够用,它也是使用xslt的基础知识. 示例Xml: <?xml ve ...
随机推荐
- uptime命令查看系统启动时间和运行时间、查看linux系统负载
1.uptime命令输出:16:11:40 up 59 days, 4:21, 2 users, load average: 0.00, 0.01, 0.00 2.查看/proc/uptime文件计算 ...
- Plain text considered harmful: A cross-domain exploit
referer:http://balpha.de/2013/02/plain-text-considered-harmful-a-cross-domain-exploit/ Data from aro ...
- C Primer Plus学习笔记(八)- 函数
函数简介 函数(function)是完成特定任务的独立程序代码单元 使用函数可以省去编写重复代码的苦差,函数能让程序更加模块化,提高程序代码的可读性,更方便后期修改.完善 #include <s ...
- nested exception is java.net.UnknownHostException: mybatis.org异常处理
最近自己写了个小项目(丛林商城V1.0),一个简单的网上商铺:主界面是商品的展示和登录,面对三种角色的人群:一般客户,VIP客户,管理员,与之对应的三种商品价格,登陆后根据具体角色来显示商品的价格:还 ...
- vs中ffmpeg release版本崩溃问题(转)
vs2010 win7 下开发视频服务器,用到ffmpeg,debug版本运行正常,切换到release时,出现"0x00905a4d 处未处理的异常: 0xC0000005: 读取位置 0 ...
- Tornado模板配置
#!/usr/bin/env python # -*- coding:utf-8 -*- #tornado模板配置 import tornado.ioloop import tornado.web c ...
- 文科妹学 GitHub 简易教程(转)
文科妹学 GitHub 简易教程 #什么是 Github ?必须要放这张图了!!! Git 是由 Linux 之父 Linus Tovalds 为了更好地管理linux内核开发而创立的分布式版 ...
- Codeforces Good Bye 2018 D (1091D) New Year and the Permutation Concatenation
题意:给n!个n的排列,按字典序从小到大连成一条序列,例如3的情况为:[1,2,3, 1,3,2, 2,1,3 ,2,3,1 ,3,1,2 ,3,2,1],问其中长度为n,且和为sum=n*(n+1) ...
- git 删除本地分支和远程分支
(1)使用命令git branch -a 查看所有分支 其中,remote/origin/master表示的是远程分支 (2)删除远程分支 使用命令 git push origin --delete ...
- mac上virtualBox的安装和使用
一.下载和安装 去oracle官网下载mac版的virtualBox. 官网下载地址:https://www.virtualbox.org/. 下载好后按照向导进行安装即可. 二.使用方法 1.新建虚 ...