最近的开发中要用到htmlAgilityPackage, 所以记录一下XPath相关知识! XPath 简介 XPath 是一门在 XML 文档中查找信息的语言.XPath 可用来在 XML 文档中对元素和属性进行遍历.XPath 是 W3C XSLT 标准的主要元素,并且 XQuery 和 XPointer 同时被构建于 XPath 表达之上.因此,对 XPath 的理解是很多高级 XML 应用的基础. 其实对些我们并不陌生,最与XPath相似的便是CSS的选择器.在CSS中使用CSS选择符选…
XPath 是一门在 XML 文档中查找信息的语言.XPath 可用来在 XML 文档中对元素和属性进行遍历. XPath 是 W3C XSLT 标准的主要元素,并且 XQuery 和 XPointer 同时被构建于 XPath 表达之上. 推荐一个挺不错的网站:http://www.zvon.org/xxl/XPathTutorial/General_chi/examples.html  里面有很不错的例子,下面的例子中红色字体表示使用对应语法获取的元素(或属性). XPath轴(XPath…
原文地址:http://www.cnblogs.com/zhaozhan/archive/2009/09/10/1564396.html XPath 是一门在 XML 文档中查找信息的语言.XPath 可用来在 XML 文档中对元素和属性进行遍历. XPath 是 W3C XSLT 标准的主要元素,并且 XQuery 和 XPointer 同时被构建于 XPath 表达之上. 推荐一个挺不错的网站:http://www.zvon.org/xxl/XPathTutorial/General_chi…
XPath 是一门在 XML 文档中查找信息的语言.XPath 可用来在 XML 文档中对元素和属性进行遍历. XPath 是 W3C XSLT 标准的主要元素,并且 XQuery 和 XPointer 同时被构建于 XPath 表达之上. 推荐一个挺不错的网站:http://www.zvon.org/xxl/XPathTutorial/General_chi/examples.html  里面有很不错的例子,下面的例子中红色字体表示使用对应语法获取的元素(或属性). XPath轴(XPath…
http://www.cnblogs.com/zhaozhan/archive/2009/09/10/1563723.html *************************************************** XPath 是一门在 XML 文档中查找信息的语言.XPath 可用来在 XML 文档中对元素和属性进行遍历. XPath 是 W3C XSLT 标准的主要元素,并且 XQuery 和 XPointer 同时被构建于 XPath 表达之上. 推荐一个挺不错的网站:ht…
XPath 语法 XPath 使用路径表达式来选取 XML 文档中的节点或节点集.节点是通过沿着路径 (path) 或者步 (steps) 来选取的. XML 实例文档 我们将在下面的例子中使用这个 XML 文档. 实例 <?xml version="1.0" encoding="UTF-8"?> <bookstore>      <book>                 <title lang="eng&qu…
获取元素的xpath, 转换xpath为csspath进行jQuery元素获取 博客分类: 编程心得 jQueryCSSHTML  var $shadow = new Object(); /** 获取元素的xpath 特性: - 转换xpath为csspath进行jQuery元素获取 - 仅生成自然表述路径(不支持非.或) @param dom {String/Dom} 目标元素 @returns {String} dom的xpath路径 */ $shadow.domXpath = functi…
之前使用selenium-webdriver来写UI的自动化脚本,发现有一个元素一直无法定位,查看其源码,如下 利用xpathChecker验证了xpath语句的是正确的,但是控制台一直报错: no such element: Unable to locate element: {"method":"xpath","selector":"xpath"} 后面仔细看了一下,我定位的页面重新开了一个iframe,所以在百度上查找了…
XPath轴(XPath Axes)可定义某个相对于当前节点的节点集: 1.child 选取当前节点的所有子元素 2.parent 选取当前节点的父节点 3.descendant 选取当前节点的所有后代元素(子.孙等) 4.ancestor 选取当前节点的所有先辈(父.祖父等) 5.descendant-or-self 选取当前节点的所有后代元素(子.孙等)以及当前节点本身 6.ancestor-or-self 选取当前节点的所有先辈(父.祖父等)以及当前节点本身 7.preceding-sib…
前言:js(javaScript)是面向对象(OOP)的编程语言,目前不仅仅是客户端语言了,基予node可以做服务器端程序,那我们学习js都学习什么? 学习js,我们学习它的几部分组成 1.ECMAScript(ES):js核心语法,它是js的语法规划,js中的变量.数据类型.语法规范.操作语句.设计模型等都是ES规定的 2.DOM:document object model 文档对象模型,提供各种API(属性和方法),让js可以获取操作页面中的html元素(DOM元素) 3.BOM:brows…
嗯我确实不太会.感觉我写的随笔很渣,不一定对,大家不要被我误导了,最好不要看.我也尽量保证写出来都是对的. 首先这俩给我搞晕了 1. // 不管层级:  相对路径 2. /  care 层级: 表示到一个元素的绝对路径 3. //DDD/BBB: 混合的咋解释? 所有的DDD元素下的BBB元素,不管在哪里 4. *号表示选则星号之前的路径所定位的元素 //*: 选中所有元素 /*/*/*/BBB: 这种,有仨个祖先元素的BBB元素 5. [数字]  : 你要选该路径限定的元素中的第几个? 用[n…
参考学习的网站链接http://www.w3school.com.cn/xpath/xpath_intro.asp 首先理清楚一些常识 以此为例 <?xml version="1.0" encoding="ISO-8859-1"?> <bookstore> <book> <title lang="en">Harry Potter</title> <author>J K. Ro…
Xpath是一门在xml文档中查找信息的语言. Xpath可用来在xml文档中对元素和属性进行遍历. <1>路径表达式1: 斜杠(/)作为路径内部的分隔符 同一个路径有绝对路径和相对路径两种写法 绝对路径:必须用"/"起首,后面紧跟根节点.如/step/setp 相对路径:不用"/"起首.如step/step "."表示当前节点 ".."表示当前路径的父节点 <2>路径表达式2: nodename(节点…
1.抓包分析 1.1 Fiddler安装及基本操作 由于很多网站采用的是HTTPS协议,而fiddler默认不支持HTTPS,先通过设置使fiddler能抓取HTTPS网站,过程可参考(https://www.cnblogs.com/liulinghua90/p/9109282.html).使用clear可以将当前fiddler清屏. 1.2 通过抓包爬取腾讯视频评论 unicode转码:在Python中转码可以直接输入u'需要转码的内容' 由于每个视频后面的评论需要自动加载,在源代码中未发现有…
XPath 使用路径表达式来选取 XML 文档中的节点或节点集.节点是通过沿着路径 (path) 或者步 (steps) 来选取的. 下面列出了最有用的路径表达式: 表达式 描述 nodename 选取此节点的所有子节点. / 从根节点选取. // 从匹配选择的当前节点选择文档中的节点,而不考虑它们的位置. . 选取当前节点. .. 选取当前节点的父节点. @ 选取属性. 实例 在下面的表格中,我们已列出了一些路径表达式以及表达式的结果: 路径表达式 结果 bookstore 选取 bookst…
xpath 中,有七种类型的节点: 元素.属性.文本.命名空间.处理指令.注释.以及根节点 树的根成为文档节点或者根节点. 节点关系: Parent, Children, sibling(同胞), Ancestor(先辈),Descendant(后代)…
最近复习自己上一年的课本,想起来刚学那个时候想做一个写日记的软件. 想不如做,用控制台瞎写了一个,一做就成了,没什么bug,期间使用Xpath来读数据,所以就稍微学了一下. 学习过程就这样做一点笔记,巩固一下,顺便万一以后忘记了还可以回来看看. 这篇文章没有讲的太深,已经足够我使用了. 想了解入门的可以看看. Xpath是XML世界中公认的检索表达式. 该表达式使用路径方法(与URL中使用的路径表示方法类似)寻址XML文档的各个部分. Xpath是XML的查询语言,用于检索XML文档节点中包含的…
一.选取节点: 二.谓词: 注意:在scrapy中用xpath进行搜索时,如果使用相对路径,要加上.,如,不然搜索的是整个文档.…
参考文档1:https://www.w3school.com.cn/xpath/xpath_syntax.asp 参考文档2:https://www.runoob.com/xpath/xpath-tutorial.html XML 实例文档 我们将在下面的例子中使用这个 XML 文档: <?xml version="1.0" encoding="ISO-8859-1"?> <bookstore> <book> <title…
"//comment()":“所有注释节点”…
http://www.cnblogs.com/cbcye/archive/2009/03/14/1411291.html http://www.cnblogs.com/cbcye/archive/2009/03/09/1407387.html…
一.基本语法 1.以 / 斜线开始,该路径表示到一个元素下的绝对路径 2.如果路径以双斜线 // 开头, 则表示选择文档中所有满足双斜线//之后规则的元素(无论层级关系) 3.星号 * 表示选择所有由星号之前的路径所定位的元素(/AAA/BBB/DDD/* 选择AAA/BBB/DDD下的所有元素:/*/*/*/BBB选择第四层级为BBB的所有元素) 4.[]和last() 方块号里的表达式可以进一步的指定元素, 其中数字表示元素在选择集里的位置, 而last()函数则表示选择集中的最后一个元素.…
XPath 是一门在 XML 文档中查找信息的语言.XPath 用于在 XML 文档中通过元素和属性进行导航. 节点(Node) 在 XPath 中,有七种类型的节点:元素.属性.文本.命名空间.处理指令.注释以及文档节点(或称为根节点). 请看下面这个 XML 文档: <?xml version="1.0" encoding="ISO-8859-1"?> <bookstore> <book> <title lang=&qu…
你系统学习Git了吗? 学习圣思园张龙老师的Git课程. 使用Mac编程的好处,不是因为Mac长得好看 Git内容学习准备 如果你还没有用Git,就不要写代码了. GitHub仓库的使用. 新员工入职的时候,会让他先用一周的时间去学习Git. Mac(优雅的开发环境,Terminal) 不要使用GUI入门Git.要使用命令行. 官网:http://www.git-scm.com/ 安装Git 使用Xcode自带的Git环境. 去官网自行下载安装. Terminal的增强. bash 每一个Lin…
1.Python的下载 python官方下载地址:https://www.python.org/downloads/ 这边安装的3.6.5为最新版本以适应未来的需求 进入页面就有两个版本的下载选择,2.x版本和3.x版本,或者根据系统选择对应版本. 点击Windows,跳转到Windows版本页面: 点选Python3.6.5版本,进入3.6版本页面,拉到页面下方,找到files 选择64位or32位(x86-64即64,x86即32位),每种都有3个版本 embeddable zip file…
XPath与正则都是用于数据的提取,二者的区别是: 正则:功能相对强大,写起来相对复杂: XPath:语法简单,可以满足绝大部分的需求: 所以,如果你可以根据自己的需要进行选择. 一.首先,我们需要为Google浏览器配置XPath插件: 请自行学习,效果如下: 二.XPath的语法: 注意: XPath的索引从1开始. 三.XPath的案例: 一级分类: //h3[@class="classify_c_h3"]/a/text() 二级分类: //div[@class="cl…
背景: 之所以学习Xpath,是因为在学习selenium定位页面元素,总是定位不到元素.为了更好的开展自动化测试,先学习下Xpath. 一:Xpath是什么. 1:Xpath是一门在XML文档中查找信息的语言. 2:Xpath是在XML文档中通过元素.属性进行导航. 3:Xpath包含一个标准函数库. 二:Xpath的语法. 学习链接:http://www.runoob.com/xpath/xpath-syntax.html…
xpath的作用就是两个字“定位”,运用各种方法进行快速准确的定位,推荐两个非常有用的的firefox工具:firebug和xpath checker   定位 1.依靠自己属性,文本定位 //td[text()='xxx'] //div[contains(@class,'xxx')] //div[@class='xxx' and @type='xxx']   2.依靠父节点定位 //div[@class='xxx']/div //div[@id='xxx']/div     3.依靠子节点定位…
用Xpath定位元素的方法总是记不住,经常要翻出各种文档链接参考,干脆把需要用到的内容整到这个笔记中方便查找. Xpath是在XML文档中定位节点的语言.使用 XPath 的主要原因之一是当想要查找的元素缺少合适的 id 或name属性.XPath定位器可以用来绝对或相对定位缺少id或name属性的元素,也可以是用其他属性进行定位. 通过XPath定位的元素容易受html调整的影响,可以先通过id或name属性找到就近的元素,如父元素,用以加强测试脚本的稳定性.   例如,源文件如下: <htm…
贴几个我学习Xpath的参考 1 基本使用的参考 XPath学习:基本语法(一) 2 较为详细且清晰例子参考,推荐 XPath 详解,总结 3 详细语法参考 Xpath语法格式整理 4 官方参考 XPath 教程 5 XSD (xml Schema Definition) XML中有几种符号需要使用转义字符,分别是: 实体值字符串 特殊字符 &  & <    < >  > "  " &apos;  ' 说明: 1.实体的引用过到“&am…