1.什么是xpath? Xpath,全称XML Path Language,即XML路径语言.它是一门在XML之后查找信息的语言,也同样适用于HTML文档的搜索.在做爬虫的时候,我们用XPath语言来做相应的信息抽取. 2.为什么要学习xpath? xpath可用于xml和html xpath比正则表达式更加简单和强大 scrapy也支持xpath语法 3.节点 父节点 子节点 后代节点 兄弟节点 4.常用规则 实例如下: //title[@lang='eng'] ,这个表达式的意思是选择所有…