Tag names:当仅使用1个tag的时候,xpath匹配具有该标签名称的所有直接子元素. Paths:通过/符号连接tag名称,例如second/child将匹配父元素second下所有的child子元素. 请注意,如果有多个父元素都有子元素,则xpath将匹配所有这些子元素. Wildcards(通配符):通配符*匹配所有元素 Current element:当前元素用一个点(.)表示,通常,当前元素是隐式的,不需要包含在xpath中. Parent element:其他元素的父元素用两个
(一)日期和简介 date:2017/12/18 name:a标签href属性提取抛出异常list index out of range (二)问题详细说明: 以百度新闻页面为例: 1.node_list = html_etree.xpath("//a") # 获得a标签节点198个 2.遍历节点,获取href属性:a_href = node.xpath("./@href")[0]时 到173后面的href属性提取异常. 后发现:174标签为:<a id=&q