11月6日

xpath选择

XPath(XML Path Language)是W3C(World Wide Web Consortium)定义的用来在XML文档中选择节点的语言,

主浏览器也支持XPath语法(1.X),对于浏览器原生支持XPath的,Selenium尽量使用原生的XPath实现,有些浏览器也支持通过XPath来访问。xpath的语法 看起来非常像电脑文件系统的路径

xpath验证方法     //option

console中                $x('//option')

element tab中

根节点:根节点用 / 表示:对应整个html文档   $x('/')

  /html -对应html节点

  /html/body/div 继续选择html下面的一层层节点                                find_elements_by_xpath('/html/body/div')

  假如路径起始于正斜杠(/),则此路径始终代表到某元素的绝对路径

  / 符号比较像css 中的 > 符号                    直接子元素

//符号的作用

选择整个文档中的所有的option节点,不管什么位置

当前节点 一开始,我们的当前节点就是根节点,通常html      随后,路径当前部分就是当前节点,比如 /html/body/span

//表示从当前节点寻找所有的后代元素,寻找所有的后代元素,不管它在什么位置

  如果以//开头就表示从根节点开始,寻找所有的后代元素

  //div//p 表示选择所有的div元素里面的p元素,不管div在什么位置,不管p元素在div下面的什么位置     $x('//div//p')        <==>            $$('div  p')    ,单斜杠表示直接子节点,双斜杠表示后代

  //div/p 就等于css选择器的什么写法?      $x('//div/p')         <==>   $$('div >p')   直接子节点

通配符 和css一样,xpath也有通配符 *

  //div/* 选择div下面所有的元素   等价于css $$('div > *')

根据属性选择

  //*[@style] 选择所有具有style属性元素             *style

  //p[@spec='len2'] 选择所有具有spec 值为len2 的元素    注意:css中如果属性值,如果没有空格可以不加引号,但是xpath则必须要引号,单双引号都可以                p[spec='len2']

根据id选择:id、class也是属性    //*[@id="food"]     //div[@id="food"]   //div[@class="cheese"]

子元素选择

选择属于其父元素的第n个某个类型的子元素

  //p[2]等价于 p:nth-of-type(2)

  //*[@id="food"]/p[1] 等价于 #food > p:nth-of-type(1)

  //*2  所有类型的第二个

选择属于其父元素的倒数第n个某个类型的子元素

  //span[last() -1] 属于其父元素的倒数第二个span              span:nth-last-of-type(2)

  //*[@id ="food"]/span[last()]

  //*[last()-1]

选择属于其父元素的第n个子元素(基本所有类型元素)

  //*[2] 等价于 //*[position()=2] 等价于 *:nth-child(2)

  //*[@id = "food"]/*[position()=3]

支持其他的比较操作符

  //*[@id = "food"]/*[position() < 3]             前两个

  //*[@id = "food"]/*[position() <= 3]           前三个

选择属于其父元素的倒数第n个子元素

  //*[@id = "food"]/*[last()-1]等价于//*[@id ="food"]/*[position()=last()-1]

  多选 //*[@id = "food"]/*[position() > last() -3]     后面三个

组选择

用多个表达式一起

css 用,隔开

比如p,button

Xpath用 | 隔开

//p | //button

其他选择语法

参考 http://www.w3school.com.cn/xpath/xpath_axes.asp

相邻兄弟选择器

  following-sibling  后面的兄弟     css:   #food ~ div 《=》xpath: //*[@id = "food"]/following-sibling::div

#food +div 紧跟着的兄弟

  preceding-sibling

xpath 擅长的 选择父节点  ..符号,position函数,结合比较操作符

//*[@id = "food"]/..

food = driver.find_element_by_xpath("//*[@id = 'food']")

eles = food.find_elements_by_xpath('.//p)  这里要加一个点,表示当前的food

for ele in eles:

  print('..........................')

  print(ele.get_attribute('outerHTML'))

Selenium 作业 4

登录 http://www.51job.com
点击高级搜索
输入搜索关键词 python
地区选择 杭州
职能类别 选 计算机软件 -> 高级软件工程师
公司性质选 外资 欧美
工作年限选 1-3 年 搜索最新发布的职位, 抓取页面信息。 得到如下的格式化信息 Python开发工程师 | 杭州纳帕科技有限公司 | 杭州 | 0.8-1.6万/月 | 04-27
Python高级开发工程师 | 中浙信科技咨询有限公司 | 杭州 | 1-1.5万/月 | 04-27

参考答案,往下翻

# coding:utf8
from selenium import webdriver
executable_path = r"d:\tools\webdrivers\chromedriver.exe" driver = webdriver.Chrome(executable_path)
driver.implicitly_wait(10) # 打开网址
driver.get('http://www.51job.com') # 选择高级搜索
driver.find_element_by_css_selector('div.ush > a').click() # 输入选择关键词
driver.find_element_by_id('kwdselectid').send_keys('python') # 工作地点选择
driver.find_element_by_id('work_position_input').click() # 取消 已经选择的
selectedCityEles = driver.find_elements_by_css_selector('#work_position_click_center em[class=on]') for one in selectedCityEles:
one.click() # 选杭州
driver.find_element_by_id('work_position_click_center_right_list_category_000000_080200').click() # 保存选择
driver.find_element_by_id('work_position_click_bottom_save').click() # 要点一下别的地方, 否则下面的元素会被挡住
driver.find_element_by_css_selector('div.tit').click() # 职能类别 选 计算机软件 -> 高级软件工程师 driver.find_element_by_id('funtype_click').click() driver.find_element_by_id('funtype_click_center_right_list_category_0100_0100').click() driver.find_element_by_id('funtype_click_center_right_list_sub_category_each_0100_0106').click() driver.find_element_by_id('funtype_click_bottom_save').click() # 公司性质选 外资 欧美
driver.find_element_by_id('cottype_list').click()
driver.find_element_by_css_selector('#cottype_list span.li[data-value="01"]').click() # 工作年限选
driver.find_element_by_id('workyear_list').click()
driver.find_element_by_css_selector('#workyear_list span.li[data-value="02"]').click() # 点击搜索
driver.find_element_by_css_selector('div.p_sou > span.p_but').click()或者 driver.find_element_by_css_selector("span.p_but[onclick^='kwdGoSearch']").click() # 结果列表获取内容
jobs = driver.find_elements_by_css_selector('#resultList div[class=el]') for job in jobs:
fields = job.find_elements_by_tag_name('span')
stringFilelds = [field.text for field in fields]
print (' | '.join(stringFilelds)) driver.quit()

Xpath选择、操作web元素的更多相关文章

  1. 选择、操作web元素-2

    11月3日 等待web元素的出现 例子:百度搜索松勤网,点击操作后不等待页面刷新,下面选择页面元素的时候,该元素还是未出现 sleep方案的弊病:固定的等待时间,导致测试用例执行时间很长 为什么cli ...

  2. 选择、操作web元素

    11月1日 什么是web元素 Selenium自动化主要就是:选择界面元素,操作界面元素(输入操作:点击.输入文字.拖拽等,输出操作:获取元素的各种属性),根据界面上获取的数据进行分析和处理 选择元素 ...

  3. 选择、操作web元素-3

    11月5日 Selenium 作业 3 登录 51job , http://www.51job.com 输入搜索关键词 "python", 地区选择 "杭州"( ...

  4. Web自动化 - 选择操作元素 1

    文章转自 白月黑羽教Python 所有的 UI (用户界面)操作 的自动化,都需要选择界面元素. 选择界面元素就是:先让程序能找到你要操作的界面元素. 先找到元素,才能操作元素. 选择元素的方法 程序 ...

  5. Web自动化 - 选择操作元素 2

    文章转自 白月黑羽教Python 前面我们看到了根据 id.class属性.tag名 选择元素. 如果我们要选择的 元素 没有id.class 属性, 这时候我们通常可以通过 CSS selector ...

  6. selenium怎么操作web页面常见的元素

    总结一下selenium怎么操作web页面常见的元素. 主要有: 上传 alter dialog prompt dialog confirm dialog select list radio box ...

  7. Appium之选择/操作元素

    Appium是如何选择.操作元素的呢? appium自动化  ------  选择界面 元素 操作元素  ------- ① 点击 ② 输入字符 ③ 拖拽 ④ 获取页面元素的各种属性 根据appium ...

  8. 基于MVC4+EasyUI的Web开发框架经验总结(14)--自动生成图标样式文件和图标的选择操作

    在很多Web系统中,一般都可能提供一些图标的选择,方便配置按钮,菜单等界面元素的图标,从而是Web系统界面看起来更加美观和协调.但是在系统中一般内置的图标样式相对比较有限,而且硬编码写到样式表里面,这 ...

  9. Selenium选择web元素

    获取html片段可以用来做什么? 可以用来分割,也可以分析HTML文档 beautifulsoup用法? 安装beautifulsoup库: pip install beautifulsoup4 因为 ...

随机推荐

  1. C++11--编译器生成的函数

    using namespace std; class Dog {}; /* C++ 03 * 1 默认构造函数(只有当用户没有声明任何构造函数) * 2 拷贝构造(只有当用户没有声明5,6),扩展到C ...

  2. PyQt—QTableWidget中的checkBox状态判断

    一.QTableWidget实现checkBox效果 利用QTableWidgetItem对象的CheckState属性,既能显示QCheckBox,又能读取状态 table = QtGui.QTab ...

  3. P1258小车问题

    传送 很多人质疑它是二分,但其实它就是二分(我会说我不会解方程吗) 据说有很多人没看懂题干在说些什么,那就不要管题干了.拿样例算一遍,我们看看样例的答案是怎么算出来的. 这是样例.看到这个数,我们很懵 ...

  4. P1015回文数

    传送 回文数的判断有个神奇的公式: g[i]==g[leng+-i] 其中leng为字符串长度,看每个g[i]是否都满足它,若满足,就是回文数 ps:洛谷的impossible有毒,必须得复制题干中的 ...

  5. docker设置容器固定ip

    docker安装后,默认会创建三种网络类型,bridge.host和none,可通过如下命令查看 sudo docker network ls 1 bridge:网络桥接 默认情况下启动.创建容器都是 ...

  6. ElasticSearch 核心概念

    ElasticSearch核心概念-Cluster ElasticSearch核心概念-shards ElasticSearch核心概念-replicas ElasticSearch核心概念-reco ...

  7. flask表单标签

    环境:python2.7+flask+flask_wtf 内容:flask的部分常用表单标签 test.py # -*- coding: utf-8 -*- # flask web_form 表单控件 ...

  8. union与union all的用法给区别

    用法: 当我们需要把两个或多个sql联合起来查询就用到了union或者union all 区别: 这两者的区别就在于union会自动的把多个sql查出来重复的排除掉,而union all这是会全部显示 ...

  9. Hdu 4622 Reincarnation(后缀自动机)

    /* 字符串长度较小, 可以离线或者直接与处理所有区间的答案 动态加入点的时候, 因为对于其他点的parent构造要么没有影响, 要么就是在两个节点之间塞入一个点, 对于minmax的贡献没有改变 所 ...

  10. centos下部署启动elasticsearch错误集合与解决方案

    问题一: max virtual memory areas vm.max_map_count [65530] is too low, increase to at least [262144] 解决步 ...