配置使用环境

  1. 下载相应的浏览器驱动, Firefox 是默认的 
    本文以 chrome 为主 ,放在scripts目录下
    ChromeDriver 官方下载地址 : 所有版本的 ChromeDriver

文档参考

  1. 简明 Python 教程
  2. Python教程 - 廖雪峰
  3. 官方文档 : Selenium with Python
  4. webdriver实用指南python版本

一份简单的测试 demo

关于 360 haosou.com 的测试 :

  1. 1 #coding=utf-8
  2. 2 from selenium import webdriver
  3. 3 import os
  4. 4 import time
  5.  
  6. 5 # set little time stop and big time stop for viewing changes
  7. 6 little_time_stop = 1
  8. 7 big_time_stop = 2
  9. 8 # 默认广告条数
  10. 9 ads_num_require = 8
  11. 10 # 请求连接
  12. 11 req_url = "http://www.haosou.com/s?ie=utf-8&shb=1&src=360sou_newhome&q=%E9%B2%9C%E8%8A%B1"
  13. 12 # 打开浏览器
  14. 13
  15. 14 browser = webdriver.Chrome()
  16. 15 # 开始请求
  17. 16 17 browser.get(req_url)
  18. 18 # 获取所有的广告
  19. 19
  20. 20 all_ads_li = browser.find_elements_by_css_selector('#e_idea_pp li')
  21. 21 # 当前广告条数
  22. 22 ads_num_current = len(all_ads_li)
  23. 23 print "Has been got %d ads" %(ads_num_current)
  24. 24 # 如果广告条数与默认不符
  25. 25 if ads_num_current < ads_num_require:
  26. 26 print "The number of ads is not enough ( current : %d require: %d)" %(ads_num_current,ads_num_require)
  27. 27 # exit()
  28. 28 # 获取顶部连接
  29. 29 i = 0
  30. 30 for ads_li in all_ads_li:
  31. 31 time.sleep(big_time_stop)
  32. 32 i = i+1
  33. 33 print "ads %d :" %i
  34. 34 try:
  35. 35 main = ads_li.find_element_by_css_selector('h3 a')
  36. 36 except:
  37. 37 print "\tError: ads %d cann't find" %(i)
  38. 38 else:
  39. 39 print "\tReady: visit ads %d" %(i)
  40. 40 main.click()
  41. 41 print "\tSucess: visit ads %d" %(i)
  42. 42 time.sleep(little_time_stop)
  43. 43 try:
  44. 44 img_link = ads_li.find_element_by_class_name('e_biyi_img')
  45. 45 except:
  46. 46 print "\tError : no img in ads %d " %(i)
  47. 47 else:
  48. 48 print "\tReady : visit img_link %d" %(i)
  49. 49 img_link.click()
  50. 50 print "\tSuccess : visit img_link %d" %(i)
  51. 51 time.sleep(little_time_stop)
  52. 52 try:
  53. 53 child_div = ads_li.find_element_by_class_name('e_biyi_childLink');
  54. 54 except:
  55. 55 print "\tError : no child link in ads %d" %(i)
  56. 56 else:
  57. 57 try:
  58. 58 child_links = child_div.find_elements_by_css_selector('a')
  59. 59 except:
  60. 60 print "\tError : find child_links error"
  61. 61 else:
  62. 62 num_links = len(child_links)
  63. 63 print "\tSuccess : there are %d child_links" %(num_links)
  64. 64 j = 0
  65. 65 for child_a in child_links:
  66. 66 j = j + 1
  67. 67 print "\t\tReady : visit child link %d in ads %d" %(j, i)
  68. 68 child_a.click()
  69. 69 print "\t\tSuccess : visit child link %d in ads %d" %(j, i)
  70. 70 time.sleep(little_time_stop)
  71. 71 print "End and thanks for your using!"
  72. 72 # 下面代码选择取消注释
  73. 73 # 延时
  74. 74 # time.sleep(5)
  75. 75 # 关闭当前窗口
  76. 76 # browser.close()
  77. 77 # 关闭所有已经打开的窗口
  78. 78 # browser.quit()

  

定位操作

以下是所有定位操作的 API :

返回一个匹配元素, 即一个 WebElement 元素
find_element_by_id()
find_element_by_name()
find_element_by_class_name()
find_element_by_tag_name()
find_element_by_link_text()
find_element_by_partial_link_text()
find_element_by_xpath()
find_element_by_css_selector()
返回一个列表, 包含所有匹配的元素, 即一个 WebElement 列表
find_elements_by_id()
find_elements_by_name()
find_elements_by_class_name()
find_elements_by_tag_name()
find_elements_by_link_text()
find_elements_by_partial_link_text()
find_elements_by_xpath()
find_elements_by_css_selector()

使用的时候需注意下面几点 :

  1. python selenium 提供了两种对象 : WebDriver 和 WebElement 
    这两种对象都可以使用这些 API
  2. 这些 API 一旦执行失败(即查找不到), 就会抛出异常 
    因此必须使用 try: .. except: ... 机制避免错误的行为影响程序继续进行
  3. WebDriver 调用以上 API 进行全局定位 
    WebElement 调用以上 API 可以进行层级定位, 即 查找当前元素的子元素

WebDriver 的使用

开始的时候必须要有初始化一个 WebDriver 实例, 即下面的 browser 用来对浏览器进行控制以及页面的访问

  1. # 请求连接
  2. req_url = "http://www.haosou.com/s?ie=utf-8&shb=1&src=360sou_newhome&q=%E9%B2%9C%E8%8A%B1"
  3. # 打开浏览器
  4. browser = webdriver.Chrome()
  5. # 开始请求
  6. browser.get(req_url)

接着, 就可以使用异常 API 进行当前页面的全局查找, 比如 :

  1. # 获取所有的广告
  2. all_ads_li = browser.find_elements_by_css_selector('#e_idea_pp li')

WebElement 的使用

  1. 使用 browser.find_element_by_xx() 得到的是一个 WebElement 实例 
    使用获得的实例调用上面的 API 即可进行层级查找

  2. 使用 browser.find_elements_by_xx() 得到的是一个元素是 WebElement 实例的 list 
    通过对 list 的遍历, 即可对各个实例进行相应的操作

WebDriver 的一些常用操作

  1. browser.curren_url : 获取当前加载页面的 URL
  2. browser.close() : 关闭当前窗口, 如果当前窗口是最后一个窗口, 浏览器将关闭
  3. browser.quit() : 关闭所有窗口并停止 ChromeDriver 的执行
  4. browser.add_cookie(cookie_dict) : 为当前会话添加 cookie 
    browser.get_cookie(name) : 得到执行 cookie 
    browser.get_cookies() : 得到所有的 cookie

    1. driver.add_cookie({‘name : foo’, value : bar’}) driver.add_cookie({‘name : foo’, value : bar’, path : ‘/’}) driver.add_cookie({‘name : foo’, value : bar’, path : ‘/’, secure’:True})
  5. browser.delete_all_cookies() : 删除当前会话的所有cookie 
    browser.delete_cookie(name) : 删除指定 cookie

  6. browser.back() : 相当于浏览器的后退历史记录
  7. browser.forward() : 相当于浏览器的前进历史记录
  8. browser.execute_script(script, *args) : 同步执行 js 脚本 
    browser.execute_async_script(script, *args) : 异步执行 js 脚本
  9. browser.get(url) : 在当前窗口加载 url
  10. browser.refresh() : 刷新当前页面
  11. browser.current_window_handle : 当前窗口的 handle, 相当于一个指针一样的东西, 用来指向当前窗口
  12. browser.window_handles : 当前浏览器中的已经打开的所有窗口, 是一个 list
  13. browser.switch_to_window(window_handle) : 切换 window_handle 指向的窗口
  14. browser.title : 当前页面的 title
  15. browser.name : 当前浏览器的名字

WebElement 的一些常用操作

  1. webEle.clear() : 清楚元素的内容, 假如这个元素是一个文本元素
  2. webEle.click() : 点击当前元素
  3. webEle,is_displayed() : 当前元素是否可见
  4. webEle.is_enabled() : 当前元素是否禁止, 比如经常会禁用一些元素的点击
  5. webEle.is_selected() : 当前元素是否选中, 文本输入框的内容
  6. webEle.send_keys(*value) : 向当前元素模拟键盘事件
  7. webEle.submit() : 提交表单
  8. webEle.tag_name : 当前元素的标签名
  9. webEle.text : 当前元素的内容
  10. webEle.get_attribute(name) : 获取当前元素执行属性的值

注意 本文转自 https://www.zybuluo.com/mwumli/note/222253

 

python selenium API 常用方法的更多相关文章

  1. Python Selenium Webdriver常用方法总结

    Python Selenium Webdriver常用方法总结 常用方法函数 加载浏览器驱动: webdriver.Firefox() 打开页面:get() 关闭浏览器:quit() 最大化窗口: m ...

  2. python+selenium+API

    一.浏览器操作 1.浏览器最大化 driver.maximize_window() #将浏览器最大化显示 2.设置浏览器宽.高 driver.set_window_size(480, 800)#设置浏 ...

  3. python selenium --一些常用方法

    · text  获取该元素的文本 · submit  提交表单 · get_attribute  获得属性值 text   用于获取元素的文本信息 下面把百度首页底部的声明打印输出 #coding=u ...

  4. Selenium API常用方法

    driver.findElements()//定位一组List元素集合 driver.findElement()//定位一个元素 driver.getTitle()//获取页面标题 driver.ge ...

  5. Python+Selenium笔记(十四)鼠标与键盘事件

     (一) 前言 Webdriver高级应用的API,允许我们模拟简单到复杂的键盘和鼠标事件,如拖拽操作.快捷键组合.长按以及鼠标右键操作,都是通过使用webdriver的Python API 中的Ac ...

  6. Python+selenium常用方法(Webdriver API)

    小编整理了目前学习的Python+selenium常用的一些方法函数,以后有新增再随时更新. 加载浏览器驱动: webdriver.Firefox() 打开页面:get() 关闭浏览器:quit() ...

  7. WEB自动化(Python+selenium)的API

    在做Web自动化过程中,汇总了Python+selenium的API相关方法,给公司里的同事做了第二次培训,分享给大家                                         ...

  8. Selenium2+python自动化27-查看selenium API

    前言 前面都是点点滴滴的介绍selenium的一些api使用方法,那么selenium的api到底有多少呢?本篇就叫大家如何去查看selenium api,不求人,无需伸手找人要,在自己电脑就有. p ...

  9. python+selenium自动化软件测试(第2章):WebDriver API

    2.1 操作元素基本方法 前言前面已经把环境搭建好了,从这篇开始,正式学习selenium的webdriver框架.我们平常说的 selenium自动化,其实它并不是类似于QTP之类的有GUI界面的可 ...

随机推荐

  1. 【leetcode】1283. Find the Smallest Divisor Given a Threshold

    题目如下: Given an array of integers nums and an integer threshold, we will choose a positive integer di ...

  2. 使用canvas画布生成二维码

    1. 基本用法 <canvas>标签只有两个属性-----width和height CSS: <canvas class="qrcode" width=" ...

  3. Navicat for MySQL 使用

    库创建标准 表查看sql样式

  4. 技巧:在 C/C++中如何构造通用的对象链表[转]

    原文:技巧:在 C/C++中如何构造通用的对象链表 虚拟链表和类链表可以很好地实现这一点 您是否做过这样一个项目,它要求您在内存中保存数目不定的若干不同对象?对于某些情况,二叉树是最佳选择,但在通常情 ...

  5. String,权限修饰符,方法,集合

    String String str1 = "dashu"; String str2 = "dashu"; String string = new String( ...

  6. vuex和localStorage的存储区别

    vuex中的数据是存储在内存中的,localStorage中的数据是存储在浏览器的application中的

  7. error while loading shared libraries: libXXXX.so: cannot open shared object file: No such file or directory

    出现这个问题的原因是运行程序缺少依赖库,或者运行程序的依赖库缺少依赖库,可能你的本地目录下面就有这个库文件,但是linux搜索路劲不会从当前路径下去搜索:这种情况可能出现在切换环境上,可能你在一个li ...

  8. IP输出 之 ip_local_out

    概述 将要从本地发出的数据包,会在构造了ip头之后,调用ip_local_out函数,该函数设置数据包的总长度和校验和,然后经过netfilter的LOCAL_OUT钩子点进行检查过滤,如果通过,则调 ...

  9. 修改PostgreSQL数据库的默认用户postgres的密码 并新建用户

    1.忘记了postgresql 安装时默认用户postgres 的密码,怎么办呢? linux shell命令下面输入: sudo -u postgres psql  (这样就可以直接登录进postg ...

  10. 【黑马JavaSE】1_1_11_IDEA、12_方法、13_重载

    文章目录 1_1_11_01开发工具IntelliJ IDEA 1.3 创建包.查看包的目录结构 1.5 字体设置(File->Settings->Editor->Font) 1.6 ...