人工智能-Selenium

Selenium是一个用于Web应用程序测试的工具。Selenium测试直接运行在浏览器中，就像真正的用户在操作一样。支持的浏览器包括IE、Mozilla Firefox、Mozilla Suite等。

这个工具的主要功能包括：

测试与浏览器的兼容性——测试你的应用程序看是否能够很好得工作在不同浏览器和操作系统之上。测试系统功能——创建衰退测试检验软件功能和用户需求。支持自动录制动作和自动生成。Net、Java、Perl等不同语言的测试脚本。Selenium 是ThoughtWorks专门为Web应用程序编写的一个验收测试工具。

Selenium对网页的控制是基于各种前端元素的，在使用过程中，对于元素的定位是基础，只有准去抓取到对应元素才能进行后续的自动化控制。

Chrome安装过程：

在chrome浏览器的设置中，查看chrome的版本号，根据 : http://chromedriver.storage.googleapis.com/index.html下载chrome驱动(chromedriver.exe)

把下载并解压成功的驱动放在: C:\Users\lenovo\AppData\Local\Google\Chrome\Application（chrome浏览器安装目录中）

并配置环境变量：C:\Users\lenovo\AppData\Local\Google\Chrome\Application

Chrome例：

# 导报

from selenium import webdriver

import time

import requests

# 建立浏览器对象指定浏览器

browser = webdriver.Chrome()

# 使用浏览器访问网站

browser.get('http://www.baidu.com')

# 向文本框填充文本

browser.find_element_by_id("kw").send_keys('男神鹏')

time.sleep(1)

# 模拟点击

browser.find_element_by_id("su").click()

time.sleep(5)

# 匹配多个节点声明是样式选择器

# elist = browser.find_elements('css selector','h3')

elist = browser.find_elements_by_class_name('t')

text_str = elist[0].text

# print(elist[0].text)

# 点击链接

browser.find_element_by_link_text(text_str).click()

# browser.find_element_by_id("su").click()

# 暂停

time.sleep(50)

# 自动关闭浏览器

browser.quit()

Firefox 安装过程：

在Firefox浏览器的设置中，查看Firefox的版本号，根据 : https://github.com/mozilla/geckodriver/releases下载chrome驱动

(geckodriver.exe)

把下载并解压成功的驱动放在 : D:\Mozilla Firefox（Firefox浏览器安装目录中）

并配置环境变量：D:\Mozilla Firefox

Firefox例：

# 导报

from selenium import webdriver

import time

import requests

# 建立浏览器对象指定浏览器

browser = webdriver.Firefox()

# 使用浏览器访问网站

browser.get('http://www.baidu.com')

# 向文本框填充文本

browser.find_element_by_id("kw").send_keys('https://www.cnblogs.com/chengdongzi/')

time.sleep(1)

# 模拟点击

browser.find_element_by_id("su").click()

time.sleep(5)

# 匹配多个节点声明是样式选择器

# elist = browser.find_elements('css selector','h3')

elist = browser.find_elements_by_class_name('t')

text_str = elist[0].text

# print(elist[0].text)

# 点击链接

browser.find_element_by_link_text(text_str).click()

# browser.find_element_by_id("su").click()

# 暂停

time.sleep(50)

# 自动关闭浏览器

browser.quit()

总结：

xpath定位

xpath也分几种不同类型的定位方法。

一种是绝对路径定位。这种定位方式是利用html标签名的层级关系来定位元素的绝对路径，一般从<html>标签开始依次往下进行查找。

如百度搜索框的绝对路径xpath定位可以是这样的：

find_element_by_xpath("/html/body/div[1]/div[1]/div/div[1]/div/form/span[1]/input")

还有一种是利用元素属性来进行xpath定位

例：搜索框利用id和name定位

find_element_by_xpath("//input[@id='kw']")

find_element_by_xpath("//*[@name='wd']")

其中的标签名input也可以用*来代替，而且只要是在该标签内，任意属性都可以，比如搜索框的maxlength属性：

find_element_by_xpath("//input[@maxlength='255']")

比如查找搜索框的时候发现其上级元素form又唯一的id方便定位，就可以先查找到form元素然后依次往下写路径：

find_element_by_xpath("//form[@id='form']/span/input")

这种定位方式的使用过程中，如果元素的单个属性无法确定其唯一性，可以用and连接多个属性去确定。

find_element_by_css_selector()

CSS属性定位

CSS属性定位可以比较灵活地选择控件的任意属性，定位方式也会比xpath快。

同样是那个百度搜索的例子，可以试一下：

driver.find_element_by_css_selector(".s_ipt").send_keys("selenium")

driver.find_element_by_css_selector("#su").click()

如果有css基础的话就应该可以看懂，一般class是用.标记，id是用#标记，标签名直接写具体标签名就好了。

css定位里面也可以通过属性或者组合方式定位：

driver.find_element_by_css_selector("input[autocomplete='off']").send_keys("Python")

driver.find_element_by_css_selector("span.bg.s_btn_wr>input#su").click()

具体说一下百度一下那个按钮的组合定位方式，这样写的定位顺序是这样的，先定位到一个class名为bg s_btn_wr的span标签，在这个标签下面有一个id为su的input标签，这样就定位到了。

值得注意的是，在css里面下级标签元素用>连接，如果class里面有空格，空格用.进行连接。

find_element_by_tag_name ()

通过标签名去定位的方式一般是这样的：find_element_by_tag_name("input")

可见仅仅通过标签名去定位时，一般一种标签在一个页面里面会出现不止一次甚至大量出现，这种定位方式的作用不是很大，所以用的也就比较少。

find_element_by_link_text()

find_element_by_partial_link_text()

这两种定位方式是专门用于定位超链接的，也就是对应html页面中的<a>标签，括号里传的值就是a标签中的超链接文字，两者的区别在于一个是完整的超链接文字，一个是可以只写部分超链接文字。

比如点击百度首页中右上角的新闻超链接，可以这样去定位：

driver.find_element_by_link_text("新闻").click()

driver.find_element_by_partial_link_text("闻").click()

By定位

find_element(By.ID,"kw")

find_element(By.NAME,"wd")

find_element(By.CLASS_NAME,"s_ipt")

find_element(By.TAG_NAME,"input")

find_element(By.LINK_TEXT,u"新闻")

find_element(By.PARTIAL_LINK_TEXT,u"新")

find_element(By.XPATH,"//*[@class='bg s_btn']")

find_element(By.CSS_SELECTOR,"span.bg s_btn_wr>input#su")

上面这些使用的前提是需要导入By类：from selenium.webdriver.common.by import By

最简单粗暴却失传已久的8种定位

driver.find_element("name","wd").send_keys("Selenium2")

driver.find_element("id","su").click()

by_id -> find_element("id","")

by_xpath -> find_element("xpath","")

by_link_text -> find_element("link text","")

by_partial_text -> find_element("partial link text","")

by_name -> find_element("name","")

by_tag_name -> find_element("tag name","")

by_class_name -> find_element("class name","")

by_css_selector -> find_element("css selector","")

elements复数定位

在上面的例举的八中基本定位方式种，都有对应的复数形式，分别是下面这些：

id复数定位find_elements_by_id()

name复数定位find_elements_by_name()

class复数定位find_elements_by_class_name()

tag复数定位find_elements_by_tag_name()

link复数定位find_elements_by_link_text()

partial_link复数定位find_elements_by_partial_link_text()

xpath复数定位find_elements_by_xpath()

css复数定位find_elements_by_css_selector()

这些复数定位方式每次取到的都是具有相同类型属性的一组元素，所以返回的是一个list队列，我们也可以利用这个去定位单个的元素。比如百度首页种，右上角有新闻、视频、地图、贴吧等一些链接，我们通过f12查看源码可以发现，这些链接都有共同的class， class="mnav"。

人工智能-Selenium的更多相关文章

人工智能-机器学习之Selenium(chrome驱动，火狐驱动)
selenium是一个用于web应用程序测试的工具,Selenium测试直接运行在浏览器中,就像真正的用户在操作一样.支持的浏览器包括IE.Mozilla Firefox.Mozilla Suite等 ...
九、Python+Selenium模拟用QQ登陆腾讯课堂，并提取报名课程（练习）
研究QQ登录规则的话,得分析大量Javascript的加密解密,比较耗时间.自己也是练习很少,短时间成功不了.所以走了个捷径. Selenium是一个WEB自动化测试工具,它运行时会直接实例化出一个浏 ...
[转] 以后再有人问你selenium是什么，你就把这篇文章给他
本文转自:https://blog.csdn.net/TestingGDR/article/details/81950593 写在最前面:目前自动化测试并不属于新鲜的事物,或者说自动化测试的各种方法论 ...
selenium验证码和错误截图
验证码的识别: 1,破解验证码 OCR识别(一般使用tesseract-ocr) 人工智能(AI机器学习 TensorFlow,成本大) 2,绕过验证码 1, 让开发人员临时关闭验证码 2,提供万能验 ...
人工智能时代,应立即学习python
人工智能时代,应立即学习python 应用:web开发,自动化运维开发,自动化测试,数据分析,机器学习 1.python 快速易学习2.python 基于web开发(zhihu:tornad web框 ...
Web自动化selenium技术快速实现爬虫
selenium是大家众所周知的web自动化测试框架,主要用来完成web网站项目的自动化测试,但其实如果要实现一个web爬虫,去某些网站爬取数据,其实用selenium来实现也很方便. 比如,我们现在 ...
ASP.NET MVC WebApi 返回数据类型序列化控制（json,xml) 用javascript在客户端删除某一个cookie键值对 input点击链接另一个页面，各种操作。 C# 往线程里传参数的方法总结 TCP/IP 协议用C#+Selenium+ChromeDriver 生成我的咕咚跑步路线地图 (转)值得学习百度开源70+项目
ASP.NET MVC WebApi 返回数据类型序列化控制(json,xml) 我们都知道在使用WebApi的时候Controller会自动将Action的返回值自动进行各种序列化处理(序列化为 ...
RobotFramework自动化测试框架-Selenium Web自动化(二)关于在RobotFramework中如何使用Selenium很全的总结（上）
好久没有继续分享关于自动化测试相关的东西了,自动化在现今的测试领域已经越来越重要了,大部分公司在测试岗位招聘中都需要会相关的自动化测试知识.而 RobotFramework自动化测试框架是自动化测试 ...
selenium篇之滑动验证码
一.介绍现在出现了一种通过用户鼠标移动滑块来填补有缺口图片的验证码,我们叫做滑动验证码.它的原理很简单,首先生成一张图片,然后随机挖去一块,在页面展示被挖去部分的图片,再通过js获取用户滑动距离,以 ...

随机推荐

Redis在CentOS7中的启动警告
CentOS7安装Redis,启动时会出现如下图3个警告. 问题1:WARNING: The TCP backlog setting of 511 cannot be enforced because ...
day04控制流程之if判断
一.控制流程之if判断 1.什么是if判断判断一个条件如果成立则...不成立则... 2.为何要有if判断让计算机能够像人一样具有判断能力 3.如何用if判断 ''' # 语法1: ''' if ...
opencv测试代码
摄像头摄影 #include <iostream>#include <opencv2/opencv.hpp>using namespace cv;using namespace ...
python 爬虫之 selenium API
一.浏览器操作 1.浏览器最大化 driver.maximize_window() #将浏览器最大化显示 2.设置浏览器宽.高 driver.set_window_size(480, 800)#设置浏 ...
SignalR NuGet程序包
最近公司有一个边看直播边聊天的需求,直播好搞,直接用腾讯的小直播,组装推流和播放地址,把推流地址拿出去就OK,只要一推流,就可以使用播放地址观看直播,看完后通过webclient去异步下载直播的视频到 ...
四：FAQ附录(容器交互，镜像交互，镜像导出)
1.交互式运行容器的方法: 1>-it进入到操作系统中: 2>另开一个cmd验证: 3>这是在image之上多了一个可写的从:可以运行centos的命令做一些事(touch .yum ...
c语言中printf("%x",-1);为什么会输出-1的十六进制补码？？
计算机存储的时候是以补码的形式存进去的,输出来在以你原码的形式输出(这个形式就是你设置的形式)! 比如: -1 (32位模式) 存: 1 000000000000000000000000000000 ...
虚拟机中扩展linux系统存储空间
reference: https://blog.csdn.net/greenapple_shan/article/details/52799631 https://blog.csdn.net/lyd1 ...
mySql单列索引与联合索引的区别
引自https://my.oschina.net/857359351/blog/658668 第一张表gift和索引为联合索引,如图: 第二张表gift2为单列索引,如图: 下面开始进行测试: 相同的 ...
了解下webpack的几个命令
[ webpack3.0.0刚刚出来所以文章是跟着低版本教程操作熟悉结果好多对不上喔] 六:了解下webpack的几个命令 webpack // 最基本的启动webpack ...

人工智能-Selenium

人工智能-Selenium的更多相关文章

随机推荐

热门专题