Python selenium中注入并执行Javascript语句

　　众所周知，Python通常结合selenium模块来完成一些web的自动化测试以及RPA（Robotic Process Automation）工作。事实上，Selenium还可以支持插入js语句、执行js语句、返回js语句的执行结果到python程序中。这对于那些已经习惯了Javascript语法的程序员们，简直是一大神器。

　　举个简单的例子，我们用selenium原生的方法对页面的一个input元素执行输入时，通常需要用到selenium中的send_keys以及clear方法，

代码类似于：

driver.find_element_by_xpath('//*[@id="dataList"]//input').clear()

driver.find_element_by_xpath('//*[@id="dataList"]//input').send_keys("Your contents")

　　该方法大多数时候已经足够好用，但是仔细分析，send_keys方法主要是模拟的用户键盘操作，程序执行时必须要保证该元素始终获取焦点，页面执行过程中尽量不能动页面，否则send_keys方法可能会失效。而且我们每次send_keys之前需要对input元素已有的text进行清空，即初始化。笔者推荐使用JS注入selenium的方法来达到更好的效果，在selenium中写JS语句往往是如下形式：

js="document.getElementsByClassName('form-control')[0].value='%s';"%(requestCode[i][0].value)

driver.execute_script(js)

　　该方法，相当于是直接调用页面元素的value方法来进行赋值，不用考虑变量初始化问题，它属于网页后台功能，类似于F12直接在console中执行代码，不需要光标停留在该input元素上。

使用JS后，我们就可以使用诸如document.getElementsByClassName、QuerySelector、QuerySelectorAll等JS方法定位元素，玩儿法大大丰富；

近日，笔者在一个具体的项目中，需要提取页面某表格的某一列值，该表格虽然最多支持100行来分页，但是用户可视区域只能显示15行。笔者需要提取该列的每一个值做后续判断。开始的方法是用的原生的selenium写法：

elements=driver.find_elements_by_xpath("//tr[contains(@id,'datagrid-row-r1-1')]")

for element1 in elements:

    textList1=element1.text

    value2=re.search(r"(H\d{13})",textList1)

    slaStatus=re.search(r"(aa|bb|cc)",textList1)

    statusList.append(slaStatus.group(1))

    value2List.append(value2.group(1))

奇怪的事情发生了，该elements对象是一个列表，尽管它超过15个元素，但是每次遍历过程中，始终只能读取到前15个元素的text属性，之后的element元素，其text始终为空。笔者过程中换用了正则表达式、cssSelector、xpath等多种方法来提取该属性，总是只能提取到前15个元素的text属性。但是笔者将鼠标悬停在elements中，可以看到VSCode已经捕获到了所有对应元素的text，百思不得其解：

最后，笔者使用JS注入的方法完美避开了此问题，达到同样效果。

js=r"""

var ss="";

for(var i= 1; i< document.querySelectorAll('[field="x"]').length; i ++)

{

ss=ss+document.querySelectorAll('[field="x"]')[i].innerText;

ss=ss.replace(/[\r\n]/g,"")+"|";

};

return ss;

"""

value2

=driver.execute_script(js)

value2List=value2.split("|")

　　该方法中，笔者使用document.querySelectorAll方法获取到field属性="x"的所有元素的合集，遍历过程中，取其innerText并最终借助“|”拼接成字符串。最后在python环境下通过字符串的split方法基于“|”拆分成列表，相当于编码再解码。笔者之所以这样操作是因为，如果js语句执行结果返回的是一个数组，该数组如何与python中的列表直接对接？

无论如何，使用JS的方法完美地提取到了页面元素的属性，达到同样的效果。程序员尤其是新手，在编程过程中难免遇到这样那样的问题。但是一旦你掌握了足够多的方法，就总能在不断尝试过程中接近想要的答案！

Python selenium中注入并执行Javascript语句的更多相关文章

爬虫之动态HTML处理（Selenium与PhantomJS ）执行 JavaScript 语句
执行 JavaScript 语句 1.隐藏百度图片 from selenium import webdriverimport time driver = webdriver.PhantomJS()dr ...
python中使用excutemany执行update语句，批量更新
python中使用excutemany执行update语句,批量更新 # coding:utf8 import pymysql import logging connection = pymysql. ...
在 Selenium 中让 PhantomJS 执行它的 API
from selenium import webdriver driver = webdriver.PhantomJS() script = "var page = this; page.o ...
python return中的or和and语句
python return中的or和and语句 1.二元运算: 如果一个True,一个False或两个false: return True and False # 返回False return Tru ...
案例：执行 JavaScript 语句
隐藏百度图片 # coding=utf-8 from selenium import webdriver driver = webdriver.PhantomJS(executable_path=r' ...
C#中使用MySqlCommand执行插入语句后获取该数据主键id值的方法
.net中要连接mysql数据库,需要引用MySql.Data.dll文件,这文件在mysql官网上有下载. 接着通过MySqlCommand执行插入语句后想要获取该数据主键id值的方法如下: lon ...
python selenium中iframe切换、window切换方法
一.selenium中iframe切换方法: 方法一:switch_to.frame frame函数中提供了三种定位方法:by index, name, or webelement. driver.s ...
【JavaScript】关于 eval(）执行JavaScript语句的一次实验测试
实验主题: eval() 函数可以计算某个字符串,并执行其中的 JavaScript 代码.该函数只接受原始字符串作为参数,如果 string 不是原始字符串,那么该方法将不作任何的改变的返回.因此请 ...
selenium执行JavaScript语句：控制滚动条聚焦元素改变下拉选项
1. 执行js脚本控制滚动条 # http://www.cnblogs.com/yoyoketang/p/6128655.html In [347]: js = "window.scrol ...

随机推荐

OrCAD Capture CIS 16.6 为原理图中的Off-Page Connector添加页面编号
操作系统:Windows 10 x64 工具1:OrCAD Capture CIS 16.6-S062 (v16-6-112FF) 为原理图中的Off-Page Connector添加页面编号一般来 ...
pta总结2
7-1 币值转换 (20 分) 输入一个整数(位数不超过9位)代表一个人民币值(单位为元),请转换成财务要求的大写中文格式.如23108元,转换后变成"贰万叁仟壹百零捌"元.为了简 ...
ajax 函数回调
var initTaxPriod = function (taxNo) { intitSearch(); $("#taxPeriod").html(""); t ...
spark DataFrame
DataFrame的推出,让Spark具备了处理大规模结构化数据的能力,不仅比原有的RDD转化方式更加简单易用,而且获得了更高的计算性能.Spark能够轻松实现从MySQL到DataFrame的转化, ...
centos没有可用软件包 libgtk2
在编写一个C程序,使用基于文本的终端图形编程库(curses)或图形界面(QT/GTK),分窗口显示三个并发进程的运行,因为centos并未安装gtk,所以运行命令行安装gtksudo yum -y ...
ISP PIPLINE (附加1) Green Imbalance
1.什么是Green imbalance 芯片的Gr和Gb通道获取的能量或者是输出的数据不一致,造成这种情况的原因一方面是Gr,Gb通道的半导体制造工艺方面的差异,另一方面是microlens的存在, ...
Selenium + Python +CSV
绪论首先写这个文章的时候仅仅花了2个晚上(我是菜鸟所以很慢),自己之前略懂selenium,但是不是很懂csv,这次相当于练手了. 第一章环境介绍具体实验环境系统 Windows10教育版 1 ...
Android的Activity组件
本章主题是Activity组件:Activity是Android四大组价之一,其重要地位自然不用说.“Activity是应用程序中可见的交互组件的基类,大致上等同于传统桌面应用个程序开发中的窗体.”( ...
AMPPZ-2015 (MIPT Workshop Open 1)
A. Album of Numbers 设$cnt[i]$表示数字$i$的个数,则$ans=\frac{\sum_{i} i\times cnt[i]\prod_{j>i}(cnt[j]+1)} ...
输入、输出与Mad Libs 游戏
name1=input('请输入一个名字:') name2=input('再输入一个名字:') time1=input('请输入一段时间:') print('{},是傻子,{},{}找不到小栗旬'.f ...

Python selenium中注入并执行Javascript语句

Python selenium中注入并执行Javascript语句的更多相关文章

随机推荐

热门专题