python selenium 模块
控制已打开的浏览器
https://www.cnblogs.com/lovealways/p/9813059.html
selenium、自动填充文本框、自动点按钮
https://blog.csdn.net/github_26672553/article/details/78579038
selenium driver 驱动器下载:
http://npm.taobao.org/mirrors/chromedriver/
获取标签属性值
https://www.linuxhub.org/?p=3801
from openpyxl import load_workbook
from selenium import webdriver
from selenium.webdriver.chrome.options import Options
from openpyxl.utils import get_column_letter
import time chrome_options = Options()
chrome_options.add_experimental_option("debuggerAddress", "127.0.0.1:9222")
chrome_driver = "D:\Program Files\Python36\Scripts\chromedriver.exe"
driver = webdriver.Chrome(chrome_driver, chrome_options=chrome_options) driver.get('http://search.anccnet.com/searchResult2.aspx')
wb = load_workbook(r'C:\Users\admin\Desktop\T1.xlsx')
sheet = wb.get_sheet_by_name('Sheet1') for cell in list(sheet.columns)[0]:
try:
searchInput = driver.find_element_by_id('keyword')
searchInput.clear()
# searchInput.send_keys('6954767470573')
# searchInput.send_keys('6923146102015')
searchInput.send_keys(cell.value) button = driver.find_element_by_id('gdsBtn')
button.click() tiaomaID4 = driver.find_element_by_class_name('p-info').find_elements_by_tag_name("a")[0].text
changshang5 = driver.find_element_by_id('repList_ctl00_firmLink').text
zhuangtai6 = driver.find_element_by_id('repList_ctl00_status').text[0:2]
time.sleep(3)
ret = driver.find_element_by_class_name('p-info').find_elements_by_tag_name("a")[0].get_attribute("href")
driver.get(ret) name7 = driver.find_element_by_id('Att_Sys_zh-cn_141_G').text
ename8 = driver.find_element_by_id('Att_Sys_en-us_141_G').text
fenlei9 = driver.find_element_by_id('Att_Sys_zh-cn_22_G').text
pinpai10 = driver.find_element_by_id('Att_Sys_zh-cn_304_G').text
guige11 = driver.find_element_by_id('Att_Sys_zh-cn_332_G').text
kuandu12 = driver.find_element_by_id('Att_Sys_zh-cn_101_G').text
gaodu13 = driver.find_element_by_id('Att_Sys_zh-cn_106_G').text
shendu14 = driver.find_element_by_id('Att_Sys_zh-cn_118_G').text
yuanchanguo15 = driver.find_element_by_id('Att_Sys_zh-cn_74_G').text
chandi16 = driver.find_element_by_id('Att_Sys_zh-cn_405_G').text
zhuangpeiguo17 = driver.find_element_by_id('Att_Sys_zh-cn_171_G').text
jibendanwei18 = driver.find_element_by_id('Att_Sys_zh-cn_107_G').text
lingshoudanwei19 = driver.find_element_by_id('Att_Sys_zh-cn_204_G').text
guanjianzi20 = driver.find_element_by_id('Att_Sys_zh-cn_11_G').text
lingshoujia21 = driver.find_element_by_id('Att_Sys_zh-cn_196_G').text try:
img = driver.find_element_by_id('imageListDiv')
except Exception as e:
img = '' sheet[get_column_letter(4) + str(cell.row)] = tiaomaID4
sheet[get_column_letter(5) + str(cell.row)] = changshang5
sheet[get_column_letter(6) + str(cell.row)] = zhuangtai6
sheet[get_column_letter(7) + str(cell.row)] = name7
sheet[get_column_letter(8) + str(cell.row)] = ename8
sheet[get_column_letter(9) + str(cell.row)] = fenlei9
sheet[get_column_letter(10) + str(cell.row)] = pinpai10
sheet[get_column_letter(11) + str(cell.row)] = guige11
sheet[get_column_letter(12) + str(cell.row)] = kuandu12
sheet[get_column_letter(13) + str(cell.row)] = gaodu13
sheet[get_column_letter(14) + str(cell.row)] = shendu14
sheet[get_column_letter(15) + str(cell.row)] = yuanchanguo15
sheet[get_column_letter(16) + str(cell.row)] = chandi16
sheet[get_column_letter(17) + str(cell.row)] = zhuangpeiguo17
sheet[get_column_letter(18) + str(cell.row)] = jibendanwei18
sheet[get_column_letter(19) + str(cell.row)] = lingshoudanwei19
sheet[get_column_letter(20) + str(cell.row)] = guanjianzi20
sheet[get_column_letter(21) + str(cell.row)] = lingshoujia21 if img:
sheet[get_column_letter(21) + str(cell.row)] = ret wb.save(r'C:\Users\admin\Desktop\T1.xlsx')
# print('end') time.sleep(3)
driver.back() except Exception as e:
print('%s 错误'%cell.value)
time.sleep(3)
driver.back() wb.close()
python selenium 模块的更多相关文章
- python selenium模块调用浏览器的时候出错
python selenium模块使用出错,这个怎么改 因为不同版本更新不同步问题,浏览器都要另外下一个驱动.
- python selenium模块 css定位
selenium是python的非标准库,使用时需要下载安装 安装命令 pip install selenium selenium是python的自动化测试模块,可以模拟浏览器的行为 所以在使用之前 ...
- python + selenium 模块封装及参数化
模块封装 示例代码: baidu.py from time import sleep from selenium import webdriver driver = webdriver.Chrome( ...
- python selenium 模块的安装及使用
安装 pip install selenium 或者到https://pypi.python.org/pypi/selenium 下载setup安装包,之后进入目录后运行python setup.py ...
- python - selenium模块简介
为什么要使用Selenium? 很多浏览器渲染页面的方式都很难找出其规律, 但是利用Selenium来驱动加载网页就可以直接拿到javaScript渲染后的结果了, 不需要再担心其相关的加密系统 声明 ...
- Python—selenium模块(浏览器自动化工具)
selenium可以用来完成浏览器自动化相关的操作,写一些代码制定一些基于浏览器自动化的相关操作(行为动作),当代码执行后,浏览器就会自动触发相关的事件 安装方法: pip install selen ...
- python selenium模块 xpath定位
''' 附w3xpath语法地址 https://www.w3school.com.cn/xpath/xpath_syntax.asp 总结: 返回匹配到所有符合条件的第一个节点,对象是 <cl ...
- Python爬虫——selenium模块
selenium模块介绍 selenium最初是一个测试工具,而爬虫中使用它主要是为了解决requests无法直接执行JavaScript代码的问题 selenium本质是通过驱动浏览器,完全模拟浏览 ...
- python 全栈开发,Day136(爬虫系列之第3章-Selenium模块)
一.Selenium 简介 selenium最初是一个自动化测试工具,而爬虫中使用它主要是为了解决requests无法直接执行JavaScript代码的问题 selenium本质是通过驱动浏览器,完全 ...
随机推荐
- 前端架构师 摘自《前端架构设计》-micah godbolt
作为前端架构师,你经常需要制定,或至少能够掌握以上所列的每一项内容.流程中的任何一个环节出现问题,都会迅速演变为开发人员的痛苦,或者导致网站无法持续满足用户要求,甚至崩溃. 前端架构师的用户是开发人 ...
- SequoiaDB 巨杉数据库
传统单点数据库的容量瓶颈,仅仅是分布式数据库所解决的问题之一.更重要的是在未来微服务化应用开发以及云化平台的趋势下,应用不再以“烟囱式”的中间件加数据库模式进行构建,而是采用数千甚至上万的微服务程序构 ...
- hibernate 查询字段是重复名字的处理方法
目前遇到了三种情况: 一:当表的字段是数字类型(int,long .....) select name,ifnull(conpih.uh_id,0) from user; 将重复的字段如上修改用ifn ...
- Jmeter二次开发代码(3)
package org.apache.jmeter.functions; import java.io.FileInputStream;import java.io.FileNotFoundExcep ...
- Ubutun 16.04添加操作命令审计
1.启用/var/log/messages,监控系统命令 说明:由于需要把操作命令记录到/var/log/messages,但是ubuntu默认并没有开启日志写入到这个文件 tchua@ubuntu: ...
- flutter 自定义主题切换
1. 定义local_srorage.dart文件 使用Flutter第三方插件shared_preferences实现存储键值对信息 相关shared_preferences插件可参考: flutt ...
- 认识 CXF(WebService框架)
Apache CXF = Celtix + Xfire 支持多种协议: 1)SOAP1.1,1.2 2)HTTP 3)CORBA(Common Object Request Broker Archit ...
- spring事物与传播行为
一.事物的概念 事务指逻辑上的一组操作,组成这组操作的各个单元,要不全部成功,要不全部不成功. 作用:事物就是保证数据的一致性 事物的特性:事务必须服从ISO/IEC所制定的ACID原则.ACID是原 ...
- Python静态网页爬取:批量获取高清壁纸
前言 在设计爬虫项目的时候,首先要在脑内明确人工浏览页面获得图片时的步骤 一般地,我们去网上批量打开壁纸的时候一般操作如下: 1.打开壁纸网页 2.单击壁纸图(打开指定壁纸的页面) 3.选择分辨率(我 ...
- 简单了解python使用正则表达式
正则[Regular Expression]:正则表达式通常被用来检索.替换那些符合某个模式(规则)的文本. 正则是用来干啥的:正则就是用来匹配字符串的. Python中string的几个方法: fi ...