selenium+options配置文件

from selenium.webdriver.chrome.options import Options

from selenium import webdriver

chrome_options = Options()　　　　　　　　　　　　    # 模拟器设置

chrome_options.add_argument('--headless')    　　　　  # 浏览器不提供可视化页面

chrome_options.add_argument('--disable-gpu')    　　　 # 谷歌文档提到需要加上这个属性来规避bug

# 设置开发者模式启动，该模式下webdriver属性为正常值   一般反爬比较好的网址都会根据这个反爬

options.add_experimental_option('excludeSwitches', ['enable-automation'])

driver = webdriver.Chrome(chrome_options=chrome_options) # 将配置文件加载进webdriver
driver.get('xxxxxx')

如果要对selenium进行一些配置,那么导入options进行配置,以上是必须配置

有需求可以再以下配置中添加

# 因为每次使用selenium打开浏览器都是没有经过配置的浏览器,这个是让selenium和本人常用的浏览器配置一样,ccokies和插件都会记载

# 配置文件路径 比我widows查看路径 可以试试在Chrome中输入 chrome://version/ 个人资料路径就是

chrome_options.add_argument("--user-data-dir="+r"C:\\Users\\Administrator\\AppData\\Local\\Google\\Chrome\\User Data\\Default")

# 不加载图片, 提升速度

options.add_argument('blink-settings=imagesEnabled=false')

# 添加UA

options.add_argument('user-agent="MQQBrowser/26 Mozilla/5.0 (Linux; U; Android 2.3.7; zh-cn; MB200 Build/GRJ22; CyanogenMod-7) AppleWebKit/533.1 (KHTML, like Gecko) Version/4.0 Mobile Safari/533.1"')

# 隐藏滚动条, 应对一些特殊页面

options.add_argument('--hide-scrollbars')

# 以最高权限运行

options.add_argument('--no-sandbox')

# 禁用JavaScript

option.add_argument("--disable-javascript")

# 禁用浏览器弹窗

prefs = {

'profile.default_content_setting_values' : {

'notifications' : 2

} }

options.add_experimental_option('prefs',prefs)

selenium+options配置文件的更多相关文章

selenium执行js--并绕过webdriver监测常见方法
目录 selenium执行js 常见的selenium监测手段常用绕过selenium监测1 常用绕过selenium监测2 常用绕过selenium监测3 selenium执行js 优点:直接调用 ...
selenium跳过webdriver检测并爬取天猫商品数据
目录简介编写思路使用教程演示图片源代码 @(文章目录) 简介现在爬取淘宝,天猫商品数据都是需要首先进行登录的.上一节我们已经完成了模拟登录淘宝的步骤,所以在此不详细讲如何模拟登录淘宝.把关 ...
selenium跳过webdriver检测并模拟登录淘宝
目录简介编写思路使用教程演示图片源代码 @(文章目录) 简介模拟登录淘宝已经不是一件新鲜的事情了,过去我曾经使用get/post方式进行爬虫,同时也加入IP代理池进行跳过检验,但随着大型网 ...
小白之selenium+python关于cookies绕开登录1
cookie是存储在本地浏览器目录的一些信息,详细一点的话可以查看度娘,按照我的理解就是将信息存储在本地,访问网站的时候,网站的服务器会优先读取本地目录位置的信息,然后做出相对的反应.这就是为什么有的 ...
Selenium VS Webdriver
Selenium 是 ThroughtWorks 一个强大的基于浏览器的开源自动化测试工具,它通常用来编写 Web 应用的自动化测试.随着 Selenium 团队发布 Selenium 2(又名 We ...
selenium（12）-web UI自动化项目实战（PO模式，代码封装）
web UI自动化项目实战-项目项目使用禅道,所以你需要搭建1个禅道,搭建禅道的方法和步骤见 https://www.cnblogs.com/xinhua19/p/13151296.html 搭建U ...
[Asp.net 5] Caching-缓存预告
本节讲Asp.net 5的缓冲.解决方案可以通过网址:https://github.com/aspnet/Caching下载也是Asp.net 5开源代码介绍的第6部分,前5部分链接如下: 1. D ...
简单vue项目脚手架（vue+webpack2.0+vuex+vue-router）
github地址使用技术栈 webpack(^2.6.1) webpack-dev-server(^2.4.5) vue(^2.3.3) vuex(^2.3.1) vue-router(^2.5.3 ...
MySQL的常见存储引擎介绍与参数设置调优
MySQL常用存储引擎之MyISAM 特性: 1.并发性与锁级别 2.表损坏修复 check table tablename repair table tablename 3.MyISAM表支持的索引 ...

随机推荐

HTML语言网页制作-----标签、表格、表单、框架
一:序 Html静态网页,内容(hyper text markup language,超文本标记语言) Css 网页美化 Javascript 脚本语言二:html的介绍 <!DOCTYPE ...
python学习笔记（3）数据类型-列表list
序列是Python中最基本的数据结构.序列中的每个元素都分配一个数字 - 它的位置,或索引,第一个索引是0,第二个索引是1,依此类推. Python有6个序列的内置类型,但最常见的是列表和元组. 序列 ...
deepin 更改默认网卡名称为eth和wlan
deepin 更改默认的网卡名称为eth和无线网卡名wlan vim /etc/default/grub 在 GRUB_CMDLINE_LINUX_DEFAULT="sqlash quiet ...
Dubbo的集群容错与负载均衡策略
Dubbo的集群容错策略正常情况下,当我们进行系统设计时候,不仅要考虑正常逻辑下代码该如何走,还要考虑异常情况下代码逻辑应该怎么走.当服务消费方调用服务提供方的服务出现错误时候,Dubbo提供了多种 ...
图的DFS。。类似树的DFS
Depth-First Search (DFS) Depth-first search (DFS) is an algorithm for traversing or searching tree o ...
吴裕雄--天生自然 R语言开发学习：广义线性模型
#----------------------------------------------# # R in Action (2nd ed): Chapter 13 # # Generalized ...
js如何深度克隆
var json = {a:6,b:4,c:[1,2,3]}; var json2 = clone(json); function clone(obj){ var oNew = new obj.con ...
如何在linux中查找python安装包的路径
[root]# python -c "import fasttext;print(fasttext)"<module 'fasttext' from '/root/anaco ...
Choway Blog
choway 2018-12-11 09:23:46 JavaJVM Java 虚拟机(JVM)在执行 Java 程序时会把它管理的内存划分为多个不同的数据区域.这些区域各有用途,以及创建和销毁的时间 ...
使用 Hexo 在 GitHub 上建立博客 · Utopia's Daily Note
使用 Hexo 在 GitHub 上建立博客 # 写在前面其实我在一月份的就开始写了三篇博客文章,你没有看错,只是写了三篇,然后,就没有然后了.我还在其中一篇文章中写着,不知道自己能够坚持多久.事实 ...

selenium+options配置文件

selenium+options配置文件的更多相关文章

随机推荐

热门专题