python下selenium模拟浏览器基础操作

1.安装及下载

selenium安装： pip install selenium 即可自动安装selenium

geckodriver下载：https://github.com/mozilla/geckodriver/releases

Chromedriver下载：http://npm.taobao.org/mirrors/chromedriver/

2.保存路径

将下载好的geckodriver以及Chromedriver解压到桌面，打开我的电脑，找到Python文件夹中anancode文件，然后找到Scripts文件，并将刚才解压到桌面的geckodriver和chromedriver保存到此文件夹中即可。（D:\python\anancode\Scripts）

3.selenium在python中的应用:

selenium 可以完全模拟人对浏览器的操作，对动态数据进行获取。动态数据由代码生成，在页面初始化的过程当中是没有的，也无法进行获取，但是特意通过selenium来获取。同时，有些数据需要进行登录才能获取，比如：好友列表，消费记录等，需登录后获取cookie才能进行以上操作。但是使用selenium以后，可以避免人工登录，只需要得到账号、密码即可实现sele代替登陆。

4.selenium特点：

（1）由程序控制浏览器进行操作，而非人工操作；

（2）程序控制浏览器进行操作的时候，速度非常慢，所以需要谨慎使用selenium；

（3）使用selenium控制浏览器的时候，需要下载浏览器对应的驱动程序；

（4）selenium为开源、免费的，但是更新速度没有浏览器快。（不是selenium更新慢，而是浏览器更新速度快，但是要注意selenium和浏览器之间的对应关系。）

5.相关基础操作

（1）引入网页驱动

（2）selenium提供了找到元素的方法：find_element_by_xxx，这些方法全都是用python来实现的。如果只是想对某个元素进行查找、定位，建议使用xpath或者css_selecotor；如果需要对找到的内容进行点击等操作，建议使用find_element_by_xxx。下面介绍一些基础的查找操作：

以登录美食杰网页为例:

注意：
在进行selenium模拟浏览器操作时，会出现的报错信息：

报错原因：由于代码执行速度很快，但是浏览器响应很慢，代码执行到这里的时候，浏览器里面可能还没加载完，所以报错，找不到指定元素
---------------------
版权声明：本文为CSDN博主「想不到叫啥好」的原创文章，遵循CC 4.0 by-sa版权协议，转载请附上原文出处链接及本声明。
原文链接：https://blog.csdn.net/weixin_42657103/article/details/81290446

python下selenium模拟浏览器基础操作的更多相关文章

【Python】 Selenium 模拟浏览器寻路
selenium 最开始我碰到SE,是上学期期末,我们那个商务小组做田野调查时发的问卷的事情.当时在问卷星上发了个问卷,但是当时我对另外几个组员的做法颇有微词,又恰好开始学一些软件知识了,就想恶作剧( ...
Python 配置 selenium 模拟浏览器环境，带下载链接
使用浏览器渲染引擎.直接用浏览器在显示网页时解析HTML,应用CSS样式并执行JavaScript的语句. 这方法在爬虫过程中会打开一个浏览器,加载该网页,自动操作浏览器浏览各个网页,顺便把数据抓下来 ...
Python开发爬虫之动态网页抓取篇：爬取博客评论数据——通过Selenium模拟浏览器抓取
区别于上篇动态网页抓取,这里介绍另一种方法,即使用浏览器渲染引擎.直接用浏览器在显示网页时解析 HTML.应用 CSS 样式并执行 JavaScript 的语句. 这个方法在爬虫过程中会打开一个浏览器 ...
Python使用mechanize模拟浏览器
Python使用mechanize模拟浏览器之前我使用自带的urllib2模拟浏览器去进行訪问网页等操作,非常多站点都会出错误,还会返回乱码.之后使用了 mechanize模拟浏览器,这些情况都没出 ...
Selenium模拟浏览器抓取淘宝美食信息
前言: 无意中在网上发现了静觅大神(崔老师),又无意中发现自己硬盘里有静觅大神录制的视频,于是乎看了其中一个,可以说是非常牛逼了,让我这个用urllib,requests用了那么久的小白,体会到sel ...
Python对Selenium调用浏览器进行封装包括启用无头浏览器，及对应的浏览器配置文件
""" 获取浏览器打开本地浏览器打开远程浏览器关闭浏览器打开网址最大化最小化标题 url 刷新 Python对Selenium封装浏览器调用 ------b ...
使用selenium模拟浏览器抓取淘宝信息
通过Selenium模拟浏览器抓取淘宝商品美食信息,并存储到MongoDB数据库中. from selenium import webdriver from selenium.common.excep ...
selenium模拟浏览器对搜狗微信文章进行爬取
在上一篇博客中使用redis所维护的代理池抓取微信文章,开始运行良好,之后运行时总是会报501错误,我用浏览器打开网页又能正常打开,调试了好多次都还是会出错,既然这种方法出错,那就用selenium模 ...
python爬虫:使用Selenium模拟浏览器行为
前几天有位微信读者问我一个爬虫的问题,就是在爬去百度贴吧首页的热门动态下面的图片的时候,爬取的图片总是爬取不完整,比首页看到的少.原因他也大概分析了下,就是后面的图片是动态加载的.他的问题就是这部分动 ...

随机推荐

python多进程，并获取每个进程的返回值
pool = multiprocessing.Pool(processes=10) row = [...] for row in rows: task_id = row[1] img_id = row ...
[Next] 五.next自定义内容
自定义 head 这是默认的 head 这样的 head 并不能满足我们的需求.next 公开了一个内置组件,用于将元素追加到<head>标签的.我们可以通过这个自定义 head 新建 c ...
Dubbo架构
原文链接http://dubbo.apache.org 架构图节点角色说明节点角色说明 Provider 暴露服务的服务提供方 Consumer 调用远程服务的服务消费方 Registry 服务 ...
js制作留言板
<!DOCTYPE html> <html> <head> <meta charset="UTF-8"> <title> ...
ASP.Net Core下Authorization的几种方式 - 简书
原文:ASP.Net Core下Authorization的几种方式 - 简书 ASP.Net Core下Authorization的几种方式 Authorization其目标就是验证Http请求能否 ...
Docker：Swarm + Stack 一站式部署容器集群
参考1 参考2 1.注意docker的版本,yum默认安装的版本比较低,可能出现 unsupported Compose file version: 3.7 docker版本升级 2.docker-c ...
python 装饰器，生成器，迭代器
装饰器作用:当我们想要增强原来已有函数的功能,但不想(无法)修改原函数,可以使用装饰器解决使用: 先写一个装饰器,就是一个函数,该函数接受一个函数作为参数,返回一个闭包,而且闭包中执行传递进来的函 ...
使用Mybatis Generator自动生成代码
MyBatis Generator(MBG)是MyBatis MyBatis 和iBATIS的代码生成器.它将为所有版本的MyBatis以及版本2.2.0之后的iBATIS版本生成代码.它将内省数据库 ...
java_day01
ch01: ===================================== java J2SE 桌面应用的开发 JAVA SE corejava J2EE 企业级开发 JAVA EE J2 ...
linux上如何安装git
安装依赖软件 yum install curl-devel expat-devel gettext-devel openssl-devel zlib-devel asciidoc yum instal ...

python下selenium模拟浏览器基础操作

python下selenium模拟浏览器基础操作的更多相关文章

随机推荐

热门专题