1:urllib  python自带 2:re      python自带 3:requests     pip install requests 4:selenium      需要依赖chromedriver (selenium目前有版本限制:https://blog.csdn.net/qq_36625806/article/details/81463872) 下载地址:https://download.csdn.net/my 安装方式:解压后 python setup.py install…
学习目的: 爬虫有请求库(request.selenium).解析库.存储库(MongoDB.Redis).工具库,此节学习安装常用库的安装 正式步骤 Step1:urllib和re库 这两个库在安装Python中,会默认安装,下面代码示例调用: >>> import urllib >>> import urllib.request >>> urllib.request.urlopen("http://www.baidu.com")…
一.常用库 1.requests 做请求的时候用到. requests.get("url") 2.selenium 自动化会用到. 3.lxml 4.beautifulsoup 5.pyquery 网页解析库 说是比beautiful 好用,语法和jquery非常像. 6.pymysql 存储库.操作mysql数据的. 7.pymongo 操作MongoDB 数据库. 8.redis 非关系型数据库. 9.jupyter 在线记事本. 二.什么是Urllib Python内置的Http…
建议更换pip源到国内镜像,下载会快很多:https://www.cnblogs.com/believepd/p/10499844.html requests pip3 install requests selenium pip3 install selenium 安装好后,测试一下: from selenium import webdriver driver = webdriver.Chrome() 执行后报错了: 需要安装chromedriver才能完成chrome浏览器的驱动. 可以从这里…
在进行python爬虫学习前,需要进行如下准备工作: python3+pip官方配置 1.Anaconda(推荐,包括python和相关库)   [推荐地址:清华镜像] https://mirrors.tuna.tsinghua.edu.cn/anaconda/archive/ [安装过程中注意选择自动添加path到环境变量中,未选择需要自己添加] 红色提示的意思是:自动添加的环境变量会处于最前面,自动成为默认,可能会使原本使用默认的软件报错,未防止以上问题,可以打开环境变量后,调整顺序将Ana…
windows下python常用库的安装,前提安装了annaconda 的python开发环境.只要已经安装了anaconda,要安装别的库就很简单了.只要使用pip即可,正常安装好python,都会自带pip安装 工具,在python的scripts安装目录下可以查看.具体安装步骤:使用Anaconda在windows下管理python开发环境 python常用库的安装是python爬虫开发的基石. 1.urllib 和re库的安装 这两个库是python自带的库,只要正确安装了python,…
Python爬虫Urllib库的高级用法 设置Headers 有些网站不会同意程序直接用上面的方式进行访问,如果识别有问题,那么站点根本不会响应,所以为了完全模拟浏览器的工作,我们需要设置一些Headers 的属性. 首先,打开我们的浏览器,调试浏览器F12,我用的是Chrome,打开网络监听,示意如下,比如某网站,点登录之后,我们会发现登陆之后界面都变化 了,出现一个新的界面,实质上这个页面包含了许许多多的内容,这些内容也不是一次性就加载完成的,实质上是执行了好多次请求,一般是首先请求HTML…
目录 Python爬虫-requests库get和post方法使用 1. 安装requests库 2.requests.get()方法使用 3.requests.post()方法使用-构造formdata表单 4.requests.post()方法使用-发送json数据 Python爬虫-requests库get和post方法使用 requests库是一个常用于http请求的模块,性质是和urllib,urllib2是一样的,作用就是向指定目标网站的后台服务器发起请求,并接收服务器返回的响应内容…
python爬虫---selenium库的用法 selenium是一个自动化测试工具,支持Firefox,Chrome等众多浏览器 在爬虫中的应用主要是用来解决JS渲染的问题. 1.使用前需要安装这个第三方库,CMD下: pip install selenium 2.为你的测试浏览器下载驱动,我用的是Chrome,对应的去百度一下Chrome webdrive下载,并解压到python安装目录scripts下. 开始使用 from selenium import webdrive browser…