requests与urllib.request

requests很明显，在写法上与urllib.request不同，前者多一个 S.
导入包时：
import requests
import urllib.request
urllib.request请求模块，用于打开和读取url
urllib.request.urlopen(url, data=None, [timeout, ]*, cafile=None, capath=None, cadefault=False, context=None)
response.read()可以获取到网页的内容
timeout参数的使用在某些网络情况不好或者服务器端异常的情况会出现请求慢的情况，或者请求异常，有时也用来解决反爬，控制爬行速度。
response.status，response.getheaders()【response.headers】【response.info()】获取状态码以及头部信息。response.read()获得的是响应体的内容.
urlopen()只能用于简单的请求，它无法添加header信息。
urllib.request.Request(url) 注意大写。
使用data参数；
data = urllib.parse.urlencode(dict).encode(‘utf-8’)
使用data参数如果要传必须传bytes（字节流）类型的，如果是一个字典，先用 urllib.parse.urlencode() 编码。
request = urllib.request.Request(url = url,data = data,headers = headers,method = ‘POST’)
2.req = urllib.request.Request(url=url,data=data,method=‘POST’)
req.add_header(‘User-Agent’,'Mozilla/5.0) 添加头部信息
rulllib.request.ProxyHandler(）设置代理,网站会检测某一段时间某个IP 的访问次数，访问次数过多，会禁止访问，使用代理安全系数也会相应提高。
urllib.error:包含提出有例外的urllib.request
urllib.parse:用于解析url
urllib.robotparser:用于解析robots.txt文件。
requests完全满足网络爬虫的需求，他是在urllib基础上进一步封装，具备urllib的全部功能。

安装 pip install requests
基于http的post，get请求
r = requests.get(url, params=d) 参数d表示值为字符串的字典，d不是必须的
r = requests.post(url,data=data)post请求需设置请求参数data
请求对象response相应内容
r.status_code:响应状态码
r.raw:原始响应体，使用r.raw.read()读取
r.content：字节方式的响应体，需要进行解码
r.text：字符串形式的响应体，会自动根据响应头部的字符编码进行解码
r.headers：以字典对象存储服务器响应头，字典见键不区分大小写，若键不存在返回none。
r.json()：Requests中内置的json解码器
r.raise_for_status()：请求失败，抛出异常
r.url：获取请求链接
r.cookies：获取请求后的cookie
r.encoding:获取编码格式
---------------------
作者：秋瑾先生

requests与urllib.request的更多相关文章

Python3 内置http.client,urllib.request及三方库requests发送请求对比
如有任何学习问题,可以添加作者微信:lockingfree 更多学习资料请加QQ群: 822601020获取 HTTP,GET请求,无参 GET http://httpbin.org/get Pyth ...
爬虫小探-Python3 urllib.request获取页面数据
使用Python3 urllib.request中的Requests()和urlopen()方法获取页面源码,并用re正则进行正则匹配查找需要的数据. #forex.py#coding:utf-8 ' ...
Pthon常用模块之requests，urllib和re
urllib Python标准库中提供了:urllib等模块以供Http请求,但是,它的 API 太渣了. 它需要巨量的工作,甚至包括各种方法覆盖,来完成最简单的任务, 下面是简单的使用urllib来 ...
py3+requests+re+urllib，爬取并下载不得姐视频
实现原理及思路请参考我的另外几篇爬虫实践博客 py3+urllib+bs4+反爬,20+行代码教你爬取豆瓣妹子图:http://www.cnblogs.com/UncleYong/p/6892688. ...
爬虫入门【1】urllib.request库用法简介
urlopen方法打开指定的URL urllib.request.urlopen(url, data=None, [timeout, ]*, cafile=None, capath=None, ca ...
Python3——根据m3u8下载视频（上）之urllib.request
干活干活,区区懒癌已经阻挡不了澎湃的洪荒之力了...... 运行环境:Windows基于python3.6 ---------------------------------------------- ...
爬虫初探(1)之urllib.request
-----------我是小白------------ urllib.request是python3自带的库(python3.x版本特有),我们用它来请求网页,并获取网页源码. # 导入使用库 imp ...
关于python3.X 报"import urllib.request ImportError: No module named request"错误,解决办法
#encoding:UTF-8 import urllib.request url = "http://www.baidu.com" data = urllib.request.u ...
urllib.request
[urllib.request] 1.urlopen结果保存在内存. 2.ulrretrieve结果保存到文件. 3.response有read方法. 4.可以创建Request对象. 5.发送Pos ...

随机推荐

centos 中的vsftpd 配置
一.安装vsftpd 1.1 检查系统是否已经安装过vsftpd了 [root@localhost /]# rpm -aq vsftpd 如果返回结果显示: vsftpd--.el7.x86_64 # ...
Windows Server 2016 IIS的安装与配置
1. 打开服务器管理器,点击[添加角色和功能选项]. 2. 进入“添加角色和功能向导”页面,点击下一步. 3. 安装类型选择[基于角色或基于功能的安装],点击下一步. 4. 进入服务器选 ...
Thrift使用入门---RPC服务
https://blog.csdn.net/zkp_java/article/details/81879577 RPC基本原理大部分的RPC框架都遵循如下三个开发步骤: RPC通信过程如下图所示通 ...
Linux网络编程综合运用之MiniFtp实现(六)
间隔了一周时间没写了,由于今年的股势行情貌似不错的样子,对于对股市完全不懂的我也在蠢蠢欲动,所以最近一周业余时间在“不务正业”-----学习炒股.发现学习它其实挺费神的,满脑子都是走势图,而且是神经有 ...
0014SpringBoot结合thymeleaf实现登录功能
该登录功能需要实现的需求如下: 1.输入用户名密码,如果验证通过,进入首页,并显示登录的用户名 2.如果验证不通过,则重新进入登录页面,并显示“用户名密码错误” 3.如果未经登录,不能直接访问首页等静 ...
LoadRunner在Controller场景中配置获取Windows Resources
一.首先需要在被监控Windows服务器端(只支持Windows)进行如下设置: 启动服务: Remote Procedure Call (RPC) RemoteRegistry 操作方法: 按Win ...
Cookie、Session、Token那点事儿和前后端分离之JWT用户认证
(两篇文章转自:https://www.jianshu.com/p/bd1be47a16c1:https://www.jianshu.com/p/180a870a308a) 什么是Cookie? Co ...
BZOJ1209 最佳包裹（三维凸包增量法）
题意求三维凸包的表面积. N≤100N\le100N≤100 题解暴力往当前的凸包里加点.O(n2)O(n^2)O(n2).题解详见大佬博客扰动函数shakeshakeshake是为了避免四点共 ...
docker学习（六） Docker命令查询
Docker命令查询 1.基本语法docker [OPTIONS] COMMAND [arg...]一般来说,Docker 命令可以用来管理 daemon,或者通过 CLI 命令管理镜像和容器.可以通 ...
jQuery事件触发前后进行其他的操作
 <!DOCTYPE html> <html ...

requests与urllib.request

requests与urllib.request的更多相关文章

随机推荐

热门专题