requests 的使用

1.1、实例引入

# 引入Requests库

import requests

# 发起GET请求

response = requests.get('https://www.baidu.com/')

# 查看响应类型 requests.models.Response

print(type(response))

# 输出状态码

print(response.status_code)

# 输出响应内容类型 text

print(type(response.text))

# 输出响应内容

print(response.text)

# 输出cookies

print(response.cookies)

1.2、各种请求方式

import requests

# 发起POST请求

requests.post('http://httpbin.org/post')

# 发起PUT请求

requests.put('http://httpbin.org/put')

# 发起DELETE请求

requests.delete('http://httpbin.org/delete')

# 发送HEAD请求

requests.head('http://httpbin.org/get')

# 发送OPTION请求

requests.options('http://httpbin.org/get')

2、请求

2.1 、基本GET请求

2.1.1、基本写法

import requests

response = requests.get('http://httpbin.org/get')

print(response.text)

2.1.2、带参数的GET请求

import requests

response = requests.get('http://httpbin.org/get?name=jyx&age=18')

print(response.text)

2.1.3、带参数的GET请求(2)

import requests

# 分装GET请求参数

param = {'name':'jyx','age':19}

# 设置GET请求参数(Params)

response = requests.get('http://httpbin.org/get',params=param)

print(response.text)

2.1.4、解析json

import requests

response = requests.get('http://httpbin.org/get')

# 获取响应内容

print(type(response.text))

# 如果响应内容是json,就将其转为json

print(response.json())

# 输出的是字典类型

print(type(response.json()))

2.1.5、获取二进制数据

import requests

response = requests.get('http://github.com/favicon.ico')

# str，bytes

print(type(response.text),type(response.content))

# 输出响应的文本内容

print(response.text)

# 输出响应的二进制内容

print(response.content)

# 下载二进制数据到本地

with open('favicon.ico','wb')as f:

f.write(response.content)

f.close()

2.1.6、添加headers

import requests

# 设置User-Agent浏览器信息

headers = {

"User-Agent":"Mozilla/5.0 (Windows NT 6.1; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/57.0.2987.133 Safari/537.36"

}

# 设置请求头信息

response = requests.get('https://www.zhihu.com/explore',headers=headers)

print(response.text)

2.2、基本POST请求

import requests

# 设置传入post表单信息

data= {'name':'jyx','age':18}

# 设置请求头信息

headers = {

"User-Agent":"Mozilla/5.0 (Windows NT 6.1; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/57.0.2987.133 Safari/537.36"

}

# 设置请求头信息和POST请求参数(data)

response = requests.post('http://httpbin.org/post', data=data, headers=headers)

print(response.text)

3、响应

3.1 response属性

import requests

response = requests.get('http://www.jianshu.com/')

# 获取响应状态码

print(type(response.status_code),response.status_code)

# 获取响应头信息

print(type(response.headers),response.headers)

# 获取响应头中的cookies

print(type(response.cookies),response.cookies)

# 获取访问的url

print(type(response.url),response.url)

# 获取访问的历史记录

print(type(response.history),response.history)

3.2、状态码判断

import requests

response = requests.get('http://www.jianshu.com/404.html')

# 使用request内置的字母判断状态码

ifnot response.status_code == requests.codes.ok:

print('404-1')

response = requests.get('http://www.jianshu.com')

# 使用状态码数字判断

ifnot response.status_code ==200:

print('404-2')

3.3 requests内置的状态字符

100: ('continue',),

101: ('switching_protocols',),

102: ('processing',),

103: ('checkpoint',),

122: ('uri_too_long', 'request_uri_too_long'),

200: ('ok', 'okay', 'all_ok', 'all_okay', 'all_good', '\\o/', '✓'),

201: ('created',),

202: ('accepted',),

203: ('non_authoritative_info', 'non_authoritative_information'),

204: ('no_content',),

205: ('reset_content', 'reset'),

206: ('partial_content', 'partial'),

207: ('multi_status', 'multiple_status', 'multi_stati', 'multiple_stati'),

208: ('already_reported',),

226: ('im_used',),

# Redirection.

300: ('multiple_choices',),

301: ('moved_permanently', 'moved', '\\'),

302: ('found',),

303: ('see_other', 'other'),

304: ('not_modified',),

305: ('use_proxy',),

306: ('switch_proxy',),

307: ('temporary_redirect', 'temporary_moved', 'temporary'),

308: ('permanent_redirect', 'resume_incomplete', 'resume',), # These 2 to be removed in 3.0

# Client Error.

400: ('bad_request', 'bad'),

401: ('unauthorized',),

402: ('payment_required', 'payment'),

403: ('forbidden',),

404: ('not_found', '-'),

405: ('method_not_allowed', 'not_allowed'),

406: ('not_acceptable',),

407: ('proxy_authentication_required', 'proxy_auth', 'proxy_authentication'),

408: ('request_timeout', 'timeout'),

409: ('conflict',),

410: ('gone',),

411: ('length_required',),

412: ('precondition_failed', 'precondition'),

413: ('request_entity_too_large',),

414: ('request_uri_too_large',),

415: ('unsupported_media_type', 'unsupported_media', 'media_type'),

416: ('requested_range_not_satisfiable', 'requested_range', 'range_not_satisfiable'),

417: ('expectation_failed',),

418: ('im_a_teapot', 'teapot', 'i_am_a_teapot'),

421: ('misdirected_request',),

422: ('unprocessable_entity', 'unprocessable'),

423: ('locked',),

424: ('failed_dependency', 'dependency'),

425: ('unordered_collection', 'unordered'),

426: ('upgrade_required', 'upgrade'),

428: ('precondition_required', 'precondition'),

429: ('too_many_requests', 'too_many'),

431: ('header_fields_too_large', 'fields_too_large'),

444: ('no_response', 'none'),

449: ('retry_with', 'retry'),

450: ('blocked_by_windows_parental_controls', 'parental_controls'),

451: ('unavailable_for_legal_reasons', 'legal_reasons'),

499: ('client_closed_request',),

# Server Error.

500: ('internal_server_error', 'server_error', '/o\\', '✗'),

501: ('not_implemented',),

502: ('bad_gateway',),

503: ('service_unavailable', 'unavailable'),

504: ('gateway_timeout',),

505: ('http_version_not_supported', 'http_version'),

506: ('variant_also_negotiates',),

507: ('insufficient_storage',),

509: ('bandwidth_limit_exceeded', 'bandwidth'),

510: ('not_extended',),

511: ('network_authentication_required', 'network_auth', 'network_authentication'),

4、高级操作

4.1、文件上传

import requests

files = {'file':open('favicon.ico','rb')}

# 往POST请求头中设置文件(files)

response = requests.post('http://httpbin.org/post',files=files)

print(response.text)

4.2、获取cookies

import requests

response = requests.get('https://www.baidu.com')

print(response.cookies)

for key,value in response.cookies.items():

print(key,'=====',value)

4.3、会话维持

4.3.1、普通请求

import requests

requests.get('http://httpbin.org/cookies/set/number/12456')

response = requests.get('http://httpbin.org/cookies')

# 本质上是两次不同的请求，session不一致

print(response.text)

4.3.2、会话维持请求

import requests

# 从Requests中获取session

session = requests.session()

# 使用seesion去请求保证了请求是同一个session

session.get('http://httpbin.org/cookies/set/number/12456')

response = session.get('http://httpbin.org/cookies')

print(response.text)

4.4、证书验证

4.4.1、无证书访问

import requests

response = requests.get('https://www.12306.cn')

# 在请求https时，request会进行证书的验证，如果验证失败则会抛出异常

print(response.status_code)

4.4.2、关闭证书验证

import requests

# 关闭验证，但是仍然会报出证书警告

response = requests.get('https://www.12306.cn',verify=False)

print(response.status_code)

4.4.3、消除关闭证书验证的警告

from requests.packages import urllib3

import requests

# 关闭警告

urllib3.disable_warnings()

response = requests.get('https://www.12306.cn',verify=False)

print(response.status_code)

4.4.4、手动设置证书

import requests

# 设置本地证书

response = requests.get('https://www.12306.cn', cert=('/path/server.crt','/path/key'))

print(response.status_code)

4.5、代理设置

4.5.1、设置普通代理

import requests

proxies = {

"http":"http://127.0.0.1:9743",

"https":"https://127.0.0.1:9743",

}

# 往请求中设置代理(proxies

)

response = requests.get("https://www.taobao.com", proxies=proxies)

print(response.status_code)

4.5.2、设置带有用户名和密码的代理

import requests

proxies = {

"http":"http://user:password@127.0.0.1:9743/",

}

response = requests.get("https://www.taobao.com", proxies=proxies)

print(response.status_code)

4.5.3、设置socks代理

pip3 install 'requests[socks]

import requests

proxies = {

'http':'socks5://127.0.0.1:9742',

'https':'socks5://127.0.0.1:9742'

}

response = requests.get("https://www.taobao.com", proxies=proxies)

print(response.status_code)

4.6、超时设置

import requests

from requests.exceptions import ReadTimeout

try:

# 设置必须在500ms内收到响应，不然或抛出ReadTimeout异常

response = requests.get("http://httpbin.org/get", timeout=0.5)

print(response.status_code)

except ReadTimeout:

print('Timeout')

4.7、认证设置

import requests

from requests.auth import HTTPBasicAuth

r = requests.get('http://120.27.34.24:9001', auth=HTTPBasicAuth('user','123'))

# r = requests.get('http://120.27.34.24:9001', auth=('user', '123'))

print(r.status_code)

4.8、异常处理

import requests

from requests.exceptions import ReadTimeout, ConnectionError, RequestException

try:

response = requests.get("http://httpbin.org/get", timeout = 0.5)

print(response.status_code)

except ReadTimeout:

# 超时异常

print('Timeout')

except ConnectionError:

# 连接异常

print('Connection error')

except RequestException:

# 请求异常

print('Error')

requests 的使用的更多相关文章

requests的content与text导致lxml的解析问题
title: requests的content与text导致lxml的解析问题 date: 2015-04-29 22:49:31 categories: 经验 tags: [Python,lxml, ...
requests源码阅读学习笔记
0:此文并不想拆requests的功能,目的仅仅只是让自己以后写的代码更pythonic.可能会涉及到一部分requests的功能模块,但全看心情. 1.另一种类的初始化方式 class Reques ...
Python爬虫小白入门（二）requests库
一.前言为什么要先说Requests库呢,因为这是个功能很强大的网络请求库,可以实现跟浏览器一样发送各种HTTP请求来获取网站的数据.网络上的模块.库.包指的都是同一种东西,所以后文中可能会在不同地 ...
使用beautifulsoup与requests爬取数据
1.安装需要的库 bs4 beautifulSoup requests lxml如果使用mongodb存取数据,安装一下pymongo插件 2.常见问题 1> lxml安装问题如果遇到lxm ...
python爬虫学习(6) —— 神器 Requests
Requests 是使用 Apache2 Licensed 许可证的 HTTP 库.用 Python 编写,真正的为人类着想. Python 标准库中的 urllib2 模块提供了你所需要的大多数 H ...
ImportError: No module named 'requests'
补充说明: 当前环境是在windows环境下 python版本是:python 3.4. 刚开始学习python,一边看书一边论坛里阅读感兴趣的代码, http://www.oschina.net/c ...
Python-第三方库requests详解
Requests 是用Python语言编写,基于 urllib,采用 Apache2 Licensed 开源协议的 HTTP 库.它比 urllib 更加方便,可以节约我们大量的工作,完全满足 HTT ...
Requests 乱码
当使用Requests请求网页时,出现下面图片中的一些乱码,我就一脸蒙逼. 程序是这样的. def getLinks(articleUrl): headers = { "Uset-Agent ...
爬虫requests模块 2
会话对象¶ 会话对象让你能够跨请求保持某些参数.它也会在同一个 Session 实例发出的所有请求之间保持 cookie, 期间使用 urllib3 的 connection pooling 功能.所 ...
爬虫requests模块 1
让我们从一些简单的示例开始吧. 发送请求¶ 使用 Requests 发送网络请求非常简单. 一开始要导入 Requests 模块: >>> import requests 然后,尝试 ...

随机推荐

php递归删除所有文件
function del_file($dir) { if (@rmdir($dir)==false && is_dir($dir)) { if ($dp = opendir($dir) ...
Delphi编译指令说明
Delphi快速高效的编译器主要来自Object PASCAL的严谨,使用Delphi随时都在与编译器交流,大部分情况下不需要干涉编译器的运行,但是有时也需要对编译器进行必要的设置. ******** ...
python读取文件存到excel中
用xlwt模块执行代码报下面的错 ValueError: column index (256) not an int in range(256) xlwt 模块看源码说最大列只支持255列,所以超过这 ...
php面向对象加载类
php加载类: 新建php文件用驼峰法命名类名: 每个单词首字母大写,后面加.class.php表示这是php类文件.例如: ClubMember.class.php 若为纯php页面,<?ph ...
Maven项目结构
maven项目主体结构: 另外,Eclipse新建项目时会生成.project..classpath及.settings目录下的文件,这些文件用于描述一个Eclipse项目, 接下来做一个简要的解析: ...
<HTTP协议详解>由浅入深看HTTP
一. HTTP协议的应用简单概况 HTTP协议的主要特点可概括如下: 1.支持客户/服务器模式.2.简单快速:客户向服务器请求服务时,只需传送请求方法和路径.请求方法常用的有GET.HEAD.POST ...
算法思考: poj 1969 Count on Canton
A - Count on Canton Time Limit:1000MS Memory Limit:30000KB ...
JDK8新特性：接口的静态方法和默认方法
在jdk8之前,interface之中可以定义变量和方法,变量必须是public.static.final的,方法必须是public.abstract的.由于这些修饰符都是默认的,所以在JDK8之前, ...
Linux- 自动备份MySQL数据库脚本
数据安全很重要,所以日常中需要对数据库进行备份.
MATLAB卷积运算（conv、conv2）解释
来源:https://www.cnblogs.com/hyb221512/p/9276621.html 1.conv(向量卷积运算) 所谓两个向量卷积,说白了就是多项式乘法.比如:p=[1 2 3], ...

requests 的使用

requests 的使用的更多相关文章

随机推荐

热门专题