Python模块-requests模块使用
写在前面
这篇文章是我照着廖雪峰python网站学习的,大致内容差不多,多了我一丢丢的自己的想法。如果发现有什么不对的话请及时联系我。qq:472668561
参考链接:https://www.liaoxuefeng.com/wiki/1016959663602400/1183249464292448
介绍
这个模块是python的‘必用’模块,用来处理HTTP请求的请求和响应。在这里只介绍一些基本的。
通过pip install requests
来安装。
使用版本
我学习时使用的python版本是3.7.4
,requests版本2.22.0
,算是比较新的版本了,可能不同版本会有差异。
开始
>url = "http://www.baidu.com"
>r = requests.get(url)
>r.status_code
200
status_code
用来显示服务器响应状态码,对状态码感兴趣的可以自行百度。
>r.text
'<!DOCTYPE html>\r\n~~~~~~</html>\r\n'
>r.content
b'<!DOCTYPE html>\r\n~~~~~~</html>\r\n'
text
显示网页返回内容;content
是以二进制的方式读取的,查看的内容是以b
开头,说明以二进制的方式读取,则文件io操作的时候也要以二进制方式进行。
> with open('./test.txt','w') as f:
> f.write(r.content)
Traceback (most recent call last):
File "<stdin>", line 2, in <module>
TypeError: write() argument must be str, not bytes
>with open('./test.txt','wb') as f:
> f.write(r.content)
2381
params
参数,适用于带参数的url。
>r = requests.get(url,params={'wd':'requests','tn':'monline_4_dg','ie':'utf-8'})
>r.url
'http://www.baidu.com/?wd=requests&tn=monline_4_dg&ie=utf-8'
url
属性用来显示该次请求的url。
reuqests可以对特定类型响应,例如JSON;注意,返回的如果不是JSON格式会报错。
>r.json()
Traceback (most recent call last):
File "<stdin>", line 1, in <module>
···
json.decoder.JSONDecodeError: Expecting value: line 1 column 1 (char 0)
可以将url修改为返回格式是json格式的链接,如Github的API,https://api.github.com/search/repositories?q=language:python&sort=stars
需要传入HTTP Header时,需要传入一个字典作为headers参数,但时一行写难免不直观,多数都是给定headers
变量。请求时使用headers=headers。
>headers = {'User-Agent':'test'}
>r = requests.get(url,headers=headers)
要使用POST方式请求,把get()改为post(),然后传入data
参数作为POST请求的数据。
data跟headers参数用法差不多。
>data = {'test':'test'}
> r = requests.post(url,data=data)
requests模块默认使用application/x-www-form-urlencoded
对POST数据编码,如果传递JSON数据,可以直接写入JSON
参数。内部自动序列化为JSON。
>params = {'key':'value'}
>r = requests.post(url,json=params)
如果上传的文件是其他的文件类型,比如excel表格,requests可以把它简化成files
参数,注意是files不是file。
>upload_file = {'file':open('./read.txt','rb')}
>r = requests.post(url,files=upload_file)
注意:读取时务必使用'rb'即二进制读取模式,这样获取的bytes长度才是文件的长度。
可以把post()修改为其他的HTTP请求方式,delete(),put(),head()等。
通过使用headers
属性,获取HTTP响应头内容。
>r.headers
{'Connection': 'Keep-Alive', 'Content-Length': '17931', 'Content-Type': 'text/html', 'Date': 'Wed, 27 Nov 2019 09:42:22 GMT', 'Etag': '"54d97487-460b"', 'Server': 'bfe/1.0.8.18'}
r.cookies,requests对cookie做了特殊处理,使我们不必解析cookie就可以轻松获取指定的cookie。
>r.cookies
<RequestsCookieJar[]>#中括号里显示cookie内容
<RequestsCookieJar[Cookie(version=0,name='BDORZ', value='27315',~~~~~~rest={}, rfc2109=False)]>
要传入cookie参数时,使用字典作为一个cookies
参数。
>r = requests.post(url,cookies=data)
要指定超时时间时,传入以秒为单位的timeout
参数
>r = requests.post(url,timeout=1)
requests
['ConnectTimeout', 'ConnectionError', 'DependencyWarning', 'FileModeWarning', 'HTTPError', 'NullHandler', 'PreparedRequest', 'ReadTimeout', 'Request', 'RequestException', 'RequestsDependencyWarning', 'Response', 'Session', 'Timeout', 'TooManyRedirects', 'URLRequired', '__author__', '__author_email__', '__build__', '__builtins__', '__cached__', '__cake__', '__copyright__', '__description__', '__doc__', '__file__', '__license__', '__loader__', '__name__', '__package__', '__path__', '__spec__', '__title__', '__url__', '__version__', '_check_cryptography', '_internal_utils', 'adapters', 'api', 'auth', 'certs', 'chardet', 'check_compatibility', 'codes', 'compat', 'cookies', 'delete', 'exceptions', 'get', 'head', 'hooks', 'logging', 'models', 'options', 'packages', 'patch', 'post', 'put', 'request', 'session', 'sessions', 'status_codes', 'structures', 'urllib3', 'utils', 'warnings']
Python模块-requests模块使用的更多相关文章
- Python爬虫之使用Fiddler+Postman+Python的requests模块爬取各国国旗
介绍 本篇博客将会介绍一个Python爬虫,用来爬取各个国家的国旗,主要的目标是为了展示如何在Python的requests模块中使用POST方法来爬取网页内容. 为了知道POST方法所需要传 ...
- Python之requests模块-hook
requests提供了hook机制,让我们能够在请求得到响应之后去做一些自定义的操作,比如打印某些信息.修改响应内容等.具体用法见下面的例子: import requests # 钩子函数1 def ...
- Python之requests模块-cookie
cookie并不陌生,与session一样,能够让http请求前后保持状态.与session不同之处,在于cookie数据仅保存于客户端.requests也提供了相应到方法去处理cookie. 在py ...
- Python之requests模块-session
http协议本身是无状态的,为了让请求之间保持状态,有了session和cookie机制.requests也提供了相应的方法去操纵它们. requests中的session对象能够让我们跨http请求 ...
- Python之requests模块-request api
requests所有功能都能通过"requests/api.py"中的方法访问.它们分别是: requests.request(method, url, **kwargs) req ...
- Python使用requests模块访问HTTPS网站报错`certificate verify failed`
使用requests模块访问HTTPS网站报错: SNIMissingWarning: An HTTPS request has been made, but the SNI (Subject Nam ...
- 使用Python的requests模块编写请求脚本
requests模块可用来编写请求脚本. 比如,使用requests的post函数可以模拟post请求: resp = requests.post(url, data = content) url即为 ...
- python基础-requests模块、异常处理、Django部署、内置函数、网络编程
网络编程 urllib的request模块可以非常方便地抓取URL内容,也就是发送一个GET请求到指定的页面,然后返回HTTP的响应. 校验返回值,进行接口测试: 编码:把一个Python对象编码转 ...
- 关于解决Python中requests模块在PyCharm工具中导入问题
问题引入: 今天在学习Python网络请求的时候,导入requests模块时一直报红色波浪线,如图: 反复折腾,一直以为自己没有安装requests模块,反复安装反复卸载: 安装方法: 首先 cd 进 ...
- python的requests模块
使用python进行接口测试得时候可以使用requests模块,是基于 urllib,采用 Apache2 Licensed 开源协议的 HTTP 库 安装requests是模块 pip instal ...
随机推荐
- [flask]jina2处理表单--实现搜索功能
思路: 获取查询关键字 查询数据库,获得查询结果 将查询结果返回模板文件 forms.py from flask_wtf import FlaskForm from wtforms import S ...
- layer的iframe弹框中父子元素的传值
项目中,左侧导航树,右侧是 iframe 嵌套的页面,在右侧页面中又有layer弹框,可以说是有两层 iframe 框架. 所以查询网上的parent什么的方法都不能用.自己摸索的下面的方法: 1.父 ...
- json中loads()和dumps()的应用
import json s = {'name': 'jack'} #将dict转换成strl = json.dumps(s)print(type(l)) #将str转换成dictm = json.lo ...
- I/O检测介绍
I/O性能监测可总结如下:* 任何时间出现CPU等待IO,说明磁盘超载.* 计算出你的磁盘可维持的IOPS值.* 判定你的应用是属于随机磁盘访问型还是有序型.* 通过对比等待时间和服务时间即可判断磁盘 ...
- STM32Cube填坑,ST link 下载一次以后无法下载
ST link 下载一次以后无法下载, 原因是工程设置忘记设置Debug模式
- mysql linux环境
创建新用户 create user jnroot@'%' identified by 'Yc@edc#sJn';创建数据库 create database price_monitor DEFAULT ...
- Prometheus告警模型分析
Prometheus作为时下最为流行的开源监控系统,其庞大的生态体系:包括针对各种传统应用的Exporter,完整的二次开发工具链,与Kubernetes等主流平台的高度亲和以及由此带来的强大的自发现 ...
- nanomsg安装和测试
最近在构建一个中间层的通信架构,本来想用dbus,在实验过程中发现dbus对于国产系统支持版本比较低,安装比较麻烦,今天无意中看中了nanomsg,尽管没有dbus那么强悍的生态,但基本能满足需求. ...
- Action Script 3.0入门基本概念——IDE&编译与运行
[编写ActionScript代码的工具] ActionScript代码是用纯文本编写的,所以ActionScript程序可以仅由简单的文本编辑器来创建,如Windows上的记事本或Macintosh ...
- 一张图包含SEO一切要点
看到一张好图 from http://www.rongyipiao.com/?p=8