Python爬虫---requests库快速上手

一、requests库简介

requests是Python的一个HTTP相关的库

requests安装：

pip install requests

二、GET请求

import requests   # 首先导入reqeusts模块

res = requests.get(     # 使用requests模拟浏览器发送一个get请求

    url="https://www.baidu.com",   # 指定访问的网址

)

# 打印响应内容：网站的源代码

print(res.text)

# 打印二进制响应内容;我们在拉取音乐、视频等使用

print(res.content)

reqeusts初体验

我们发送get请求时，如果URL参数需要携带参数，那么数据会以键/值对的方式置于URL中，跟在一个问号的后面，例如：ttps://www.baidu.com/s?wd=hello

import requests

#get请求，携带参数信息

#http://httpbin.org/get?key1=value1&key2=value2

payload = {'key1': 'value1', 'key2': 'value2'}

r = requests.get("http://httpbin.org/get", params=payload)

print(r.text)

get请求url携带参数

你还可以将一个列表作为值传入：

#http://httpbin.org/get?key1=value1&key2=value2&key2=value3

payload = {'key1': 'value1', 'key2': ['value2', 'value3']}

r = requests.get("http://httpbin.org/get", params=payload)

传输多个值得时候

三、POST请求

通常，如果你想要发送一些编码为表单形式得数据的时候，只需要简单的给request的data传递一个字典即可。你的数据在发送请求时会自动编码为表单形式：

import requests

payload = {'key1': 'value1', 'key2': 'value2'}

# 类似我们的请求体中的数据

r = requests.post("http://httpbin.org/post", data=payload)

print(r.text)

post请求

很多时候，你想发送出去的数据并非编码为表单形式，如果你想传输一个json字符串，而不是一个字典，那么数据会被直接发送过去

例如，Github API v3 接受编码为 JSON 的 POST/PATCH 数据：

import requests

import json

payload = {'some': 'data'}

url = 'https://api.github.com/some/endpoint'

r = requests.post(url, data=json.dumps(payload))

print(r.text)

post请求发送一个json字符串

四、requests参数总结

　　 :param method: 请求方法

    :param url: 目标地址的URL

    :param params: 请求参数：可以是字符串、字节、字典

    :param data:   可以是字典、字符串、字节、文件对象，发送的时候会在请求体中携带

    :param json: 将json中对应的数据进行序列化成一个字符串，在请求体中发送给服务器，并且Content-Type是 {'Content-Type': 'application/json'}

    :param headers: 请求头数据

    :param cookies: 请求携带的cookie

    :param files: 向服务器发送文件数据

    :param auth: Auth tuple以启用基本的/摘要/自定义http auth。

    :param timeout: 等待服务器响应时间，可以是浮点数

    :param allow_redirects: 是否允许自动重定向，True(默认),Flase

    :param proxies: 字典映射协议到代理的URL。

    :param verify: 控制我们是验证服务器的TLS证书，还是字符串，在这种情况下，它必须是CA包的路径才能使用。默认为“True”。

    :param stream: 是否以流的形式读取服务器传来的数据

    :param cert: 如果是字符串，则为SSL客户端证书文件(.pem)的路径。如果是元组，(‘cert’，‘key’)对。

五、响应

import requests

import json

payload = {'some': 'data'}

url = 'https://api.github.com/some/endpoint'

r = requests.post(url, data=json.dumps(payload))

# 获取响应头

print(r.headers)

print(r.headers['Content-Type'])  # 'application/json'

print(r.headers.get('content-type'))  # 'application/json'

# 获取响应cookie

print(r.cookies['example_cookie_name'])

print(r.cookies.get_dict())

# 获取响应体

print(r.text)

# 获取响应体(二进制形式)

print(r.content)

# 重定向与请求历史

print(r.url)

print(r.status_code)  # 响应状态码

print(r.history)

# json响应内容

print(r.json())  # [{u'repository': {u'open_issues': 0, u'url': 'https://github.com/...

Python爬虫---requests库快速上手的更多相关文章

Python爬虫—requests库get和post方法使用
目录 Python爬虫-requests库get和post方法使用 1. 安装requests库 2.requests.get()方法使用 3.requests.post()方法使用-构造formda ...
Python爬虫--Requests库
Requests Requests是用python语言基于urllib编写的,采用的是Apache2 Licensed开源协议的HTTP库,requests是python实现的最简单易用的HTTP库, ...
【Python成长之路】Python爬虫 --requests库爬取网站乱码（\xe4\xb8\xb0\xe5\xa）的解决方法【华为云分享】
[写在前面] 在用requests库对自己的CSDN个人博客(https://blog.csdn.net/yuzipeng)进行爬取时,发现乱码报错(\xe4\xb8\xb0\xe5\xaf\x8c\ ...
Python爬虫 requests库基础
requests库简介 requests是使用Apache2 licensed 许可证的HTTP库. 用python编写. 比urllib2模块更简洁. Request支持HTTP连接保持和连接池,支 ...
python爬虫---requests库的用法
requests是python实现的简单易用的HTTP库,使用起来比urllib简洁很多因为是第三方库,所以使用前需要cmd安装 pip install requests 安装完成后import一下 ...
python爬虫——requests库使用代理
在看这篇文章之前,需要大家掌握的知识技能: python基础 html基础 http状态码让我们看看这篇文章中有哪些知识点: get方法 post方法 header参数,模拟用户 data参数,提交 ...
Python 爬虫-Requests库入门
2017-07-25 10:38:30 response = requests.get(url, params=None, **kwargs) url : 拟获取页面的url链接∙ params : ...
python之requests模块快速上手
安装 pip3 install requests 使用发送请求 import requests r = requests.get('http://www.baidu.com') 还可以如下方式发送不 ...
python中requests库使用方法详解
目录 python中requests库使用方法详解官方文档什么是Requests 安装Requests库基本的GET请求带参数的GET请求解析json 添加headers 基本POST请求 ...

随机推荐

hihocoder1711 评论框排版[并查集+set]
#include <cstdio> #include <iostream> #include <set> using namespace std; ; struct ...
【BZOJ4774】修路（动态规划，斯坦纳树）
[BZOJ4774]修路(动态规划,斯坦纳树) 题面 BZOJ 题解先讲怎么求解最小斯坦纳树. 先明白什么是斯坦纳树. 斯坦纳树可以认为是最小生成树的一般情况.最小生成树是把所有给定点都要加入到联通 ...
CentOS安装oracleJDK
实践证明,oracleJDK比openJDK快不止一星半点,换了之后立马从满负载降到个位数负载. 1.卸载openjdk # rpm -qa | grep -E '^(java|jdk)' # yum ...
安装logstash5.4.1，并使用grok表达式收集nginx日志
关于收集日志的方式,最简单性能最好的应该是修改nginx的日志存储格式为json,然后直接采集就可以了. 但是实际上会有一个问题,就是如果你之前有很多旧的日志需要全部导入elk上查看,这时就有两个问题 ...
Chapter 7(图)
1.Prim算法生成最小生成树 //Prim算法生成最小生成树 void MiniSpanTree_Prim(MGraph G) { int min,i,j,k; int adjvex[MAXVEX] ...
Docker容器跨主机通信--overlay网络
一.Docker主机间容器通信的解决方案 Docker网络驱动 Overlay: 基于VXLAN封装实现Docker原生Overlay网络 Macvlan: Docker主机网卡接口逻辑上分为多个子接 ...
发现视口（窗口）自适应的新大陆！！vw、vh
从事前端已经1年了,一直为背景自适应铺满整个屏幕而苦苦发愁,因为要适配不同的pc显示器,所以高度不能写死,但是写(height:100%)并不能实现,愁死我了~我要不用写好的css框架实现或者自己写j ...
mysql 同步数据到 ElasticSearch 的方案
MySQL Binlog 要通过 MySQL binlog 将 MySQL 的数据同步给 ES, 我们只能使用 row 模式的 binlog.如果使用 statement 或者 mixed forma ...
Hadoop基础-序列化与反序列化（实现Writable接口）
Hadoop基础-序列化与反序列化(实现Writable接口) 作者:尹正杰版权声明:原创作品,谢绝转载!否则将追究法律责任. 一.序列化简介 1>.什么是序列化序列化也称串行化,是将结构化 ...
Java基础-进程与线程之Thread类详解
Java基础-进程与线程之Thread类详解作者:尹正杰版权声明:原创作品,谢绝转载!否则将追究法律责任. 一.进程与线程的区别简而言之:一个程序运行后至少有一个进程,一个进程中可以包含多个线程 ...