一、背景说明

http请求的难易对一门语言来说是很重要的而且是越来越重要,但对于python一是urllib一些写法不太符合人的思维习惯文档也相当难看,二是在python2.x和python3.x中写法还有差别。

实在是太难用,开始差点由于这个原因想放弃python,直到看urllib.request文档时看到下边这句话,认识了requests。总的而言requests配得上“HTTP for Humans”的口号。

1.1 适用版本

适用于python2.6、python2.7、python3.4及以上版本,参见官方说明。我这里使用的是当前最新的python3.7。

1.2 安装requests模块

  1. pip install requests
  2. # ubuntu类系统也可以直接用apt安装
  3. # sudo apt-get install python-requests

二、使用requests模块完成各种操作

下边对于https的链接请求时会带上”verify=False“参数,因为默认Python会进行证书校验如果不是信任的证书会报错,带上”verify=False“指示不进行证书校验。

2.1 引用requests模块

  1. import requests

2.2 get请求

  1. import requests
  2.  
  3. url='https://www.baidu.com'
  4. r = requests.get(url,verify=False)
  5. print(r.status_code)

2.3 post请求

  1. import requests
  2.  
  3. url='https://www.baidu.com'
  4. data='username=ls&password=toor'
  5. r = requests.post(url,data=data,verify=False)
  6. print(r.status_code)

当前很多api是以json形式提交的,所以在使用post的时候我们可能想提交json数据。

提交json有两步:一是data要编码成json形式(python中的字典形式上和json一样但本质上不一样所以要编码),二是设置“Content-type”头的值为application/json(设置头部参见下面2.5,这里先用)

  1. import json
  2. import requests
  3.  
  4. # 一定要设置Content-Type值为application/json
  5. headers={}
  6. headers['Content-Type']='application/json'
  7.  
  8. url='https://www.baidu.com'
  9. data={"username":"ls","password":"toor"}
  10. # 一定要用json.dumps把data格式化成json
  11. # r = requests.post(url,headers=headers,data=json.dumps(data),verify=False)
  12. # 或者直接使用json参数代替data,此时requests会自动进行格式化和设置Content-Type头的工作
  13. r = requests.post(url,json=data,verify=False)
  14. print(r.status_code)

为了方便对比验证,另外再附curl post提交的方法:

  1. curl -H "Content-Type:application/json" -X POST --data '{"username": "ls","password":"toor"}' https://www.baidu.com/

2.4 使用代理

  1. import requests
  2.  
  3. url='http://docs.python-requests.org/en/master/'
  4. proxies={
  5. 'http':'127.0.0.1:8080',
  6. 'https':'127.0.0.1:8080'
  7. }
  8. r = requests.get(url,proxies=proxies)
  9. print(r.status_code)

2.5 自定义header

  1. import requests
  2.  
  3. url='http://docs.python-requests.org/en/master/'
  4. headers={
  5. 'User-Agent':'self-defind-user-agent',
  6. 'Cookie':'name=self-define-cookies-in header'
  7. }
  8. r = requests.get(url,headers=headers)
  9. print(r.status_code)

2.6 自定义Cookie

实验发现如果自定义header中定义了cookies那么此处设置的cookies不生效

  1. import requests
  2.  
  3. url='http://docs.python-requests.org/en/master/'
    cookies={'name1':'cookie1','name2':'cookies2'}
    #cookies=dict(name1='cookie1',name2='cookies2')
    r = requests.get(url,cookies=cookies)
    print(r.status_code)

2.7 会话保执

经常很多请求只有在登录后才能进行,实现登录效果一般的做法是执行登录请求,然后从返回结果中提取sessionid放入自定义cookie中。

这种方法在requests中也行得通,但requests提供了更为简单的方法,直接使用request.Session类来请求即可,其保持登录的原理是保留之前请求中服务端通过set-cookie等设置的参数。

  1. s = Session()
  2. url='http://docs.python-requests.org/en/master/'
  3. # 所有方法和直接使用requests时一样用即可
  4. s.get(url)

参考:

http://docs.python-requests.org/en/master/(官方文档)

https://www.cnblogs.com/landhu/p/7048255.html

https://stackoverflow.com/questions/9733638/post-json-using-python-requests

python3使用requests模块完成get/post/代理/自定义header/自定义Cookie的更多相关文章

  1. Python3:Requests模块的异常值处理

    Python3:Requests模块的异常值处理 用Python的requests模块进行爬虫时,一个简单高效的模块就是requests模块,利用get()或者post()函数,发送请求. 但是在真正 ...

  2. python3 get/post/使用代理/自定义header/自定义Cookie

    说明:urllib发送http请求并不是很人性化,更推荐使用在urllib基础上封装的.python2和python3都兼容的requests模块,移步查看. 一.get请求 get请求就是在构造Re ...

  3. Python3之Requests模块详解

    # 导入 Request模块 # 若本机无自带Request模块,可自行下载或者使用pip进行安装 # python版本Python3 import requests import json #### ...

  4. [实战演练]python3使用requests模块爬取页面内容

    本文摘要: 1.安装pip 2.安装requests模块 3.安装beautifulsoup4 4.requests模块浅析 + 发送请求 + 传递URL参数 + 响应内容 + 获取网页编码 + 获取 ...

  5. (转)Python3之requests模块

    原文:https://www.cnblogs.com/wang-yc/p/5623711.html Python标准库中提供了:urllib等模块以供Http请求,但是,它的 API 太渣了.它是为另 ...

  6. Python3之requests模块

    Python标准库中提供了:urllib等模块以供Http请求,但是,它的 API 太渣了.它是为另一个时代.另一个互联网所创建的.它需要巨量的工作,甚至包括各种方法覆盖,来完成最简单的任务. 发送G ...

  7. (四)requests模块的cookies和代理操作

    基于requests模块的cookie操作 引言:有些时候,我们在使用爬虫程序去爬取一些用户相关信息的数据(爬取某个人“人人网”个人主页数据)时,如果使用之前requests模块常规操作时,往往达不到 ...

  8. Python——python3的requests模块的导入

    前言 突然就要搞python,我这个心哦~ 版本 | python 3.7 步骤 配置环境变量 右击-->属性-->打开文件位置 进入到脚本目录: C:\Users\Administrat ...

  9. 03爬虫-requests模块基础(1)

    requests模块基础 什么是requests模块 requests模块是python中原生基于网络模拟浏览器发送请求模块.功能强大,用法简洁高效. 为什么要是用requests模块 用以前的url ...

随机推荐

  1. gulp常用方法

    var gulp = require('gulp'); var concat = require('gulp-concat'); //使用gulp-concat合并文件,减少网络请求(静态资源数量): ...

  2. Qt532.容器QMap&QMultiMap

    PS: QMap 一个Key 只能对应 一个Value (不是绝对的情况...内部都有 一个key对应多个value的机制) PS: QMultiMap 一个Key 可以对应 多个Value PS:  ...

  3. Discrete Log Algorithms :Baby-step giant-step 【二】

    import gmpy2 def discreteLog(g,p,a): #离散对数,求 g^x=a mod p中的x table={} sq=gmpy2.isqrt(p-1) m=gmpy2.add ...

  4. Android AndFix修复方式的限制

    这里阅览了很多网上关于修复的资料,一一贴在这里便于查看: https://github.com/alibaba/AndFix  这是官方处  要了解使用,一定得看看这里. http://www.jia ...

  5. 力扣(LeetCode)520. 检测大写字母

    给定一个单词,你需要判断单词的大写使用是否正确. 我们定义,在以下情况时,单词的大写用法是正确的: 全部字母都是大写,比如"USA". 单词中所有字母都不是大写,比如"l ...

  6. tensorflow example1

    用tensorflow实现J(w)=w**2-10*w+25的微分结果 import numpy as npimport tensorflow as tf w=tf.Variable(0,dtype= ...

  7. 关于vue的语法规则检测报错问题

    搭建了一个vue项目,在配置路有的时候,陆续出现了各种报错其中最多的是一些写法,例如空格,缩进,各种括号,结果我一句一句对照,修改相当之费时间,效率低,一上午,一个路由配置都没写好 主要报错如下: 截 ...

  8. 让browserify接收命令行参数,在打包时parse yml配置文件

    功能需求: 1用browserify把各种js打包成浏览器端的1个bundle.js,含有yml配置文件 约束: 1 yml配置文件不在当前工程里(现在还不知道放哪里,以后也会变),希望在打包时,用命 ...

  9. vscode下ts-node传入cli参数

    ts-node写ts,启动时习惯在package.json里写 "scripts": { "build-ts": "tsc", " ...

  10. LeetCode第[20]题(Java):Valid Parentheses

    题目:有效的括号序列 难度:Easy 题目内容: Given a string containing just the characters '(', ')', '{', '}', '[' and ' ...