Python 的 Requests 和 Httpx 在爬取应用中的一个区别

HTTPX是功能齐全的Python3的HTTP客户端，支持同步和异步API，支持HTTP/1.1 和 HTTP/2。

一般情况下，在爬取网页内容的时候，httpx 与 requests 的基本使用方法几乎是一模一样的。

比如：

import httpx

r = httpx.get('https://xxx.org/get')

print(r)  # <Response [200 OK]>

但是在遇到有重定向的访问时，httpx.get() 和 requests.get() 访问结果却不相同。主要原因是两个库的参数设置有差别。

httpx,get() 有一个参数 follow_redirects= 默认值是 False;而 requests.get() 中的类似参数 allow_redirects= 的默认值是 True.

所以，对 requests 可以正常爬取，而 httpx 却返回 status_code=301 的任务，可以使用指定参数的办法来解决。

import httpx

r = httpx.get('https://xxx.org/get',follow_redirects=True)`

Python 的 Requests 和 Httpx 在爬取应用中的一个区别的更多相关文章

利用python的requests和BeautifulSoup库爬取小说网站内容
1. 什么是Requests? Requests是用Python语言编写的,基于urllib3来改写的,采用Apache2 Licensed 来源协议的HTTP库. 它比urllib更加方便,可以节约 ...
一个自定义python分布式专用爬虫框架。支持断点爬取和确保消息100%不丢失，哪怕是在爬取进行中随意关停和随意对电脑断电。
0.此框架只能用于爬虫,由框架来调度url请求,必须按照此方式开发,没有做到类似celery的通用分布式功能,也不方便测试.可以使用另外一个,基于函数式编程的,调度一切函数的分布式框架,做到了兼容任何 ...
03：requests与BeautifulSoup结合爬取网页数据应用
1.1 爬虫相关模块命令回顾 1.requests模块 1. pip install requests 2. response = requests.get('http://www.baidu.com ...
初识python 之爬虫：使用正则表达式爬取“糗事百科 - 文字版”网页数据
初识python 之爬虫:使用正则表达式爬取"古诗文"网页数据的兄弟篇. 详细代码如下: #!/user/bin env python # author:Simple-Sir ...
初识python 之爬虫：使用正则表达式爬取“古诗文”网页数据
通过requests.re(正则表达式) 爬取"古诗文"网页数据. 详细代码如下: #!/user/bin env python # author:Simple-Sir # tim ...
【转载】教你分分钟学会用python爬虫框架Scrapy爬取心目中的女神
原文:教你分分钟学会用python爬虫框架Scrapy爬取心目中的女神本博文将带领你从入门到精通爬虫框架Scrapy,最终具备爬取任何网页的数据的能力.本文以校花网为例进行爬取,校花网:http:/ ...
py3+requests+re+urllib，爬取并下载不得姐视频
实现原理及思路请参考我的另外几篇爬虫实践博客 py3+urllib+bs4+反爬,20+行代码教你爬取豆瓣妹子图:http://www.cnblogs.com/UncleYong/p/6892688. ...
python爬虫爬取内容中，-xa0，-u3000的含义
python爬虫爬取内容中,-xa0,-u3000的含义 - CSDN博客 https://blog.csdn.net/aiwuzhi12/article/details/54866310
scrapy 在爬取过程中抓取下载图片
先说前提,我不推荐在sarapy爬取过程中使用scrapy自带的 ImagesPipeline 进行下载,是在是太耗时间了最好是保存,在使用其他方法下载我这个是在 https://blog.csd ...
Python 爬虫练习（二）爬取补天公益SRC厂商域名URL (2017年11月22日)
介绍下: 补天是国内知名的漏洞响应平台,旨在企业和白帽子共赢. 白帽子在这里提交厂商漏洞,获得库币和荣誉,厂商从这里发布众测.获取漏洞报告和修复建议. 在2017年3月份之前,补天的厂商域名URL是非 ...

随机推荐

前端js校验小数点
let result = (value.toString()).indexOf("."); if (result != -1 && value.toString() ...
安装指定版本homeassistant
pip3 install homeassistant==0.84.5
Python安装及配置教程
安装教程一.python3.6安装步骤 1.首先我们移步官网,下载最新版本的python-3.6.0.点我,我把你传送到python官网在DownLoad下拉框中点击Windows,选择要下载的文 ...
路飞项目 day02 全局日志、全局异常处理、封装Response、数据库准备
一.路飞项目全局日志配置那个代码不用死记硬背,知道一些地方是啥意思即可 1.复制django自带的日志模块的大代码到dev(settings)文件中 LOGGING = { 'version': ...
vue3 门户网站搭建5-图标
奈何 element 自带的图标太少,不够用,故打算使用 vite-plugin-svg-icons 组件来封装 svg-icon . ps: ui 框架选用的 element-ui,为了能跟 vue ...
@Configuration 配置类打断点后，一启动项目读取到该配置类的话就会进断点
@Configuration 配置类的话,打断点的时候,一启动项目就会读取配置信息,然后你在@Configuration 配置的类中打断点的话,一启动项目就会读取配置类,然后就会进断点,跟你平常的co ...
java表达式语言mvel2/ognl/spring-expression
<dependency> <groupId>or ...
从零搭建hadoop集群之安装虚拟机
1. 打开 VMware 2. 点击编辑 -> 虚拟网络编辑器点击VMnet8 选中NAT模式(于虚拟机共享主机的ip地址) 设置子网IP 点击NAT设置 3. 设置网关 :和子网IP ...
ES深分页
一.背景 1.ES默认分页from+size 2.在大数据量和深度分页的时候,效率非常低二.效率低原因 1.例如要查第501页的10条数据,from为5000,size为10 2.ES会查询并排序5 ...
Fiddler 教程【转】
作者: 小坦克来源: 博客园发布时间: 2012-07-07 14:20 阅读: 71973 次推荐: 45 原文链接 [收藏] 阅读目录 Fiddler的基本介绍 Fiddl ...

Python 的 Requests 和 Httpx 在爬取应用中的一个区别

Python 的 Requests 和 Httpx 在爬取应用中的一个区别的更多相关文章

随机推荐

热门专题