python网络爬虫（二）requests库的基本介绍和使用

一、requests库的七个重要方法

（1）最常用方法：requests.get（url,params=None,**kwargs）//对应HTTP协议的GET()操作（请求获得URL位置的资源）

　　　　　　　① url:拟获取页面的url链接。url：在WWW上，每一信息资源都有统一的且在网上唯一的地址，

　　　　　　　　该地址就叫URL（Uniform Resource Locator,统一资源定位符），它是WWW的统一资源定

　　　　　　　　位标志，就是指网络地址。例：http://baidu.com

　　　　　　　② params:url中的额外参数,字典或字节流格式，可选字段

　　　　　　　③ **kwargs：12个控制访问的参数（在下一篇文章会具体介绍参数的具体内容哦~）

（2）最基础的方法：requests.request()

　　　　　构造一个请求，支撑6个剩余方法的基础方法，查看其他6个方法的解释（用help函数）

　　　　　会发现基本上是由request()方法写的

（3）requests.head()

　　　　对应HTTP协议的HEAD操作（请求获取URL位置的资源的响应消息报告，即获得该资源的头部信息）

　　　　head() 反馈头部信息

（4）requests.post()

　　　　对应HTTP协议的POST操作 (请求向URL位置的资源后附加新数据)

　　　　post()方法向服务器提交新增数据

　　　　　　　　例：向URL post一个字典时自动编码为form(表单)

　　　　　　　　　　向URL post一个字符串时自动编码为data

（5）requests.put()

　　　　对应HTTP协议的PUT操作(请求向URL位置存储资源（覆盖原URL位置资源）)

（6）requests.patch()

　　　　对应HTTP协议的PATCH操作(请求局部更新URL位置的资源)

　　　　post()方法向服务器提交新增局部数据，和put不同的是,只修改某个参数,其他的和之前的

　　　　一样;但是post()会覆盖之前的数据，若提交了修改的数据，则其他的就相当于丢失.

（7）requests.delete()

　　　　对应HTTP协议的DELETE操作(请求删除URL位置存储的资源)

　　　　delete()删除资源

--------------------

python网络爬虫（二）requests库的基本介绍和使用的更多相关文章

python网络爬虫之requests库二
前面一篇在介绍request登录CSDN网站的时候,是采用的固定cookie的方式,也就是先通过抓包的方式得到cookie值,然后将cookie值加在发送的数据包中发送到服务器进行认证. 就好比获取如 ...
python网络爬虫之requests库
Requests库是用Python编写的HTTP客户端.Requests库比urlopen更加方便.可以节约大量的中间处理过程,从而直接抓取网页数据.来看下具体的例子: def request_fun ...
04.Python网络爬虫之requests模块（1）
引入 Requests 唯一的一个非转基因的 Python HTTP 库,人类可以安全享用. 警告:非专业使用其他 HTTP 库会导致危险的副作用,包括:安全缺陷症.冗余代码症.重新发明轮子症.啃文档 ...
06.Python网络爬虫之requests模块（2）
今日内容 session处理cookie proxies参数设置请求代理ip 基于线程池的数据爬取知识点回顾 xpath的解析流程 bs4的解析流程常用xpath表达式常用bs4解析方法引入 ...
Python网络爬虫之requests模块（2）
session处理cookie proxies参数设置请求代理ip 基于线程池的数据爬取 xpath的解析流程 bs4的解析流程常用xpath表达式常用bs4解析方法引入有些时候,我们在使用爬 ...
Python网络爬虫之requests模块（1）
引入 Requests 唯一的一个非转基因的 Python HTTP 库,人类可以安全享用. 警告:非专业使用其他 HTTP 库会导致危险的副作用,包括:安全缺陷症.冗余代码症.重新发明轮子症.啃文档 ...
Python网络爬虫之requests模块
今日内容 session处理cookie proxies参数设置请求代理ip 基于线程池的数据爬取知识点回顾 xpath的解析流程 bs4的解析流程常用xpath表达式常用bs4解析方法引入 ...
Python 网络爬虫的常用库汇总
爬虫的编程语言有不少,但 Python 绝对是其中的主流之一.下面就为大家介绍下 Python 在编写网络爬虫常常用到的一些库. 请求库:实现 HTTP 请求操作 urllib:一系列用于操作URL的 ...
04，Python网络爬虫之requests模块（1）
引入 Requests 唯一的一个非转基因的 Python HTTP 库,人类可以安全享用. 警告:非专业使用其他 HTTP 库会导致危险的副作用,包括:安全缺陷症.冗余代码症.重新发明轮子症.啃文档 ...
Python网络爬虫(二)
Urllib库之解析链接 Urllib库里有一个parse这个模块,定义了处理URL的标准接口,实现 URL 各部分的抽取,合并以及链接转换.它支持如下协议的 URL 处理:file.ftp.goph ...

随机推荐

javascript DOM练习
一.定时器 <!DOCTYPE html> <html lang="zh-CN"> <head> <meta charset=" ...
c#数字图像处理（五）全等级直方图灰度拉伸
灰度拉伸也属于线性点运算的一种,也可以通过上一节的程序得到.但由于它在点运算的特殊性,所以把它单独列出来进行介绍. 灰度拉伸定义如果一幅图像的灰度值分布在全等级灰度范围内,即在0~255之间,那么它 ...
创建dynamics CRM client-side (二) - Client API
如果我们想用script来直接在form上做一些修改, 我们需要用到client api 来做交互. 我们可以用以下来理解: Form <---> Client API <---&g ...
SpringBoot系列教程之事务传递属性
200202-SpringBoot系列教程之事务传递属性对于mysql而言,关于事务的主要知识点可能几种在隔离级别上:在Spring体系中,使用事务的时候,还有一个知识点事务的传递属性同样重要,本文 ...
对于传统scnece-classfication的分析
BoW模型最初应用于文本处理领域,用来对文档进行分类和识别.BoW 模型因为其简单有效的优点而得到了广泛的应用.其基本原理可以用以下例子来给予描述.给定两句简单的文档: 文档 1:“我喜欢跳舞,小明也 ...
数据结构与算法 --- js描述队列
js描述队列队列的特性是只能在队尾插入元素,在队首删除元素,先进先出: 队列被用在很多地方,比如提交操作系统执行的一系列进程,打印任务池,模拟现实中的排队: //队列类 function Queue ...
Centos 7 部署lnmp集群架构
前言介绍 lnmp的全程是 linux + nginx + mysql + php; lnmp就是上述系统及应用程序的简写组合: lnmp其实已经代表了一个用户正常对一个页面请求的流程,nginx接收 ...
mybatis入门案例分析
mybatis入门案例分析一.设计模式分析 public class MybatisTest { public static void main(String[] args) throws Exce ...
qt creator源码全方面分析(2-1)
目录 coding-style.html 提交代码二进制兼容性和源代码兼容性代码构造格式化利用标识符空格大括号圆括号换行符声明命名空间模式与实践命名空间传递文件名插件扩展点 ...
在VMware中如何清理多余的空间
问题描述平时用的编程计算机只有250G空间,c盘和d盘,今天准备做实验,发现删除虚拟机中系统的内容不但没有减少空间,反而增加了,这时我意识到虚拟机内部可能与咱们想象的操作模式不一样. 解决办法我的 ...

python网络爬虫（二）requests库的基本介绍和使用

python网络爬虫（二）requests库的基本介绍和使用的更多相关文章

随机推荐

热门专题