Requests 入门
首先直接通过管理员运行cmd,然后执行 pip install requests 就可以直接安装Requests库了
有个最基本的语句
r = requests.get(url)
通过requests.get,构造一个向服务器请求资源的Request对象(是python内部生成的)
get() 返回的内容用r来表示,其中r是 Response 对象,它包含所有的服务器资源,我们可以从这个对象中获取所有我们想要的信息。
完整的使用方法是 r = requests.get( url, params = None, **kwargs)
在Response的对象(即r)属性中
——r.status_code HTTP请求的返回状态,200表示连接成功,404或其他表示失败
——r.text HTTP响应内容的字符串形式,即,url 对应的页面内容
——r.encoding 从HTTP header 中猜测的响应内容的编码方式
——r.apparent_encoding 从内容中分析响应内容的变法方式(常用的备选编码方式、更加准确)
——r.content HTTP响应内容的二进制形式
Requests库的异常
——requests.ConnectionError 网络连接错误异常
——requests.HTTPError HTTP错误异常
——requests.URLRequired URL缺失异常
——requests.TooManyRedirects 超过最大重定向次数,产生重定向异常
——requests.ConnectTimeout 连接远程服务器超时异常
——requests.Timeout 请求URL超时,产生异常
爬取网页的通用代码框架
def getHTMLText(url):
try:
r = requests.get(url, timeout = 30)
r.raise_for_status() #如果状态不是200,引发HTTPError异常
r.encoding = r.apparent_encoding
return r.text
except:
return "产生异常"
requests.request( method, url, **kwargs)
// method :请求方式
r = requests.request( 'GET', url, **kwargs)
r = requests.request( 'HEAD', url, **kwargs)
r = requests.request( 'POST', url, **kwargs)
r = requests.request( 'PUT', url, **kwargs)
r = requests.request( 'PATCH', url, **kwargs)
r = requests.request( 'delete', url, **kwargs)
r = requests.request( 'OPTIONS', url, **kwargs)
**kwargs : 控制访问的参数,均为可选项
——params 字典或字节序列,作为参数增加到 url 中
——data 字典、字节序列或文件对象,作为Request 的内容
——json JSON格式的数据,作为Request 的内容
——headers 字典,HTTP定制头
——cookies 字典或CookieJar, Request中的cookie
——auth 元组,支持HTTP认证功能
——files 字典类型,传输文件
——timeout 设定超时时间,秒为单位
——proxies 字典类型,设定访问代理服务器,可以增加登录认证
(高级功能)
——allow_redirects True/False,默认为True,重定向开关
——stream True/False,默认为True,获取内容立即下载
——verify True/False,默认为True,认证SSL证书开关
——cert 本地SSL证书路径
Requests 入门的更多相关文章
- requests入门实践02_下载斗图拉最新表情包
新版本移步:https://www.cnblogs.com/zy7y/p/13376228.html 下载斗图拉最新表情包 要爬取的目标所在网址:http://www.doutula.com/phot ...
- requests入门实践01_下载2560*1080的电脑壁纸
新版本移步:https://www.cnblogs.com/zy7y/p/13376228.html 附上代码 # !usr/bin/env python # -*- coding:utf-8 -*- ...
- requests入门大全
02 requests接口测试-requests的安装 安装常见问题 提示连接不上,443问题 一般是因为浏览器设置了代理,关闭代理. 网络加载慢,设置国内镜像地址 1.pip安装 2.pycharm ...
- requests入门
1.通过GET请求获得搜索结果的网页源代码 import requests name=input("请输入想要搜索的明星:") url=f'https://www.sogou.co ...
- requests-html库轻体验-HTMLSession下载表情包
requests-html实战,HTMLSession下载斗图啦最新表情包 前言 在这篇文章之前,我写了requests入门实践02_下载斗图拉最新表情包用正则表达式提取url,来下载斗图啦最新表情包 ...
- 转:Python requests 快速入门
迫不及待了吗?本页内容为如何入门Requests提供了很好的指引.其假设你已经安装了Requests.如果还没有, 去 安装 一节看看吧. 首先,确认一下: ·Requests 已安装 ·Reques ...
- 爬虫入门系列(二):优雅的HTTP库requests
在系列文章的第一篇中介绍了 HTTP 协议,Python 提供了很多模块来基于 HTTP 协议的网络编程,urllib.urllib2.urllib3.httplib.httplib2,都是和 HTT ...
- 爬虫入门系列(三):用 requests 构建知乎 API
爬虫入门系列目录: 爬虫入门系列(一):快速理解HTTP协议 爬虫入门系列(二):优雅的HTTP库requests 爬虫入门系列(三):用 requests 构建知乎 API 在爬虫系列文章 优雅的H ...
- 【网络爬虫入门02】HTTP客户端库Requests的基本原理与基础应用
[网络爬虫入门02]HTTP客户端库Requests的基本原理与基础应用 广东职业技术学院 欧浩源 1.引言 实现网络爬虫的第一步就是要建立网络连接并向服务器或网页等网络资源发起请求.urllib是 ...
随机推荐
- MYSQL数据库装在C盘的,怎么移到D盘
直接移动过去就是了,遇到问题再根据提示修改. 一般需要移动前删除已经安装的MYSQL服务,命令是:mysqld.exe --remove移动后重新安装服务,命令是:mysqld.exe --insta ...
- int 转十六进制
//使用1字节就可以表示bpublic static String numToHex8(int b) { return String.format("%02x", b ...
- ThinkPHP验证码不现实的处理方法
ThinkPHP测试的时候遇到验证码不显示的问题,主要解决思路如下: 1.php.ini是否开启gd库: 2.页面编码是否一致: 3.检查页面头部信息BOM,这是最主要的,把下面代码复制到根目录下,然 ...
- spring事件广播
可参考:http://www.cnblogs.com/atyou/archive/2013/01/07/2850106.html 其中的类图更是精彩,现截至如下:
- platform_set_drvdata和platform_get_drvdata用法【转】
本文转载自:http://www.cnblogs.com/wangxianzhen/archive/2013/04/09/3009530.html 在用到Linux设备驱动的platform框架时,常 ...
- jquery特效(3)—轮播图①(手动点击轮播)
写了一个轮播图练练手,先写了一个手动点击轮播的轮播图,随后我会慢慢接着深入写自动轮播图和鼠标悬浮图片停止移动轮播图等,虽然今天我生日,但是代码还是得写的,不能找借口放松自己,原地踏步也算后退. 下面来 ...
- Codeforces Round #376 (Div. 2) A. Night at the Museum —— 循环轴
题目链接: http://codeforces.com/contest/731/problem/A A. Night at the Museum time limit per test 1 secon ...
- python berkeley DB操作——打开btree索引文件中的database
打开BDB中某个索引中的数据库代码: from bsddb3 import db import bsddb3 as bsddb print db.DB_VERSION_STRING mydb = db ...
- python中通过xlwt、xlrd和xlutils操作xls
xlwt模块用于在内存中生成一个xls/xlsx对象,增加表格数据,并把内存中的xls对象保存为本地磁盘xls文件; xlrd模块用于把本地xls文件加载到内存中,可以读取xls文件的表格数据,查询x ...
- 三剑客之awk数组实战
shell数组for循环 第一种: #!/bin/sh array=(1 2 3) for i in ${array[*]} do echo $i done 第二种: #!/bin/sh ...