Requests 库
Requests 库的两个重要的对象:(Request , Response)
Response对象的属性:
import requests
r =requests.get('http://www.bilibili.com') response 对象 <Response [200]> print(r.status_code) # 200状态码-----404错误
print(r.headers) # 请求码
print(r.text) # 字符串形式
print(r.encoding) # 网页的编码方式-根据headers猜测
print(r.apparent_encoding) # 根据内容响应的编码方式(r.encoding=r.apparent_encoding)
print(r.content) # 二进制形式
requests 库的7个重要的方法:
=============== requests 库的7个重要的方法 ============== ---1 requests.request(method,url,**kwargs)
---2 requests.get(url,params=None,**kwargs)
---3 requests.head(url,**kwargs)
---4 requests.post(url,data=None,json=None,**kwargs)
---5 requests.put(url,data=None,**kwargs)
---6 requests.patch(url,data=None,**kwargs)
---7 requests.delete(url,**kwargs)
Requests 请求的通用代码框架:
=== 通用框架 ===
import requests def getHTMLText(url):
try:
r=requests.get(url,timeout=30) # <Response [200]>
r.raise_for_status() # 如果状态码不是200,引发HTTPError异常
r.encoding=r.apparent_encoding
return r.text
except:
return 'Error!'
if __name__=='__main__':
url='http://www.baidu.com'
print(getHTMLText(url))
伪装浏览器请求:
常用请求头: Mozilla/5.0 (Windows; U; MSIE 9.0; Windows NT 9.0; en-US)
#opera浏览器
Opera/9.80 (X11; Linux i686; U; ru) Presto/2.8.131 Version/11.11
#chrome浏览器
Mozilla/5.0 (Windows NT 6.1) AppleWebKit/537.2 (KHTML, like Gecko) Chrome/22.0.1216.0 Safari/537.2
#firefox浏览器
Mozilla/5.0 (Windows NT 6.2; Win64; x64; rv:16.0.1) Gecko/20121011 Firefox/16.0.1
#safri浏览器
Mozilla/5.0 (iPad; CPU OS 6_0 like Mac OS X) AppleWebKit/536.26 (KHTML, like Gecko) Version/6.0 Mobile/10A5355d Safari/8536.25
例子 1 跟换请求头 亚马逊通会过来源审查 阻止访问-----需要更改请求头 import requests
url='https://www.amazon.cn/dp/B07473FZXY?_encoding=UTF8&ref_=pc_cxrd_658390051_recTab_335775071_t_3&pf_rd_p=7e00fee6-4e12-48f0-b4af-b99068b52067&pf_rd_s=merchandised-search-4&pf_rd_t=101&pf_rd_i=658390051&pf_rd_m=A1AJ19PSB66TGU&pf_rd_r=1SV7P98M8XX2E5N2PBW5&pf_rd_r=1SV7P98M8XX2E5N2PBW5&pf_rd_p=7e00fee6-4e12-48f0-b4af-b99068b52067'
try:
header={'User-Agent':'Mozilla/5.0'} # 'Mozilla/5.0'---浏览器身份标识
r=requests.get(url,headers=header)
r.raise_for_status()
r.encoding=r.apparent_encoding
print(r.text[1000:2000])
except Exception:
print('Error!') print(r.request.url) #当前请求的网页 https://www.amazon.cn/%E5%9B%BE%E4%B9%A6/dp/B07473FZXY
print(r.request.headers) # 当前的请求头 {'User-Agent': 'python-requests/2.18.2', 'Accept-Encoding': 'gzip, deflate', 'Accept': '*/*', 'Connection': 'keep-alive'}
例子 2 关键字搜索--百度 import requests
keyword={'wd':'Python'}
url='https://www.baidu.com/s'
try:
r=requests.get(url,params=keyword)
r.raise_for_status()
r.encoding=r.apparent_encoding
print(r.request.url)
# print(len(r.text))
print(r.text)
except Exception:
print('Error!')
例子 3 图片 爬取 与 保存 import requests
import os
url='http://pic1.16pic.com/00/14/32/16pic_1432548_b.jpg'
root=r'C:\Users\Administrator\Desktop'
path=root+'\\'+url.split('/')[-1]
try:
if not os.path.exists(root): # 根目录是否存在
os.mkdir(root)
elif not os.path.exists(path): # 文件是否存在
r=requests.get(url) # <Response [200]>
# print(r.status_code)
# print(r.content) # 二进制
with open(path,'wb') as f:
f.write( r.content ) # 二进制写入
print('文件操作成功!')
else:
print('文件已经存在!')
except:
print('Error!')
例子 5 ip 地址的归属地查询----ip138.com import requests
url='http://www.ip138.com/ips138.asp?ip='
ip='202.204.80.112'
url=url+ip
try:
r=requests.get(url)
# print(r) # ===回应==== <Response [200]>
# print(r.request.url) # ===请求==== http://www.ip138.com/ips138.asp?ip=202.204.80.112
r.raise_for_status()
r.encoding=r.apparent_encoding
print(r.text[-500:])
except:
print('Error!')
Requests 库的更多相关文章
- Python爬虫小白入门(二)requests库
一.前言 为什么要先说Requests库呢,因为这是个功能很强大的网络请求库,可以实现跟浏览器一样发送各种HTTP请求来获取网站的数据.网络上的模块.库.包指的都是同一种东西,所以后文中可能会在不同地 ...
- Requests库上传文件时UnicodeDecodeError: 'ascii' codec can't decode byte错误解析
在使用Request上传文件的时候碰到如下错误提示: 2013-12-20 20:51:09,235 __main__ ERROR 'ascii' codec can't decode byte 0x ...
- Requests库的几种请求 - 通过API操作Github
本文内容来源:https://www.dataquest.io/mission/117/working-with-apis 本文的数据来源:https://en.wikipedia.org/wiki/ ...
- python脚本实例002- 利用requests库实现应用登录
#! /usr/bin/python # coding:utf-8 #导入requests库 import requests #获取会话 s = requests.session() #创建登录数据 ...
- 大概看了一天python request源码。写下python requests库发送 get,post请求大概过程。
python requests库发送请求时,比如get请求,大概过程. 一.发起get请求过程:调用requests.get(url,**kwargs)-->request('get', url ...
- python WEB接口自动化测试之requests库详解
由于web接口自动化测试需要用到python的第三方库--requests库,运用requests库可以模拟发送http请求,再结合unittest测试框架,就能完成web接口自动化测试. 所以笔者今 ...
- python爬虫从入门到放弃(四)之 Requests库的基本使用
什么是Requests Requests是用python语言基于urllib编写的,采用的是Apache2 Licensed开源协议的HTTP库如果你看过上篇文章关于urllib库的使用,你会发现,其 ...
- (转)Python爬虫利器一之Requests库的用法
官方文档 以下内容大多来自于官方文档,本文进行了一些修改和总结.要了解更多可以参考 官方文档 安装 利用 pip 安装 $ pip install requests 或者利用 easy_install ...
- python requests库学习笔记(上)
尊重博客园原创精神,请勿转载! requests库官方使用手册地址:http://www.python-requests.org/en/master/:中文使用手册地址:http://cn.pytho ...
- 使用Python的requests库进行接口测试——session对象的妙用
from:http://blog.csdn.net/liuchunming033/article/details/48131051 在进行接口测试的时候,我们会调用多个接口发出多个请求,在这些请求中有 ...
随机推荐
- 剑指offer 面试21题
面试21题: 题目:调整数组的顺序使奇数位于偶数前面 题一:输入一个整数数组,实现一个函数来调整该数组中数字的顺序,使得所有奇数位于数组的前半部分,所有偶数位于数组的后半部分. 解题思路:使用两个指针 ...
- Python中使用MySQL
@1: 安装MySQL: lxw ~$ sudo apt-get install mysql-server 可以通过 sudo netstat -tap | grep mysql` 命令检查之后,如果 ...
- 011_Eclipse中使用HDFSFileSystemAPI事例介绍
需求 1.文件操作 1)上传本地文件到HDFS 2)读取文件 3)在hadoopfs中新建文件,并写入 4)重命名文件 5)删除hadoopfs上的文件 2.目录操作 1)读取某个目录下的所有文件 2 ...
- Redis集群环境搭建
Redis集群cluster环境搭建 描述:本章节主要单服务器搭建集群,在一个服务器上启动多个不同端口的redis服务,非真实环境. 真实环境下redis集群会搭建在多个物理服务器上,并非单一的服务器 ...
- mongodb简介和特性
1.mongodb是基于文档的(BSON,类似json的键值对来存储),不是基于表格,易于水平扩展,将内部相关的数据放在一起能提高数据库的操作性能.如果你想新建一个新的文档类型,不用事先告诉数据库关于 ...
- java中类名.class, class.forName(), getClass()区别
Class对象的生成方式如下: 1.类名.class 说明: JVM将使用类装载器, 将类装入内存(前提是:类还没有装入内存),不做类的初始化工作.返回Class的对象 2.Cla ...
- Qt5.4.1移植到arm——Linuxfb篇
Qt5与Qt4对比有很大的改变,其最大的特性在于模块化,并且很明显的是不再见到Qt4用到的qws,Qt5新增了QPA系统,基于QPA使得Qt5移 植到一个新平台非常简单而又具有极强的底层扩展能力:同时 ...
- linux开发应用程序到运行的过程
1.给linux配置交叉编译环境 2.在windows下使用source insight写程序,一共有m个h文件,n个c文件,k个main函数 3.将源代码放在linux里 4.在源代码文件夹里新建m ...
- IEnumerable的一些基本方法 补充
接上一篇,我们发现两表连接方式默认为内连接,而我们在SQL中常用到的左连接没有封装方法.换句话说,微软放弃两表左连或右连的这种做法(只有在2个表都存在值时,这样的连接才有意义). 如果要实现表的左连接 ...
- Idea根据表自动生成实体
Idea根据表自动生成实体: 首先说下这种方式有个缺点,就是如果表里面有日期.时间类型,那么需要手动的设置映射类型 第一步:在Idea中配置好数据库: 在Idea窗口右边,点击Database按钮 配 ...