requests 模块笔记

import requests

请求方式：

    requests.get("https://www.baidu.com")

    requests.post("http://httpbin.org/post")

    requests.put("http://httpbin.org/put")

    requests.delete("http://httpbin.org/delete")

    requests.head("http://httpbin.org/get")

    requests.options("http://httpbin.org/get")

获取数据：

    r = requests.get('http://www.baidu.com') #像目标url地址发送get请求，返回一个response对象

    response.text返回的是Unicode格式，通常需要转换为utf-8格式。

    response.content是二进制模式，可以下载视频之类的，如果想看的话需要decode成utf-8格式。

    # response.content.decode("utf-8) 或 response.encoding="utf-8" 转码

    print(r.text)            # 返回响应的内容

　　print(r.content)        # 这样获取的数据是二进制数据

    print(r.url)            # 打印请求网址的地址

    print(r.status_code)    # 打印请求页面的状态（状态码）# r.ok的布尔值便可以知道是否登陆成功

    print(r.cookies)        # 打印请求网址的cookies信息

    print(r.headers)        # 打印请求网址的headers所有信息

    print(r.encoding)        # 获取/修改网页编码

    print(r.json())            # 返回json数据

    print(r.history)        # 打印请求的历史记录（以列表的形式显示）

# 下载图片

    response = requests.get("https://github.com/favicon.ico")

    with open('favicon.ico', 'wb') as f:

        f.write(response.content)

例子：往请求链接中添加一些数据(data、headers、cookies、proxies...)：

    import requests

    data = {'name': 'germey', 'age': ''}

    cookie = {'key':'value'}

    headers = {'User-Agent': 'Mozilla/5.0 (Macintosh; Intel Mac OS X 10_11_4) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/52.0.2743.116 Safari/537.36'}

    proxies = {"http": "http://127.0.0.1:9743}

    requests.get(url='https://www.baidu.com/baidu', params={'wd': 'python',})

    # 为url传递参数 https://www.baidu.com/baidu?wd=python     

    response = requests.post(

        "https://www.zhihu.com/explore",

        data=data,  # 如果传递的是string而不是dict，需要先调用dumps方法格式化一下

        cookies=cookie,

        headers=headers,

        proxies=proxies)

    print (response.headers.get('content-type')) #访问响应头部分内容


补：
    requests.get(url, allow_redirects=False)    # 不允许重定向，默认True
    # verify=False    # 关闭证书验证

其他操作

    会话维持

        cookie的一个作用就是可以用于模拟登陆，做会话维持

            import requests

            session = requests.session()

            session.get('http://httpbin.org/cookies/set/number/12456')

            response = session.get('http://httpbin.org/cookies')

            print(response.text)

    代理设置

        import requests

        proxies = {

          "http": "http://127.0.0.1:9743",                    # 设置普通代理

          "https": "https://127.0.0.1:9743",                # 设置普通代理

          "http": "http://user:password@127.0.0.1:9743/",    # 设置用户名和密码代理

        }

        response = requests.get("https://www.taobao.com", proxies=proxies)

        print(response.status_code)

        设置socks代理

            安装socks模块 pip3 install 'requests[socks]'

                import requests

                proxies = {

                    'http': 'socks5://127.0.0.1:9742',

                    'https': 'socks5://127.0.0.1:9742'

                }

                response = requests.get("https://www.taobao.com", proxies=proxies)

                print(response.status_code)

    超时设置

        import requests

        from requests.exceptions import ReadTimeout

        try:

            response = requests.get("http://httpbin.org/get", timeout = 0.5)#设置秒数超时，仅对于连接有效

            print(response.status_code)

        except ReadTimeout:

            print('Timeout')

    获取cookie

        import requests

        response = requests.get("https://www.baidu.com")

        print(response.cookies)

        for key, value in response.cookies.items():

            print(key + '=' + value)

    文件上传

        import requests

        files = {'file': open('favicon.ico', 'rb')}

        response = requests.post("http://httpbin.org/post", files=files)

        print(response.text)

    认证设置

        import requests

        from requests.auth import HTTPBasicAuth

        r = requests.get('http://120.27.34.24:9001', auth=HTTPBasicAuth('user', ''))

        # r = requests.get('http://120.27.34.24:9001', auth=('user', '123'))

        print(r.status_code)

    关闭证书验证

        import requests

        response = requests.get('https://www.12306.cn',verify=False)

        print(response.status_code)

    消除验证证书的警报

        from requests.packages import urllib3

        import requests

        urllib3.disable_warnings()

        response = requests.get('https://www.12306.cn',verify=False)

        print(response.status_code)

    手动设置证书

        import requests

        response = requests.get('https://www.12306.cn', cert=('/path/server.crt', '/path/key'))

        print(response.status_code)

    异常处理

        # RequestException继承IOError,

　　    # HTTPError，ConnectionError,Timeout继承RequestionException

　　    # ProxyError，SSLError继承ConnectionError

　　    # ReadTimeout继承Timeout异常

        import requests

        from requests.exceptions import ReadTimeout, ConnectionError, RequestException

        try:

            response = requests.get("http://httpbin.org/get", timeout = 0.5)

            print(response.status_code)

        except ReadTimeout:

            print('Timeout')

        except ConnectionError:

            print('Connection error')

        except RequestException:

            print('Error')

        # RequestException    # 发送一个模糊的异常

        # ConnectionError    # 发生连接错误时的异常

        # HTTPError            # 发生HTTP错误时的异常

        # URLRequired        # URL错误时的异常

        # ConnectTimeout    # 连接服务器是请求超时

        # ReadTimeout        # 服务器没有在指定的时间内发送数据

        # Timeout            # 请求超时

requests 模块笔记的更多相关文章

Python requests模块学习笔记
目录 Requests模块说明 Requests模块安装 Requests模块简单入门 Requests示例参考文档 1.Requests模块说明 Requests 是使用 Apache2 Li ...
python学习笔记（十八）网络编程之requests模块
上篇博客中我们使用python自带的urllib模块去请求一个网站,或者接口,但是urllib模块太麻烦了,传参数的话,都得是bytes类型,返回数据也是bytes类型,还得解码,想直接把返回结果拿出 ...
爬虫学习笔记（三）requests模块使用
前面在说爬虫原理的时候说了,就写代码自动化的获取数据,保存下来数据,那怎么写代码来请求一个网址,获取结果呢,就得用requests模块了. 这篇博客说一下requests模块的使用,requests模 ...
python学习笔记：网络请求——requests模块
上面讲过的urllib模块太麻烦了,还有一个比较方便的模块,就是requests模块,好用到你怀疑人生·^_^,一定要会哦需要安装,pip install requests即可,下面是request ...
requests模块--python发送http请求
requests模块在Python内置模块(urllib.urllib2.httplib)的基础上进行了高度的封装,从而使得Pythoner更好的进行http请求,使用Requests可以轻而易举的 ...
孤荷凌寒自学python第六十七天初步了解Python爬虫初识requests模块
孤荷凌寒自学python第六十七天初步了解Python爬虫初识requests模块 (完整学习过程屏幕记录视频地址在文末) 从今天起开始正式学习Python的爬虫. 今天已经初步了解了两个主要的模块: ...
requests模块简单使用
目录 requests模块简单使用 Anaconda简单了解简单了解 requests模块使用requests模块爬取搜狗首页源码数据实现一个简易的网页采集器解决乱码问题解决UA检测问题 ...
爬虫requests模块 1
让我们从一些简单的示例开始吧. 发送请求¶ 使用 Requests 发送网络请求非常简单. 一开始要导入 Requests 模块: >>> import requests 然后,尝试 ...
requests 模块
发送请求使用Requests发送网络请求非常简单. 一开始要导入Requests模块: >>> import requests 然后,尝试获取某个网页.本例子中,我们来获取Gith ...

随机推荐

C#XmlDocument输出字符串
XmlDocument xmlDoc = new XmlDocument(); //假定该xmlDoc已经有内容; MemoryStream streamXml = new MemoryStream( ...
hdu 3484 Interviewe RMQ+二分
#include <cstdio> #include <iostream> #include <algorithm> using namespace std; + ...
AtCoder Grand Contest 008 D - K-th K
题目传送门:https://agc008.contest.atcoder.jp/tasks/agc008_d 题目大意: 给你一个长度为\(N\)的序列\(A\),请你构造一个长度为\(N^2\)的序 ...
Hash环/一致性Hash原理
当前,Memcached.Redis这类分布式kv缓存已经非常普遍.从本篇开始,本系列将分析分布式缓存相关的原理.使用策略和最佳实践. 我们知道Memcached的分布式其实是一种“伪分布式”,也就是 ...
linux给文件或目录添加apache权限
系统环境:ubuntu11.10/apache2/php5.3.6 在LAMP环境中,测试一个简单的php文件上传功能时,发现/var/log/apache2/error.log中出现如下php警告: ...
Python 版本对比
python2 与 python3可认为代码不通用,你也可以点击Python2.x与3.x版本区别来查看两者的不同 python3.6以上支持f-string,一种很方便的变量替换方式高版本可能 ...
AJPFX关于面向对象之封装，继承，多态（下）
(3)private: 对于对于成员来说:只能在该成员隶属于的类中访问. 对于类来说:类不可以声明为private. 4)protected: 对于对于成员来说:相同包中的类可以访问(包访问权限):基 ...
hihocoder1736 最大的K-偏差排列
思路: 容易写错的贪心题. 实现: #include <bits/stdc++.h> using namespace std; int main() { int n, k; while ( ...
EventBus 报“Subscriber class already registered to event class”错误
这句子的话意思也很容易理解,“接收者类已经被注册为事件类了”. 之前我是这么写: 事件注册是写在onStart()里面的 @Override protected void onStart() { su ...
程序员必须知道FTP命令
程序员必须知道FTP命令文件传输软件的使用格式为:FTP<FTP地址>,若连接成功,系统将提示用户输入 ...

requests 模块笔记

requests 模块笔记的更多相关文章

随机推荐

热门专题