Requests模块

Python标准库中提供了:urllib、urllib2、httplib等模块以供Http请求,但是,它的 API 太渣了。

它是为另一个时代、另一个互联网所创建的。它需要巨量的工作,甚至包括各种方法覆盖,来完成最简单的任务。

Requests 是使用 Apache2 Licensed 许可证的 基于Python开发的HTTP 库,其在Python内置模块的基础上进行了高度的封装;

从而使得Pythoner进行网络请求时,变得方便了许多,使用Requests可以轻而易举的完成浏览器可有的任何操作

GET请求

  1. # 1、无参数实例
  2. import requests
  3. ret = requests.get('https://github.com/timeline.json')
  4. print(ret.url)
    print(ret.text)
  5.  
  6. # 2、有参数实例
    import requests payload = {'key1': 'value1', 'key2': 'value2'} ret = requests.get("http://httpbin.org/get", params=payload)
    print(ret.url)
    print(ret.text)

POST请求

  1. # 1、基本POST实例
  2.  
  3. import requests
  4.  
  5. payload = {'key1': 'value1', 'key2': 'value2'}
  6. ret = requests.post("http://httpbin.org/post", data=payload)
  7.  
  8. print(ret.text)
  9.  
  10. # 2、发送请求头和数据实例
  11.  
  12. import requests
  13. import json
  14.  
  15. url = 'https://api.github.com/some/endpoint'
  16. payload = {'some': 'data'}
  17. headers = {'content-type': 'application/json'}
  18.  
  19. ret = requests.post(url, data=json.dumps(payload), headers=headers)
  20.  
  21. print(ret.text)print(ret.cookies)

其他请求

  1. requests.get(url, params=None, **kwargs)
  2. requests.post(url, data=None, json=None, **kwargs)
  3. requests.put(url, data=None, **kwargs)
  4. requests.head(url, **kwargs)
  5. requests.delete(url, **kwargs)
  6. requests.patch(url, data=None, **kwargs)
  7. requests.options(url, **kwargs)
  8.  
  9. # 以上方法均是在此方法的基础上构建
  10. requests.request(method, url, **kwargs)

更多参数

  1. def request(method, url, **kwargs):
  2. """Constructs and sends a :class:`Request <Request>`.
  3.  
  4. :param method: method for the new :class:`Request` object.
  5. :param url: URL for the new :class:`Request` object.
  6. :param params: (optional) Dictionary or bytes to be sent in the query string for the :class:`Request`.
  7. :param data: (optional) Dictionary, bytes, or file-like object to send in the body of the :class:`Request`.
  8. :param json: (optional) json data to send in the body of the :class:`Request`.
  9. :param headers: (optional) Dictionary of HTTP Headers to send with the :class:`Request`.
  10. :param cookies: (optional) Dict or CookieJar object to send with the :class:`Request`.
  11. :param files: (optional) Dictionary of ``'name': file-like-objects`` (or ``{'name': file-tuple}``) for multipart encoding upload.
  12. ``file-tuple`` can be a 2-tuple ``('filename', fileobj)``, 3-tuple ``('filename', fileobj, 'content_type')``
  13. or a 4-tuple ``('filename', fileobj, 'content_type', custom_headers)``, where ``'content-type'`` is a string
  14. defining the content type of the given file and ``custom_headers`` a dict-like object containing additional headers
  15. to add for the file.
  16. :param auth: (optional) Auth tuple to enable Basic/Digest/Custom HTTP Auth.
  17. :param timeout: (optional) How long to wait for the server to send data
  18. before giving up, as a float, or a :ref:`(connect timeout, read
  19. timeout) <timeouts>` tuple.
  20. :type timeout: float or tuple
  21. :param allow_redirects: (optional) Boolean. Set to True if POST/PUT/DELETE redirect following is allowed.
  22. :type allow_redirects: bool
  23. :param proxies: (optional) Dictionary mapping protocol to the URL of the proxy.
  24. :param verify: (optional) whether the SSL cert will be verified. A CA_BUNDLE path can also be provided. Defaults to ``True``.
  25. :param stream: (optional) if ``False``, the response content will be immediately downloaded.
  26. :param cert: (optional) if String, path to ssl client cert file (.pem). If Tuple, ('cert', 'key') pair.
  27. :return: :class:`Response <Response>` object
  28. :rtype: requests.Response
  29.  
  30. Usage::
  31.  
  32. >>> import requests
  33. >>> req = requests.request('GET', 'http://httpbin.org/get')
  34. <Response [200]>
  35. """

参数列表

  1. def param_method_url():
  2. # requests.request(method='get', url='http://127.0.0.1:8000/test/')
  3. # requests.request(method='post', url='http://127.0.0.1:8000/test/')
  4. pass
  5.  
  6. def param_param():
  7. # - 可以是字典
  8. # - 可以是字符串
  9. # - 可以是字节(ascii编码以内)
  10.  
  11. # requests.request(method='get',
  12. # url='http://127.0.0.1:8000/test/',
  13. # params={'k1': 'v1', 'k2': '水电费'})
  14.  
  15. # requests.request(method='get',
  16. # url='http://127.0.0.1:8000/test/',
  17. # params="k1=v1&k2=水电费&k3=v3&k3=vv3")
  18.  
  19. # requests.request(method='get',
  20. # url='http://127.0.0.1:8000/test/',
  21. # params=bytes("k1=v1&k2=k2&k3=v3&k3=vv3", encoding='utf8'))
  22.  
  23. # 错误
  24. # requests.request(method='get',
  25. # url='http://127.0.0.1:8000/test/',
  26. # params=bytes("k1=v1&k2=水电费&k3=v3&k3=vv3", encoding='utf8'))
  27. pass
  28.  
  29. def param_data():
  30. # 可以是字典
  31. # 可以是字符串
  32. # 可以是字节
  33. # 可以是文件对象
  34.  
  35. # requests.request(method='POST',
  36. # url='http://127.0.0.1:8000/test/',
  37. # data={'k1': 'v1', 'k2': '水电费'})
  38.  
  39. # requests.request(method='POST',
  40. # url='http://127.0.0.1:8000/test/',
  41. # data="k1=v1; k2=v2; k3=v3; k3=v4"
  42. # )
  43.  
  44. # requests.request(method='POST',
  45. # url='http://127.0.0.1:8000/test/',
  46. # data="k1=v1;k2=v2;k3=v3;k3=v4",
  47. # headers={'Content-Type': 'application/x-www-form-urlencoded'}
  48. # )
  49.  
  50. # requests.request(method='POST',
  51. # url='http://127.0.0.1:8000/test/',
  52. # data=open('data_file.py', mode='r', encoding='utf-8'), # 文件内容是:k1=v1;k2=v2;k3=v3;k3=v4
  53. # headers={'Content-Type': 'application/x-www-form-urlencoded'}
  54. # )
  55. pass
  56.  
  57. def param_json():
  58. # 将json中对应的数据进行序列化成一个字符串,json.dumps(...)
  59. # 然后发送到服务器端的body中,并且Content-Type是 {'Content-Type': 'application/json'}
  60. requests.request(method='POST',
  61. url='http://127.0.0.1:8000/test/',
  62. json={'k1': 'v1', 'k2': '水电费'})
  63.  
  64. def param_headers():
  65. # 发送请求头到服务器端
  66. requests.request(method='POST',
  67. url='http://127.0.0.1:8000/test/',
  68. json={'k1': 'v1', 'k2': '水电费'},
  69. headers={'Content-Type': 'application/x-www-form-urlencoded'}
  70. )
  71.  
  72. def param_cookies():
  73. # 发送Cookie到服务器端
  74. requests.request(method='POST',
  75. url='http://127.0.0.1:8000/test/',
  76. data={'k1': 'v1', 'k2': 'v2'},
  77. cookies={'cook1': 'value1'},
  78. )
  79. # 也可以使用CookieJar(字典形式就是在此基础上封装)
  80. from http.cookiejar import CookieJar
  81. from http.cookiejar import Cookie
  82.  
  83. obj = CookieJar()
  84. obj.set_cookie(Cookie(version=0, name='c1', value='v1', port=None, domain='', path='/', secure=False, expires=None,
  85. discard=True, comment=None, comment_url=None, rest={'HttpOnly': None}, rfc2109=False,
  86. port_specified=False, domain_specified=False, domain_initial_dot=False, path_specified=False)
  87. )
  88. requests.request(method='POST',
  89. url='http://127.0.0.1:8000/test/',
  90. data={'k1': 'v1', 'k2': 'v2'},
  91. cookies=obj)
  92.  
  93. def param_files():
  94. # 发送文件
  95. # file_dict = {
  96. # 'f1': open('readme', 'rb')
  97. # }
  98. # requests.request(method='POST',
  99. # url='http://127.0.0.1:8000/test/',
  100. # files=file_dict)
  101.  
  102. # 发送文件,定制文件名
  103. # file_dict = {
  104. # 'f1': ('test.txt', open('readme', 'rb'))
  105. # }
  106. # requests.request(method='POST',
  107. # url='http://127.0.0.1:8000/test/',
  108. # files=file_dict)
  109.  
  110. # 发送文件,定制文件名
  111. # file_dict = {
  112. # 'f1': ('test.txt', "hahsfaksfa9kasdjflaksdjf")
  113. # }
  114. # requests.request(method='POST',
  115. # url='http://127.0.0.1:8000/test/',
  116. # files=file_dict)
  117.  
  118. # 发送文件,定制文件名
  119. # file_dict = {
  120. # 'f1': ('test.txt', "hahsfaksfa9kasdjflaksdjf", 'application/text', {'k1': '0'})
  121. # }
  122. # requests.request(method='POST',
  123. # url='http://127.0.0.1:8000/test/',
  124. # files=file_dict)
  125.  
  126. pass
  127.  
  128. def param_auth():
  129. from requests.auth import HTTPBasicAuth, HTTPDigestAuth
  130.  
  131. ret = requests.get('https://api.github.com/user', auth=HTTPBasicAuth('wupeiqi', 'sdfasdfasdf'))
  132. print(ret.text)
  133.  
  134. # ret = requests.get('http://192.168.1.1',
  135. # auth=HTTPBasicAuth('admin', 'admin'))
  136. # ret.encoding = 'gbk'
  137. # print(ret.text)
  138.  
  139. # ret = requests.get('http://httpbin.org/digest-auth/auth/user/pass', auth=HTTPDigestAuth('user', 'pass'))
  140. # print(ret)
  141. #
  142.  
  143. def param_timeout():
  144. # ret = requests.get('http://google.com/', timeout=1)
  145. # print(ret)
  146.  
  147. # ret = requests.get('http://google.com/', timeout=(5, 1))
  148. # print(ret)
  149. pass
  150.  
  151. def param_allow_redirects():
  152. ret = requests.get('http://127.0.0.1:8000/test/', allow_redirects=False)
  153. print(ret.text)
  154.  
  155. def param_proxies():
  156. # proxies = {
  157. # "http": "61.172.249.96:80",
  158. # "https": "http://61.185.219.126:3128",
  159. # }
  160.  
  161. # proxies = {'http://10.20.1.128': 'http://10.10.1.10:5323'}
  162.  
  163. # ret = requests.get("http://www.proxy360.cn/Proxy", proxies=proxies)
  164. # print(ret.headers)
  165.  
  166. # from requests.auth import HTTPProxyAuth
  167. #
  168. # proxyDict = {
  169. # 'http': '77.75.105.165',
  170. # 'https': '77.75.105.165'
  171. # }
  172. # auth = HTTPProxyAuth('username', 'mypassword')
  173. #
  174. # r = requests.get("http://www.google.com", proxies=proxyDict, auth=auth)
  175. # print(r.text)
  176.  
  177. pass
  178.  
  179. def param_stream():
  180. ret = requests.get('http://127.0.0.1:8000/test/', stream=True)
  181. print(ret.content)
  182. ret.close()
  183.  
  184. # from contextlib import closing
  185. # with closing(requests.get('http://httpbin.org/get', stream=True)) as r:
  186. # # 在此处理响应。
  187. # for i in r.iter_content():
  188. # print(i)
  189.  
  190. def requests_session():
  191. import requests
  192.  
  193. session = requests.Session()
  194.  
  195. ### 1、首先登陆任何页面,获取cookie
  196.  
  197. i1 = session.get(url="http://dig.chouti.com/help/service")
  198.  
  199. ### 2、用户登陆,携带上一次的cookie,后台对cookie中的 gpsd 进行授权
  200. i2 = session.post(
  201. url="http://dig.chouti.com/login",
  202. data={
  203. 'phone': "",
  204. 'password': "xxxxxx",
  205. 'oneMonth': ""
  206. }
  207. )
  208.  
  209. i3 = session.post(
  210. url="http://dig.chouti.com/link/vote?linksId=8589623",
  211. )
  212. print(i3.text)
  213.  
  214. 参数示例

使用示例

Python爬虫之-Requests的更多相关文章

  1. 孤荷凌寒自学python第六十七天初步了解Python爬虫初识requests模块

    孤荷凌寒自学python第六十七天初步了解Python爬虫初识requests模块 (完整学习过程屏幕记录视频地址在文末) 从今天起开始正式学习Python的爬虫. 今天已经初步了解了两个主要的模块: ...

  2. Python爬虫练习(requests模块)

    Python爬虫练习(requests模块) 关注公众号"轻松学编程"了解更多. 一.使用正则表达式解析页面和提取数据 1.爬取动态数据(js格式) 爬取http://fund.e ...

  3. python爬虫之requests库

    在python爬虫中,要想获取url的原网页,就要用到众所周知的强大好用的requests库,在2018年python文档年度总结中,requests库使用率排行第一,接下来就开始简单的使用reque ...

  4. Python爬虫之requests

    爬虫之requests 库的基本用法 基本请求: requests库提供了http所有的基本请求方式.例如 r = requests.post("http://httpbin.org/pos ...

  5. Python 爬虫二 requests模块

    requests模块 Requests模块 get方法请求 整体演示一下: import requests response = requests.get("https://www.baid ...

  6. python爬虫之requests库介绍(二)

    一.requests基于cookie操作 引言:有些时候,我们在使用爬虫程序去爬取一些用户相关信息的数据(爬取张三“人人网”个人主页数据)时,如果使用之前requests模块常规操作时,往往达不到我们 ...

  7. Python爬虫之requests库介绍(一)

    一:Requests: 让 HTTP 服务人类 虽然Python的标准库中 urllib2 模块已经包含了平常我们使用的大多数功能,但是它的 API 使用起来让人感觉不太好,而 Requests 自称 ...

  8. Python爬虫之requests模块(1)

    一.引入 Requests 唯一的一个非转基因的 Python HTTP 库,人类可以安全享用. 警告:非专业使用其他 HTTP 库会导致危险的副作用,包括:安全缺陷症.冗余代码症.重新发明轮子症.啃 ...

  9. Python爬虫之requests模块(2)

    一.今日内容 session处理cookie proxies参数设置请求代理ip 基于线程池的数据爬取 二.回顾 xpath的解析流程 bs4的解析流程 常用xpath表达式 常用bs4解析方法 三. ...

  10. python爬虫值requests模块

    - 基于如下5点展开requests模块的学习 什么是requests模块 requests模块是python中原生的基于网络请求的模块,其主要作用是用来模拟浏览器发起请求.功能强大,用法简洁高效.在 ...

随机推荐

  1. git commit 、CHANGELOG 和版本发布的标准自动化

    一直以来,因为团队项目迭代节奏很快,每次发布的更新日志和版本更新都是通过人肉来完成的.有时候实在忙的团团转,对于手动的写这些更新信息就显得力不从心了.对于团队新来的小伙伴,有时候遇到些紧急情况,就更显 ...

  2. C# 冒泡排序

    class Program { static void swap( ref int atemp, ref int btemp)//注意ref的使用 { int temp = atemp; atemp ...

  3. linux 从百度网盘下载文件的方法

    linux 从百度网盘下载文件的方法 发表于2015 年 月 日由shenwang 方法1.wget wget是在Linux下开发的开放源代码的软件,作者是Hrvoje Niksic,后来被移植到包括 ...

  4. html 基本标签 ---短语

    <em> </em> 着重 <strong> </strong> 强调 <dfn> </dfn> 定义 <code> ...

  5. HTML页面中直接加载其他JSP页面

    1.在经典的框架中填充页面时 要填充2处的页面,2处为内容页面,是另外的一个JSP页面 2.左侧页面代码 <%@ page language="java" import=&q ...

  6. easy UI树形复选框

    首先,展示一下结果 这个是使用easyui的combotree控件来实现的,具体的代码如下: 1,声明一个复选框 <select id="rolePer" name=&quo ...

  7. 技巧C#

    1.     在CallBack之后保持滚动条的位置: 在Asp.Net1.1中,CallBack之后保持滚动条的位置是一件非常痛苦的事情,特别是页中有一个Grid并且想要编辑特定的行.为了不停留在想 ...

  8. pycharm重置设置,恢复默认设置

    备忘,备忘,备忘 window 系统 找到下方目录-->删除. 再重新打开pycharm # Windows Vista, 7, 8, 10: <SYSTEM DRIVE>\User ...

  9. asp.net发送邮件带格式(本demo发送验证码)

    public ActionResult Mail(string email, string userName) { try { MailSender mail = new MailSender(); ...

  10. windows连接远程打印机

    windows连接hp的远程打印机时,自动装不了驱动.. 需打开驱动程序(驱动程序安装需接设备),然后windows就过下载驱动这步了..