爬虫第三篇：requests模块

requests模块其实就是对urllib.request模块的进步一不优化，提供了很多可选的参数，同时简化了操作。下面我还是贴上具体操作的代码。

requests GET请求

GET请求html文件

import requests

baseurl = "http://www.baidu.com/s?"

headers = {"User-Agent":"Mozilla/5.0"}

key = "关键字"

pn = 1

pn = (int(pn) - 1) * 10

params = {

        "wd" : key,

        "pn" : pn,

    }

res = requests.get(baseurl,

                   params=params,

                   headers=headers)

res.encoding = "utf-8"

html = res.text

print(html)
# res.status_code    # HTTP响应码
# res.url    # url地址

GET请求二进制文件

import requests

url = "https://ss0.bdstatic.com/70cFvHSh_Q1YnxGkpoWK1HF6hhy/it/u=2914738751,1449131471&fm=26&gp=0.jpg"

headers = {"User-Agent":"Mozilla/5.0"}

# 三步走,发请求,指编码,获内容

res = requests.get(url,headers=headers)

res.encoding = "utf-8"

html = res.content

# 以 wb 的方式写入本地文件

with open("./mmm.jpg","wb") as f:

    f.write(html)

requests POST 请求

import requests

import json

key = 'this is a demo'data = {

        "i":key,

        "from":"AUTO",

        "to":"AUTO",

        "smartresult":"dict",

        "client":"fanyideskweb",

        "salt":"",

        "sign":"108feafc7c01c7461a41034463a8df9b",

        "ts":"",

        "bv":"363eb5a1de8cfbadd0cd78bd6bd43bee",

        "doctype":"json",

        "version":"2.1",

        "keyfrom":"fanyi.web",

        "action":"FY_BY_REALTIME",

        "typoResult":"false"

    }

url = "http://fanyi.youdao.com/translate?smartresult=dict&smartresult=rule"

headers = {"User-Agent":"Mozilla/5.0"}

res = requests.post(url,data=data,headers=headers)

res.encoding = "utf-8"

html = res.text

# 把json格式的字符串转为python中字典

rDict = json.loads(html)

result = rDict["translateResult"][0][0]["tgt"]

爬虫第三篇：requests模块的更多相关文章

爬虫之重要的requests模块
一 . requests模块什么是requests模块 requests模块是python中原生的基于网络请求的模块,其主要作用是用来模拟浏览器发起请求.功能强大,用法简洁高效.在爬虫领域中占据着半 ...
爬虫学习笔记（三）requests模块使用
前面在说爬虫原理的时候说了,就写代码自动化的获取数据,保存下来数据,那怎么写代码来请求一个网址,获取结果呢,就得用requests模块了. 这篇博客说一下requests模块的使用,requests模 ...
爬虫（五）requests模块2
引入有些时候,我们在使用爬虫程序去爬取一些用户相关信息的数据(爬取张三“人人网”个人主页数据)时,如果使用之前requests模块常规操作时,往往达不到我们想要的目的,例如: #!/usr/bin/ ...
爬虫（四）requests模块1
引入 Requests 唯一的一个非转基因的 Python HTTP 库,人类可以安全享用. 警告:非专业使用其他 HTTP 库会导致危险的副作用,包括:安全缺陷症.冗余代码症.重新发明轮子症.啃文档 ...
爬虫基础库之requests模块
一.requests模块简介使用requests可以模拟浏览器请求,比起之前用到的urllib,requests模块的api更加快捷,其实ruquests的本质就是封装urllib3这个模块. re ...
设置python爬虫IP代理(urllib/requests模块)
urllib模块设置代理如果我们频繁用一个IP去爬取同一个网站的内容,很可能会被网站封杀IP.其中一种比较常见的方式就是设置代理IP from urllib import request proxy ...
第十篇 requests模块
1.安装requests 要安装requests,在终端中输入以下命令即可安装: pip3 install requests 2.发送请求使用requests发送请求首先需要导入requests模块 ...
[爬虫]用python的requests模块爬取糗事百科段子
虽然Python的标准库中 urllib2 模块已经包含了平常我们使用的大多数功能,但是它的 API 使用起来让人感觉不太好,而 Requests 自称 “HTTP for Humans”,说明使用更 ...
(转).net程序员转战android第三篇---登录模块之静态登录
这一篇我将分2个部分记录登录界面,第一部分是静态登录, 这部分将如何从界面布局.控件使用.文件关系.数据验证.登陆实现等5小块记录. 第二部分是动态登录,这块会基于上面的4小块,在数据验证不是静态数据 ...

随机推荐

记录-Hibernate+servlet实现简单的增、删、查、改
由于需要对Hibernate作个了解,所以写了个简单的实现以上是大概目录 1.新建Hibernate.cfg.xml配置文件 <?xml version='1.0' encoding='UTF ...
创建String字符串的方式与区别
Java中创建一个字符串的方式有很多种,常见如: String s = new String("riqi"); String s = "riqi"; 但两者有什 ...
巨蟒python全栈开发django2:初识django
今日内容大纲: 1.起飞版web框架 2.自定制框架的流程 3.jinja2模板渲染初识 4.MVC&&MTV 5.django版本介绍及django安装 6.django初识(一些操 ...
【题解】Digit Tree
[题解]Digit Tree CodeForces - 716E 呵呵以为是数据结构题然后是淀粉质还行... 题目就是给你一颗有边权的树,问你有多少路径,把路径上的数字顺次写出来,是\(m\)的倍数. ...
021-Spring Boot 测试，Junit方式使用，mock方式，Controller测试
一.概述二.Junit方式使用 2.1.基本使用 eclipse在新建的类上,右键→new→Junit Test Case,修改一下Source folder,选择src/test/java,下一步 ...
Latex排版全解（转）
Latex排版全解 http://blog.csdn.net/langb2014/article/details/51354238
剑指offer 面试66题
面试66题: 题目:构建乘积数组给定一个数组A[0,1,...,n-1],请构建一个数组B[0,1,...,n-1],其中B中的元素B[i]=A[0]*A[1]*...*A[i-1]*A[i+1]* ...
LeetCode：搜索二维矩阵【74】
LeetCode:搜索二维矩阵[74] 题目描述编写一个高效的算法来判断 m x n 矩阵中,是否存在一个目标值.该矩阵具有如下特性: 每行中的整数从左到右按升序排列. 每行的第一个整数大于前一行的 ...
LeetCode：平衡二叉树【110】
LeetCode:平衡二叉树[110] 题目描述给定一个二叉树,判断它是否是高度平衡的二叉树. 本题中,一棵高度平衡二叉树定义为: 一个二叉树每个节点的左右两个子树的高度差的绝对值不超过1. 示例 ...
spring RMI的使用
Spring整合RMI的原理客户端的核心是RmiProxyFactoryBean,包含serviceURL属性和serviceInterface属性. 通过JRMP访问服务.JRMP JRMP:ja ...

爬虫第三篇：requests模块

requests GET请求

GET请求html文件

GET请求二进制文件

requests POST 请求

爬虫第三篇：requests模块的更多相关文章

随机推荐

热门专题