python3中urllib的基本使用

urllib

　　在python3中，urllib和urllib2进行了合并，现在只有一个urllib模块，urllib和urllib2的中的内容整合进了urllib.request，urlparse整合进了urllib.parse

urlparse　　将urlstr解析成各个组件

# -*- coding:utf-8 -*-

import urllib.request

import urllib.parse

url = "http://www.baidu.com"

parsed = urllib.parse.urlparse(url)

print(parsed)

#输出：ParseResult(scheme='http', netloc='www.baidu.com', path='', params='', query='', fragment='')

urljoin（baseurl,newurl,allowFrag=None）　　将url的根域名和新url拼合成一个完整的url

import urllib.parse

url = "http://www.baidu.com"

new_path = urllib.parse.urljoin(url,"index.html")

print(new_path)

#输出：http://www.baidu.com/index.html

urlopen(url,data,timeout)　　打开一个url的方法，返回一个文件对象，然后可以进行类似文件对象的操作

import urllib.request

req = urllib.request.urlopen('http://www.baidu.com')

print(req.read())

　　read() , readline() , readlines() , fileno() , close()

　　info()：返回一个httplib.HTTPMessage 对象，表示远程服务器返回的头信息。

　　getcode()：返回Http状态码，如果是http请求，200表示请求成功完成;404表示网址未找到。

　　geturl()：返回请求的url。

urlretrieve(url,filename,reporthook,data) 　下载url定位到的html文件,不写路径filename则会被存为临时文件可以用 urllib.urlcleanup() 来清理缓存

file_name = urllib.request.urlretrieve('http://www.baidu.com','%s/baidu.html'%BASE_DIR)

urlencode() 　　将dict中的键值对以连接符&划分

import urllib.parse

dic = {'name':'melon','age':18}

data = urllib.parse.urlencode(dic)

print(data)     #age=18&name=melon

GET请求

　　GET请求和我们平常get访问方式一样,直接把参数写到网址上面就好了

import urllib.request

import urllib.parse

dic = {'name':'melon','age':18}

data = urllib.parse.urlencode(dic)

req = urllib.request.urlopen('http://127.0.0.1:8000/index?%s'%data)

content = req.read()

POST请求

import urllib.request

import urllib.parse

import json

dic = {'name':'melon','age':18}

data = urllib.parse.urlencode(dic)

req = urllib.request.Request('http://127.0.0.1:8000/index', data.encode())

opener = urllib.request.urlopen(req)

content = json.loads(opener.read().decode())

当你 urllib.urlopen一个 https 的时候会验证一次 SSL 证书，当目标使用的是自签名的证书时就会出现一个URLError，如果是这样可以在开头加上

import ssl

ssl._create_default_https_context = ssl._create_unverified_context

python3中urllib的基本使用的更多相关文章

Python2和Python3中urllib库中urlencode的使用注意事项
前言在Python中,我们通常使用urllib中的urlencode方法将字典编码,用于提交数据给url等操作,但是在Python2和Python3中urllib模块中所提供的urlencode的包 ...
常见的爬虫分析库（1）-Python3中Urllib库基本使用
原文来自:https://www.cnblogs.com/0bug/p/8893677.html 什么是Urllib? Python内置的HTTP请求库 urllib.request ...
Python3中Urllib库基本使用
什么是Urllib? Python内置的HTTP请求库 urllib.request 请求模块 urllib.error 异常处理模块 urllib.par ...
python3中urllib库的request模块详解
刚刚接触爬虫,基础的东西得时时回顾才行,这么全面的帖子无论如何也得厚着脸皮转过来啊! 原帖地址:https://www.2cto.com/kf/201801/714859.html 什么是 Urlli ...
Python3中urllib详细使用方法(header,代理,超时,认证,异常处理)
urllib是python的一个获取url(Uniform Resource Locators,统一资源定址器)了,我们可以利用它来抓取远程的数据进行保存哦,下面整理了一些关于urllib使用中的一些 ...
Python3中urllib详细使用方法(header,代理,超时,认证,异常处理) 转
urllib是python的一个获取url(Uniform Resource Locators,统一资源定址器)了,我们可以利用它来抓取远程的数据进行保存哦,下面整理了一些关于urllib使用中的一些 ...
Python3中urllib使用介绍
Py2.x: Urllib库 Urllin2库 Py3.x: Urllib库变化: 在Pytho2.x中使用import urllib2——-对应的,在Python3.x中会使用import url ...
Python3中urllib使用与源代码
Py2.x: Urllib库 Urllin2库 Py3.x: Urllib库变化: 在Pytho2.x中使用import urllib2---对应的,在Python3.x中会使用import url ...
【转】Python3中urllib详细使用方法(header,代理,超时,认证,异常处理)
urllib是python的一个获取url(Uniform Resource Locators,统一资源定址器)了,我们可以利用它来抓取远程的数据进行保存哦,下面整理了一些关于urllib使用中的 ...

随机推荐

用SQLLDR来装载date类型的控制文件
以前给山东某单位做oracle数据库恢复得时候,恢复出来得数据中包含date类型,当时给客户提供得是sqlldr得方式,因为数据量比较大,用sqlldr装载起来速度比较快,所以采用了这种方式,结果在装 ...
bzoj3637 CodeChef SPOJ - QTREE6 Query on a tree VI 题解
题意: 一棵n个节点的树,节点有黑白两种颜色,初始均为白色.两种操作:1.更改一个节点的颜色;2.询问一个节点所处的颜色相同的联通块的大小. 思路: 1.每个节点记录仅考虑其子树时,假设其为黑色时所处 ...
POJ 1201 差分方程分析
POJ 1201 给你N个闭区间.每个区间分别为[ai,bi],你必须在这个区间上至少取ci个不同的整数. 现要求所有区间满足各自的条件. 问最少需要选多少个点. 例如[3,7](3) [8,10] ...
<转>C#中线程的学习
原文发布时间为:2008-11-15 -- 来源于本人的百度文章 [由搬家工具导入] http://hi.baidu.com/cyap/blog/category/%B6%E0%CF%DF%B3%CC ...
Codeforces 848C （cdq分治）
Codeforces 848C Goodbye Souvenir Problem : 给一个长度为n的序列,有q个询问.一种询问是修改某个位置的数,另一种询问是询问一段区间,对于每一种值出现的最右端点 ...
SeaJS项目完整实例【转】
index.html——主页面. sea.js——SeaJS脚本. init.js——init模块,入口模块,依赖data.jquery.style三个模块.由主页面载入. data.js——data ...
http://www.16aspx.com/Code/Show/5352
http://www.16aspx.com/Code/Show/5352 可视化工作流引擎RoadFlowV1.3 http://www.cnblogs.com/f2flow/p/4212678.ht ...
Java的finally语句在try或catch中的return语句执行之后还是之前？
import java.util.HashMap; import java.util.Map; public class FinallyDemo1 { public static void main( ...
java获取本机机器名
java获取本机机器名 InetAddress.getLocalHost().getHostName().toString();
虚拟社会(Virtual Society)
虚拟社会(Virtual Society),又称赛博社会(Cyber Society),是指不同网民之间经由计算机.远程通讯终端等技术设备相互连接起来以进行信息的共享.互动与交流,并在其中进行社会交往 ...

python3中urllib的基本使用

python3中urllib的基本使用的更多相关文章

随机推荐

热门专题