python urllib基础学习

# -*- coding: utf-8 -*-

# python:2.x

__author__ = 'Administrator'

#使用python创建一个简单的WEB客户端

import urllib,urllib2,urlparse

"""

web地址元素

URL部件描述

prot_sch 网络协议或者下载规划

nety_loc 服务器位置（或者也有用户信息）

path 斜杠(/)限定文件或者CGI应用程序路径

query 连接符(&)连接键值对

params 可选参数

frag 拆分文档中特殊锚

网络定位元素

net_loc

部件描述

user 用户名

password 密码

host web服务器运行机器名或者地址（必须字段）

port 端口号(默认为80)

"""

#urlparse.urlparse()urlparse(url, scheme='', allow_fragments=True)

"""

将url解析成一个6元组(prot_sch,net_loc,path,params,query,frag)

当url中没有提供默认网络协议或者下载规划时可以使用scheme,allw_fragments标识一个URL是否允许使用零部件

"""

#例如

#print urlparse.urlparse('http://www.python.org/doc/FAQ.html')

#ParseResult(scheme='http', netloc='www.python.org', path='/doc/FAQ.html', params='', query='', fragment='')

#urlparse.urlunparse()功能与urlparse.urlparse()相反：它是拼合一个6元组(prot_sch,net_loc,path,params,query,frag)

#url1=urlparse.urlparse('http://www.163.com')

#print urlparse.urlunparse(url1)

#urlparse.urljoin()进行多个结合一起

## 'photo.shtml')

"""urllib

支持WEB协议，HTTP,FTP,GOPHER协议，可以进行上载下载,避免使用以前的那些模块

"""

#urllib.urlopen()打开一个给定的URL字符串与WEB连接，返回文件类型

#语法urllib.urlopen(url,data=None,proxies=None):如果没有给定协议或者下载，或者文件规划早已给出，它会打开本地文件

"""

对于所有HTTP请教，常见的请求是GET，在这样的情况下，WEB服务器会发送请求字符串（编码键值或者引用）

如果要求使用POST方法信息，请查看CGI应用编程部分普通文档或者文本。

f.info()方法返回MIME（多目标因特网邮件扩展，Multipurpose internet mail extension）头文件，这个头文件通知浏览器返回文件类型可以是那类应用程序打开

geturl()方法在考虑了所有可能发生间接导向后，从最终打开的文件中获得真实的URL

"""

urllilb.urlopen()方法如下

对象方法描述

f.read([bytes]) 从f中读出所有或者bytes个字节

f.readline() 从f中读出一行

f.readlines() 读取所有行返回一个列表

f.close() 关闭连接

f.fileno() 返回f文件句柄

f.geturl() 返回f所打开的真正URL

如果需要复杂的URL或者要处理复杂的情况，比如cookie等问题，建议使用urllib2模块

"""

#urllib.urlretrieve(url,fulename=None,reporthook=None,data=None)当需要URL文档时，可以使用它

"""

reporthook这个函数会在每块数据下载或者传输完之后被调用，3个参数：目前读入块数，块的字节数和文件字节数，

urlretrieve（）返回一个2元组，(filename,mime_hdrs),filename包含下载数据本地文件名,mime_hdrs是对WEB服务器响应后返回一系列MIME文件判断

更多信息可以看mimetools的message类，对于本地文件来说mime_hdrs是空的

"""

#urllib.quote()和urllib.quote_plus()

"""

quote*()函数获取URL数据，将其编码，从而适用于URL字符串中，对于一些不能被打印或者不被WEB服务器作为有效的URL接收特殊字符串可以使用此函数

语法如

quote(urldata,safe='/')

"""

#例如

# name='jon mama'

# number=6

# base='http://www/~foo/cgi-bin/s.py'

# final='%s?name=%s&num=%d'%(base,name,number)

# print final

# print urllib.quote(final)

# print urllib.quote_plus(final)

#urllib.unquote(),urllib.unquote_plus()这2个函数功能完全相反，将所有编码'%xx'式的字母转换成它们的ascii值

#调用unquote()函数会把s中所有URL编码字母都解码，返回字符串，urllib.unquote_plus()函数会将加号转换成空格符

#urllib.urlencode()它是接收字典键-值对，将其编译成CGI请求的URL字符串，键值对格式：键=值，以连接符&划分，更进一步，键和它们值被传到quote_pluis()进行适当的编码

#例如

adict={'name':'georgion garica','b':'c'}

print urllib.urlencode(adict)

#urllib方法的例子学习

url1='http://cnblogs.com'

#代理服务器

proxies={'http':'http://cnblogs.com'}

#使用代理服务器打开

r=urllib.urlopen(url1,proxies=proxies)

print r.info()

print r.getcode()

print r.geturl()

#打开本地文件

f=urllib.urlopen(url='file:/f:/from2.html')

#print f.read()

#print f.readline()

print f.readlines()

#打开ftp服务器

#f = urllib.urlopen(url = 'ftp://username:password@ftpaddress')

#保存网页显示进度

def urlabc(a,b,c):

"""

a:数量

b:大小

c:状态

"""

per=100.*a*b/c

if per>100:

per=100

print '%.2f%%'%per

url='http://www.oschina.net/news/55121/tiobe-2014-9'

local='oschina.net'

print urllib.urlretrieve(url,local,urlabc)

#get方法

params=urllib.urlencode({'s':1,'b':2,'c':3})

f=urllib.urlopen("http://www.musi-cal.com/cgi-bin/query?%s" % params)

print f.read()

print '*'*300

#post方法

params=urllib.urlencode({'s':1,'b':2,'c':3})

f=urllib.urlopen("http://www.musi-cal.com/cgi-bin/query?%s" % params)

print f.read()

print '*'*300

#编码解码

data='name=~a+3'

data1=urllib.quote(data)

print data1

print urllib.unquote(data1)

data2=urllib.quote_plus(data)

print data2

print urllib.unquote_plus(data2)

data3 = urllib.urlencode({ 'name': 'dark-bull', 'age': 200 })

print data3

data4=urllib.pathname2url(r'F:\qtgui\netword1\oschina.net')

print data4

print urllib.url2pathname(data4)

python urllib基础学习的更多相关文章

Python入门基础学习三
Python入门基础学习三数据类型 Python区分整型和浮点型依靠的是小数点,有小数点就是浮点型. e记法:e就是10的意思,是一种科学的计数法,15000=1.5e4 布尔类型是一种特殊的整形 ...
Python入门基础学习二
Python入门基础学习二猜数字小游戏进阶版修改建议: 猜错的时候程序可以给出提示,告诉用户猜测的数字偏大还是偏小: 没运行一次程序只能猜测一次,应该提供多次机会给用户猜测: 每次运行程序,答案 ...
Python入门基础学习一
Python入门基础学习一 Python下载及安装下载地址:https://www.python.org/,选择最新的版本下载稍等一会,安装完成. 简单语句从idle启动Python:IDLE ...
python函数基础学习
函数的定义与调用: def 函数名(参数1,参数2): ‘’’函数注释’’’ print(‘函数体’) return 返回值定义:def关键字开关,空格之后接函数名和圆括号,最后冒号结尾 def ...
Python入门基础学习(文件与异常处理)
Python基础学习笔记(七) 捕获异常的语法格式: 文件的基本操作: 打开文件读.写文件关闭文件 read方法 --读取文件: open函数的第一个参数是要打开的文件名(文件名区分大小写) 如果 ...
Python入门基础学习（时间模块，随机模块）
Python基础学习笔记(六) time模块: 时间的三种表示方法: 1.格式化字符串 2.时间戳用来表示和1970年的时间间隔,单位为s 3.元组 struct_time 9个元素 time的st ...
Python入门基础学习(模块,包)
Python基础学习笔记(五) 模块的概念:模块是python程序架构的一个核心概念每个以拓展名py结尾的python源代码文件都是一个模块模块名同样也是一个标识符,需要符合标识符的命名规则在模 ...
Python入门基础学习(面向对象)
Python基础学习笔记(四) 面向对象的三个基本特征: 封装:把客观事物抽象并封装成对象,即将属性,方法和事件等集合在一个整体内继承:允许使用现有类的功能并在无须重新改写原来的类情况下,对这些功能 ...
Python入门基础学习(函数)
Python基础学习笔记(三) 函数的概念: 所谓函数,就是把具有独立功能的代码块组织为一个小模块,在需要的时候调用函数的使用包含两个步骤: 1.定义函数 --封装独立的功能 2.调用函数 --享受 ...

随机推荐

[转]Jquery中AJAX错误信息调试参考
下面是Jquery中AJAX参数详细列表: 参数名类型描述 url String (默认: 当前页地址) 发送请求的地址. type String (默认: "GET") 请求 ...
[RxJS] Reactive Programming - Clear data while loading with RxJS startWith()
In currently implemention, there is one problem, when the page load and click refresh button, the us ...
codeforces C. Cd and pwd commands 执行命令行
执行命令来改变路径 cd 并显示路径命令 pwd 一个节目的抽样: input 7 pwd cd /home/vasya pwd cd .. pwd cd vasya/../petya pwd ou ...
FLEX中Tree默认展开全部节点
这里分两种情况,一种是数据源在MXML文件里,如: <mx:XML id="treeXML" format="e4x"> <root> ...
neural style论文解读
相关的代码都在Github上,请参见我的Github,https://github.com/lijingpeng/deep-learning-notes 敬请多多关注哈~~~ 概述在艺术领域,艺术家 ...
javaweb中去除某个get方式的参数，并且返回路径
String requestURL = request.getRequestURL() + ""; // String queryString = request.getQuery ...
Internetmap.apk实现原理分析
1.本地实现调用程序根据data文件目录下的asinfo.json文件(包含自治域网络名和对应的坐标值),调用so文件绘制asn结点图(ASN,AutoSystemNode,自治域结点) 2.路由查 ...
js_day8
[转]iOS hybrid App 的实现原理及性能监测
转自:http://www.cocoachina.com/ios/20151118/14270.html iOS hybrid App 的实现原理及性能监测 2015-11-18 11:39 编辑: ...
delete 用法
1.对象属性的删除 function fun(){ this.name = 'mm'; } var obj = new fun(); console.log(obj.name);//mm delete ...

python urllib基础学习

python urllib基础学习的更多相关文章

随机推荐

热门专题