慢慢的把它们总结一下，总结就是最好的学习方法

宗述

首先来看一下他们的区别

urllib和urllib2

urllib 和urllib2都是接受URL请求的相关模块，但是urllib2可以接受一个Request类的实例来设置URL请求的headers，urllib仅可以接受URL。

这意味着，你不可以伪装你的User Agent字符串等。

urllib提供urlencode方法用来GET查询字符串的产生，而urllib2没有。这是为何urllib常和urllib2一起使用的原因。

目前的大部分http请求都是通过urllib2来访问的

httplib

httplib实现了HTTP和HTTPS的客户端协议，一般不直接使用，在python更高层的封装模块中（urllib,urllib2）使用了它的http实现。

urllib简单用法

urllib.urlopen(url[, data[, proxies]]) :

详细使用方法见

urllib学习

urllib2简单用法

最简单的形式

import urllib2

   response=urllib2.urlopen('http://www.douban.com')

   html=response.read()

实际步骤：

1、urllib2.Request()的功能是构造一个请求信息，返回的req就是一个构造好的请求

2、urllib2.urlopen()的功能是发送刚刚构造好的请求req，并返回一个文件类的对象response，包括了所有的返回信息。

3、通过response.read()可以读取到response里面的html，通过response.info()可以读到一些额外的信息。

如下：

#!/usr/bin/env python

    import urllib2

    req = urllib2.Request("http://www.douban.com")

    response = urllib2.urlopen(req)

    html = response.read()

    print html

有时你会碰到，程序也对，但是服务器拒绝你的访问。这是为什么呢?问题出在请求中的头信息(header)。有的服务端有洁癖，不喜欢程序来触摸它。这个时候你需要将你的程序伪装成浏览器来发出请求。请求的方式就包含在header中。
常见的情形：

import urllib

import urllib2

url = 'http://www.someserver.com/cgi-bin/register.cgi'

user_agent = 'Mozilla/4.0 (compatible; MSIE 5.5; Windows NT)'# 将user_agent写入头信息

values = {'name' : 'who','password':''}

headers = { 'User-Agent' : user_agent }

data = urllib.urlencode(values)

req = urllib2.Request(url, data, headers)

response = urllib2.urlopen(req)

the_page = response.read()

values是post数据

GET方法

例如百度：

百度是通过http://www.baidu.com/s?wd=XXX 来进行查询的，这样我们需要将{‘wd’:’xxx’}这个字典进行urlencode

#coding:utf-

import urllib

import urllib2

url = 'http://www.baidu.com/s'

values = {'wd':'D_in'}

data = urllib.urlencode(values)

print data

url2 = url+'?'+data

response = urllib2.urlopen(url2)

the_page = response.read()

print the_page

POST方法

import urllib

import urllib2

url = 'http://www.someserver.com/cgi-bin/register.cgi'

user_agent = 'Mozilla/4.0 (compatible; MSIE 5.5; Windows NT)' //将user_agent写入头信息

values = {'name' : 'who','password':''}      //post数据

headers = { 'User-Agent' : user_agent }

data = urllib.urlencode(values)                   //对post数据进行url编码

req = urllib2.Request(url, data, headers)

response = urllib2.urlopen(req)

the_page = response.read()

urllib2带cookie的使用

#coding:utf-

import urllib2,urllib

import cookielib  

url = r'http://www.renren.com/ajaxLogin'  

#创建一个cj的cookie的容器

cj = cookielib.CookieJar()

opener = urllib2.build_opener(urllib2.HTTPCookieProcessor(cj))

#将要POST出去的数据进行编码

data = urllib.urlencode({"email":email,"password":pass})

r = opener.open(url,data)

print cj

httplib简单用法

简单示例

#!/usr/bin/env python

# -*- coding: utf- -*-

import httplib

import urllib    

def sendhttp():

    data = urllib.urlencode({'@number': , '@type': 'issue', '@action': 'show'})

    headers = {"Content-type": "application/x-www-form-urlencoded",

               "Accept": "text/plain"}

    conn = httplib.HTTPConnection('bugs.python.org')

    conn.request('POST', '/', data, headers)

    httpres = conn.getresponse()

    print httpres.status

    print httpres.reason

    print httpres.read()               

if __name__ == '__main__':

    sendhttp()

具体用法见

httplib模块

python 3.x中urllib库和urilib2库合并成了urllib库。其中、

首先你导入模块由

import urllib

import urllib2

变成了

import urllib.request

然后是urllib2中的方法使用变成了如下

urllib2.urlopen()变成了urllib.request.urlopen()

urllib2.Request()变成了urllib.request.Request() 

urllib2.URLError 变成了urllib.error.URLError

而当你想使用urllib 带数据的post请求时，

在python2中

urllib.urlencode(data)

而在python3中就变成了

urllib.parse.urlencode(data)

脚本使用举例：

python 2中

import urllib

import urllib2

import json
from config import settings

def url_request(self, action, url, **extra_data):    abs_url = "http://%s:%s/%s" % (settings.configs['Server'],

                                   settings.configs["ServerPort"],

                                   url)

    if action in ('get', 'GET'):

        print(abs_url, extra_data)

        try:

            req = urllib2.Request(abs_url)

            req_data = urllib2.urlopen(req, timeout=settings.configs['RequestTimeout'])

            callback = req_data.read()

            # print "-->server response:",callback

            return callback

        except urllib2.URLError as e:

            exit("\033[31;1m%s\033[0m" % e)

    elif action in ('post', 'POST'):

        # print(abs_url,extra_data['params'])

        try:

            data_encode = urllib.urlencode(extra_data['params'])

            req = urllib2.Request(url=abs_url, data=data_encode)

            res_data = urllib2.urlopen(req, timeout=settings.configs['RequestTimeout'])

            callback = res_data.read()

            callback = json.loads(callback)

            print("\033[31;1m[%s]:[%s]\033[0m response:\n%s" % (action, abs_url, callback))

            return callback

        except Exception as e:

            print('---exec', e)

            exit("\033[31;1m%s\033[0m" % e)

python3.x中

import urllib.request

import json

from config import settings

def url_request(self, action, url, **extra_data):

    abs_url = 'http://%s:%s/%s/' % (settings.configs['ServerIp'], settings.configs['ServerPort'], url)

    if action in ('get', 'Get'): # get请求

        print(action, extra_data)try:

            req = urllib.request.Request(abs_url)

            req_data = urllib.request.urlopen(req, timeout=settings.configs['RequestTimeout'])

            callback = req_data.read()

            return callback

        except urllib.error.URLError as e:

            exit("\033[31;1m%s\033[0m" % e)

    elif action in ('post', 'POST'): # post数据到服务器端

        try:

            data_encode = urllib.parse.urlencode(extra_data['params'])

            req = urllib.request.Request(url=abs_url, data=data_encode)

            req_data = urllib.request.urlopen(req, timeout=settings.configs['RequestTimeout'])

            callback = req_data.read()

            callback = json.loads(callback.decode())

            return callback

        except urllib.request.URLError as e:

            print('---exec', e)

            exit("\033[31;1m%s\033[0m" % e)

settings配置如下：

configs = {

    'HostID': ,

    "Server": "localhost",

    "ServerPort": ,

    "urls": {

        'get_configs': ['api/client/config', 'get'],  #acquire all the services will be monitored

        'service_report': ['api/client/service/report/', 'post'],

    },

    'RequestTimeout': ,

    'ConfigUpdateInterval': ,  #  mins as default

}

python的httplib、urllib和urllib2的区别及用的更多相关文章

Python:urllib和urllib2的区别(转)
原文链接:http://www.cnblogs.com/yuxc/ 作为一个Python菜鸟,之前一直懵懂于urllib和urllib2,以为2是1的升级版.今天看到老外写的一篇<Python: ...
4 urllib和urllib2的区别
4 urllib和urllib2的区别这个面试官确实问过,当时答的urllib2可以Post而urllib不可以. urllib提供urlencode方法用来GET查询字符串的产生,而urllib2 ...
[转]Python中urllib与urllib2的区别与联系
引用文章1:http://my.oschina.net/u/558071/blog/144792 引用文章2:http://zhuoqiang.me/python-urllib2-usage.html ...
python基于http协议编程：httplib,urllib和urllib2<转>
httplib实现了HTTP和HTTPS的客户端协议,一般不直接使用,在python更高层的封装模块中(urllib,urllib2)使用了它的http实现. httplib.HTTPConnecti ...
Python:urllib和urllib2的区别
urllib和urllib2都是处理url请求的两个模块,但是相互之间存在不同,不能相互取代 urllib2可以接受一个Reuqest类的实例来设置URL请求的headers,urllib仅可以接受U ...
httplib,urllib和urllib2
一.httplib实现了HTTP和HTTPS的客户端协议,一般不直接使用,在python更高层的封装模块中(urllib,urllib2)使用了它的http实现. import httplib con ...
爬虫新手学习2-爬虫进阶(urllib和urllib2 的区别、url转码、爬虫GET提交实例、批量爬取贴吧数据、fidder软件安装、有道翻译POST实例、豆瓣ajax数据获取)
1.urllib和urllib2区别实例 urllib和urllib2都是接受URL请求相关模块,但是提供了不同的功能,两个最显著的不同如下: urllib可以接受URL,不能创建设置headers的 ...
python2核心类库：urllib、urllib2的区别和使用
urllib/urllib2都是接受URL请求的相关模块区别:1.urllib2可以接受一个Request类的实例来设置URL请求的headers,urllib仅可以接受URL.这意味着,你不可以伪装 ...
python学习之----urllib与urllib2的区分
urllib 还是urllib2 ? 如果你用过Python 2.x 里的urllib2 库,可能会发现urllib2 与urllib 有些不同. 在Python 3.x 里,urllib2 改名为u ...

随机推荐

PCL深度图像(1)
目前深度图像的获取方法有激光雷达深度成像法,计算机立体视觉成像,坐标测量机法,莫尔条纹法,结构光法等等,针对深度图像的研究重点主要集中在以下几个方面,深度图像的分割技术 ,深度图像的边缘检测技术 ,基 ...
微信小程序——获取元素的宽高等属性
微信小程序里面无法像用jquery一样获取到元素的节点.小程序提供了一个wx.createSelectorQuery()来获取元素的相关信息.官方的文档对于它的用法都已经写的很详细了. 我直接上在项目 ...
butterknife 配置了点击和绑定无效
配置了butterknife 没有报错,但是控件绑定和点击均无效. 问题原因: butterknife配置不完善问题导致. 解决办法: 找到app的module的build.gradle depend ...
自然语言交流系统 phxnet团队创新实训项目博客（四）
刚开始做时,一点头绪都没有,整天的上网找资料,各种谷歌百度,各种博客论坛,搜索的关键词也无非是智能自然语言交流.智能机器人.中文问答系统等等等等.而我们的思路也是些零散的,例如我们知道会用到分词,会用 ...
使用Selenium来抓取动态加载的页面
原文:http://my.oschina.net/flashsword/blog/147334?p=1 一般的爬虫都是直接使用http协议,下载指定url的html内容,并对内容进行分析和抽取.在我写 ...
python 进行后端分页详细代码
后端分页两个接口思路: 1. 先得到最大页和最小页数(1, 20) --> 传递给前端, 这样前端就可以知道有多少个页数 2. 通过传递页数得到当前页对应数据库的最大值和最小值 3. 通过s ...
当SQL UPDATE遇到EXISTS(SELECT ...)时
直接上例子. user表: ; -- ---------------------------- -- Table structure for user -- --------------------- ...
Java如何显示所有正在运行的线程？
在Java编程中,如何显示所有正在运行的线程? 以下示例演示如何使用getName()方法显示所有正在运行的线程的名称. package com.yiibai; public class Displa ...
[poj 1947] Rebuilding Roads 树形ＤＰ
Rebuilding Roads Time Limit: 1000MS Memory Limit: 30000K Total Submissions: 10653 Accepted: 4884 Des ...
[mysql]ERROR 1364 (HY000): Field 'ssl_cipher' doesn't have a default value
From: http://m.blog.csdn.net/blog/langkeziju/13511411 我的MySQL版本为5.6.14版本,是二进制包安装的(虽然是二进制包安装的,但是以下问题同 ...

python的httplib、urllib和urllib2的区别及用

宗述