pycurl — A Python interface to the cURL library

Pycurl包是一个libcurl的Python接口.pycurl已经成功的在Python2.2到Python2.5版编译测试过了.

Libcurl是一个支持FTP, FTPS, HTTP, HTTPS, GOPHER, TELNET, DICT, FILE 和 LDAP的客户端URL传输库.libcurl也支持HTTPS认证,HTTP POST,HTTP PUT,FTP上传,代理,Cookies,基本身份验证,FTP文件断点继传,HTTP代理通道等等.

Libcurl提供的所有功能都可以通过pycurl接口来使用.

Module Functionality

pycurl.global_init(option) ->None
选项是以下常量之一:pycurl.GLOBAL_SSL,
pycurl.GLOBAL_WIN32, pycurl.GLOBAL_ALL, pycurl.GLOBAL_NOTHING,
pycurl.GLOBAL_DEFAULT. 相应的是libcurl的 curl_global_init() 方法.

pycurl.global_cleanup() -> None
相应的是libcurl的curl_global_cleanup()方法.

pycurl.version
这是liburl当前版本的信息,相应的是liburl的curl_version()方法.
用法举例:

>>> import pycurl
>>> pycurl.version
'libcurl/7.12.3 OpenSSL/0.9.7e zlib/1.2.2.1 libidn/0.5.12'

pycurl.version_info() -> Tuple
相对应的是libcurl中的 curl_version_info() 方法. 返回一个序列信息就像liburl的curl_version_info()方法返回的 curl_version_info_data 结构化数据.
用法举例:

>>> import pycurl
>>> pycurl.version_info()
(2, '7.12.3', 461827, 'i586-pc-linux-gnu', 1565, 'OpenSSL/0.9.7e', 9465951,
'1.2.2.1', ('ftp', 'gopher', 'telnet', 'dict', 'ldap', 'http', 'file',
'https', 'ftps'), None, 0, '0.5.12')

pycurl.Curl() -> Curl object
这个函数创建一个同libcurl中的CURL处理器相对应的Curl
对象.Curl对象自动的设置CURLOPT_VERBOSE为0,
CURLOPT_NOPROGRESS为1,提供一个默认的CURLOPT_USERAGENT和设置CURLOPT_ERRORBUFFER指向一个私
有的错误缓冲区.

pycurl.CurlMulti() -> CurlMulti object
这个函数创建一个新的与libcurl中的CURLM处理器相对应的CurlMulti对象.

pycurl.CurlShare() -> CurlShare object
这个函数创建一个新的与libcurl中的CURLSH处理器相对应的CurlShare对象.CurlShare对象可以在Curl对象上传递SHARE选项参数.

Subsections

  • Curl objects
  • CurlMulti objects
  • CurlShare objects
  • Callbacks

    Curl Object

    Curl对象具有以下方法:

    close() -> None
    对应的是libcurl中的curl_easy_cleanup方法.当Curl对象不再被引用时pycurl会自动调用这个方法,但也可直接地调用这个方法.

    perform() -> None
    对应于libcurl中的curl_easy_perform方法.

    setopt(option, value) -> None
    对应于libcurl中的curl_easy_setopt方法,
    option使用libcurl中的CURLOPT_*常量来指定,只可惜CURLOPT_前缀现在已经被去掉了.value的数据类型依赖于
    option,它可以是一个字符串,整型,长整型,文件对象,列表或是函数.
    用法举例:

    import pycurl
    c = pycurl.Curl()
    c.setopt(pycurl.URL, "http://www.python.org/")
    c.setopt(pycurl.HTTPHEADER, ["Accept:"])
    import StringIO
    b = StringIO.StringIO()
    c.setopt(pycurl.WRITEFUNCTION, b.write)
    c.setopt(pycurl.FOLLOWLOCATION, 1)
    c.setopt(pycurl.MAXREDIRS, 5)
    c.perform()
    print b.getvalue()

    getinfo(option) -> Result
    对应于libcurl中的curl_easy_getinfo方法,
    option同样使用libcurl中的CURLOPT_*常量来指定,只可惜CURLOPT_前缀现在已经被去掉了.
    Result包含一个整数,浮点数或字符串,这都信赖于给定的option.getinfo方法不能在perform方法未调用或完成之前进行调用.
    用法举例:

    errstr() -> String
    返回这个处理器中内部libcurl错误缓冲区的字符串表示.

    CurlMulti Object

    CurlMulti对象具有以下方法:

    close() -> None
    对应于libcurl中的curl_multi_cleanup()方法.当CurlMulti对象不再被引用时pycurl会自动调用该方法,也可显示调用该方法.

    perform() -> tuple of status and the number of active Curl objects
    对应于libcurl中的curl_multi_perform()方法.

    add_handle(Curl object) -> None
    对应于libcurl中的curl_multi_add_handle()方法.这个方法添加一个有效的Curl对象到CurlMulti对象.
    重要提示:add_handle没有隐式的增加对Curl对象的引用(因而也没有增加Curl对象的引用次数)

    remove_handle(Curl object) -> None
    对应于libcurl中的curl_multi_remove_handle()方法.这个方法从CurlMulti对象中移除一个现有的Curl对象.
    重要提示:remove_handle不会隐式的移除Curl对象的引用(因而不会减少Curl对象的引用次数).

    fdset() -> triple of lists with active file descriptors, readable, writeable, exceptions.
    对应于libcurl中的curl_multi_fdset()方法.这个方法从CurlMulti对象中提取文件描述信息.返回的列表可以被用于select模块to poll for events.
    用法举例:

    import pycurl
    c = pycurl.Curl()
    c.setopt(pycurl.URL, "http://curl.haxx.se")
    m = pycurl.CurlMulti()
    m.add_handle(c)
    while 1:
         ret, num_handles = m.perform()
        if ret != pycurl.E_CALL_MULTI_PERFORM: break
    while num_handles:
         apply(select.select, m.fdset() + (1,))
        while 1:
             ret, num_handles = m.perform()
            if ret != pycurl.E_CALL_MULTI_PERFORM: break

    select(timeout) -> number of ready file descriptors or -1 on timeout
    这是一个有用的函数,它简化了fdest()和select模块的组合使用.
    用法举例:

    import pycurl
    c = pycurl.Curl()
    c.setopt(pycurl.URL, "http://curl.haxx.se")
    m = pycurl.CurlMulti()
    m.add_handle(c)
    while 1:
         ret, num_handles = m.perform()
        if ret != pycurl.E_CALL_MULTI_PERFORM: break
    while num_handles:
         ret = m.select(1.0)
        if ret == -1:  continue
        while 1:
             ret, num_handles = m.perform()
            if ret != pycurl.E_CALL_MULTI_PERFORM: break

    info_read([max]) -> numberof queued messages, a list of successful objects, a list of failed objects

    应于libcurl中的curl_multi_info_read()方法.这个方法从多重栈中提取至多max个信息然后返回两个列表.第一个列表包含成
    功完成的操作第二个列表包含每一个失败的curl对象的<curl对象,curl错误代码,curl错误信息>序列.

    CurlShare Object

    CurlShare对象具有以下方法:

    setopt(option, value) -> None
    对应于libcurl中的curl_share_setopt方法,
    option使用libcurl中的CURLOPT_*常量来指定,只可惜CURLOPT_前缀现在改成SH_了.通常value必须是
    LOCK_DATA_COOKIE 或者说LOCK_DATA_DNS.
    用法举例:

    import pycurl
    curl = pycurl.Curl()
    s = pycurl.CurlShare()
    s.setopt(pycurl.SH_SHARE, pycurl.LOCK_DATA_COOKIE)
    s.setopt(pycurl.SH_SHARE, pycurl.LOCK_DATA_DNS)
    curl.setopt(pycurl.URL, 'http://curl.haxx.se')
    curl.setopt(pycurl.SHARE, s)
    curl.perform()
    curl.close()

    Callbacks

    为了更好的控制,libcurl允许把一些回调函数关联到每个连接中.在pycurl中,回调函数通过Curl对象调用setopt为s
    WRITEFUNCTION, READFUNCTION, HEADERFUNCTION, PROGRESSFUNCTION,
    IOCTLFUNCTION,
    或DEBUGFUNCTION这些选项设置.这些选项对应着libcurl中CURLOPT_*前缀被移除的选项.在pycurl中回调函数必须是一个正
    规的Python函数,或者一个类的方法或是一个扩展的函数类型.

    这儿有些局限性就是这些选项的回调函数有可能同时发生.它允许不同的回调函数对应到不同的Curl对象.更多明确的是,WRITEDATA的回调函
    数不能用于WRITEFUNCTION,READDATA的回调函数不能用于READFUNCTION,WRITEHEADER的回调函数不能用于
    HEADERFUNCTION,PROGRESSDATA回调函数不能用于PROGRESSFUNCTION,IOCTLDATA回调函数不能用于
    IOCTLFUNCTION,DEBUGDATA回调函数不能用于DEBUGFUNCTION.实际上,可以通过把一个类的实例方法来当作回调函数并且使
    用类实例属性像文件对象那样存储每个对象的数据来克服这种局限性.

    Pycurl中的每个回调函数的签名如下:

    WRITEFUNCTION(string) -> number of characters written

    READFUNCTION(number of characters to read)-> string

    HEADERFUNCTION(string) -> number of characters written

    PROGRESSFUNCTION(download total, downloaded, upload total, uploaded) -> status

    DEBUGFUNCTION(debug message type, debug message string) -> None

    IOCTLFUNCTION(ioctl cmd) -> status

    Example: Callbacks for document header and body

    这个例子打印头数据到stderr打印内容数据到stdout.同样注意它们都不返回写入的字节数. WRITEFUNCTION和HEADERFUNCTION回调,写入所有字节时返回None.

        ## Callback function invoked when body data is ready
        def body(buf):
            # Print body data to stdout
            import sys
             sys.stdout.write(buf)
            # Returning None implies that all bytes were written

    ## Callback function invoked when header data is ready
        def header(buf):
            # Print header data to stderr
            import sys
             sys.stderr.write(buf)
            # Returning None implies that all bytes were written

    c = pycurl.Curl()
         c.setopt(pycurl.URL, "http://www.python.org/")
         c.setopt(pycurl.WRITEFUNCTION, body)
         c.setopt(pycurl.HEADERFUNCTION, header)
         c.perform()

    Example: Download/upload progress callback

    这个例子演示如何使用进度回调.当下载一个文档时,uploads参数都将是0,反之亦然.

        ## Callback function invoked when download/upload has progress
        def progress(download_t, download_d, upload_t, upload_d):
            print "Total to download", download_t
            print "Total downloaded", download_d
            print "Total to upload", upload_t
            print "Total uploaded", upload_d

    c.setopt(c.URL, "http://slashdot.org/")
         c.setopt(c.NOPROGRESS, 0)
         c.setopt(c.PROGRESSFUNCTION, progress)
         c.perform()

    Example: Debug callbacks

    这个例子演示如何使用调试回调.调试信息类型是一个调试信息的整数标示类型.在这个回调被调用时VERBOSE选项必须可用.

        def test(debug_type, debug_msg):
            print "debug(%d): %s" % (debug_type, debug_msg)

    c = pycurl.Curl()
         c.setopt(pycurl.URL, "http://curl.haxx.se/")
         c.setopt(pycurl.VERBOSE, 1)
         c.setopt(pycurl.DEBUGFUNCTION, test)
         c.perform()

    Other examples

    Pycrul也包含一些用于演示如何在libcurl中使用不同的回调的测试脚本和事例.例如,文件
    examples/file_upload.py包含如何使用READFUNCTION的事例代码,
    'tests/test_cb.py'演示WRITEFUNCTION和HEADERFUNCTION,
    'tests/test_debug.py'演示DEBUGFUNCTION,
    'tests/test_getinfo.py'演示PROGRESSFUNCTION.

    ============================================================================

    编辑文本保存在C:/Python25/Lib下的pycurl_test.py

    import pycurl
    import StringI

    def getURLContent_pycurl(url):  
       c = pycurl.Curl()
       c.setopt(pycurl.URL,url)
       b = StringIO.StringIO()
       c.setopt(pycurl.WRITEFUNCTION, b.write)
       c.setopt(pycurl.FOLLOWLOCATION, 1)
       c.setopt(pycurl.MAXREDIRS, 5)
       #c.setopt(pycurl.PROXY, 'http://11.11.11.11:8080')
       #c.setopt(pycurl.PROXYUSERPWD, 'aaa:aaa')
       c.perform()
       return b.getvalue()

    在命令行中输入import pycurl_test

    url ='http://blog.csdn.net'

    content = getURLContent_pycurl(url)

    print content

    =============================================================

pycurl,Python cURL library的更多相关文章

  1. 【Python五篇慢慢弹(5)】类的继承案例解析,python相关知识延伸

    类的继承案例解析,python相关知识延伸 作者:白宁超 2016年10月10日22:36:57 摘要:继<快速上手学python>一文之后,笔者又将python官方文档认真学习下.官方给 ...

  2. CentOS 6.5 Python Image Library 配置

    转自:http://www.cnblogs.com/way_testlife/archive/2011/04/17/2019013.html PIL 下载: http://www.pythonware ...

  3. Python语言中对于json数据的编解码——Usage of json a Python standard library

    一.概述 1.1 关于JSON数据格式 JSON (JavaScript Object Notation), specified by RFC 7159 (which obsoletes RFC 46 ...

  4. 机器学习编程语言之争,Python 夺魁【转载+整理】

    原文地址 en cn 本文内容 表现平平的 MATLAB 貌似强大的 Julia 本身无错的 R 语言 逐渐没落的 Perl 老而弥坚的 Python 我个人很喜欢 Python~ 随着科技的发展,拥 ...

  5. php cURL library is not loaded

    问题: php 在命令行里面可以找到 curl 模块,但是用apache 没有找到 curl 模块. 表现内容为: extension_loaded('curl')cURL library is no ...

  6. 使用Python Shapefile Library创建和编辑Shapefile文件

    介绍 shapefile是GIS中非常重要的一种数据类型,在ArcGIS中被称为要素类(Feature Classes),主要包括点(point).线(polyline)和多边形(polygon).P ...

  7. Python基础面试,看这篇文章画重点吧,Python面试题No1

    为什么有这个系列的文章 一直想写一些更加基础的文章,但是总是想不到好的点子,最近到了就业季,一大堆学生面临就业了,正好,从Python的面试题出发,分析和解答一些常见的面试题,并且总结一些文字. 每一 ...

  8. Awesome Python,Python的框架集合

    Awesome Python A curated list of awesome Python frameworks, libraries and software. Inspired by awes ...

  9. Windows环境下安装PIL(Python Imaging Library)库

    微信小程序--跳一跳最近火了一把,于是整了个辅助进行试玩,不过在运行程序过程中出现了个报错如图所示: 显然是缺少PIL(Python Imaging Library)库文件,于是通过pip命令行进行安 ...

随机推荐

  1. 交换机VLAN研究

    这两天在研究openWRT的网络接口问题,涉及到了交换机的一些概念,主要是跟VLAN相关的,在此总结一下. VLAN在802.11Q中定义,802.11Q帧格式如下图所示: 交换机示意图如下图所示: ...

  2. docker进入容器

    进入容器的三种方式: sshd nsenter exec sshd 在容器中开启一个SSHD的服务,通过SSH的协议登录到容器中,把容器看出一个vm nsenter: nsenter包含在util-l ...

  3. ubuntu之iptables

    1.更新iptables并立即生效: a.保存当前设置:iptables-save > /etc/iptables.up.rules b.修改iptables规则: 例如: -I INPUT - ...

  4. zoj 2067 White Rectangles

    这题解决的算法处理,真的很难想清楚!!尤其是最后的正矩形如何处理.不过终于看懂了 #include<stdio.h> #include<stdlib.h> #include&l ...

  5. JavaSE_ 多线程 总目录(23~24)

    JavaSE学习总结第23天_多线程123.01 多线程程序的引入23.02 进程概述及多进程的意义23.03 线程概述及多线程的意义23.04 并行和并发的区别23.05 Java程序运行原理和JV ...

  6. shopnc b2b2c如何开启伪静态??

    shopnc b2b2c开启伪静态的方法 一. windows环境下 1.先下载isapi rewrite插件,安装,然后我们把根目录下面的htaccess.txt那么修改成.htaccess即可. ...

  7. bzoj 4373: 算术天才⑨与等差数列 hash

    题目链接 题目大意:  给你n个数, 给两种操作, 一种给你l, r, k,问你[l, r]区间里的数排序后能否构成一个公差为k的等差数列. 另一种是将位置x的数变为y. 强制在线. 可以用hash来 ...

  8. monkeyrunner学习--手机按键

    按下HOME键 device.press('KEYCODE_HOME','DOWN_AND_UP') 按下BACK键 device.press('KEYCODE_BACK','DOWN_AND_UP' ...

  9. 射频识别技术漫谈(16)——Mifare UltraLight

    Mifare UltraLight又称为MF0,从UltraLight(超轻的)这个名字就可以看出来,它是一个低成本.小容量的卡片.低成本,是指它是目前市场中价格最低的遵守ISO14443A协议的芯片 ...

  10. android 百度最新地图sdk包怎么去除 放大缩小按钮

    // 隐藏缩放控件 int childCount = mMapView.getChildCount(); View zoom = null; ; i < childCount; i++) { V ...