Python 黑魔法---描述器(descriptor)

Python黑魔法,前面已经介绍了两个魔法,装饰器和迭代器,通常还有个生成器。生成器固然也是一个很优雅的魔法。生成器更像是函数的行为。而连接类行为和函数行为的时候,还有一个描述器魔法,也称之为描述符。

我们不止一次说过,Python的优雅,很大程度在于如何设计成优雅的API。黑魔法则是一大利器。或者说Python的优雅很大程度上是建立在这些魔法巧技基础上。

何谓描述器

当定义迭代器的时候,描述是实现迭代协议的对象,即实现__iter__方法的对象。同理,所谓描述器,即实现了描述符协议,即__get__, __set__, 和 __delete__方法的对象。

单看定义,还是比较抽象的。talk is cheap。看代码吧:

  1. class WebFramework(object):
  2. def __init__(self, name='Flask'):
  3. self.name = name
  4.  
  5. def __get__(self, instance, owner):
  6. return self.name
  7.  
  8. def __set__(self, instance, value):
  9. self.name = value
  10.  
  11. class PythonSite(object):
  12.  
  13. webframework = WebFramework()
  14.  
  15. In [1]: PythonSite.webframework
  16. Out[1]: 'Flask'
  17.  
  18. In [2]: PythonSite.webframework = 'Tornado'
  19.  
  20. In [3]: PythonSite.webframework
  21. Out[3]: 'Tornado'

定义了一个类WebFramework,它实现了描述符协议__get____set__,该对象(类也是对象,一切都是对象)即成为了一个描述器。同时实现__get____set__的称之为资料描述器(data descriptor)。仅仅实现__get__的则为非描述器。两者的差别是相对于实例的字典的优先级。

如果实例字典中有与描述器同名的属性,如果描述器是资料描述器,优先使用资料描述器,如果是非资料描述器,优先使用字典中的属性。

描述器的调用

对于这类魔法,其调用方法往往不是直接使用的。例如装饰器需要用 @ 符号调用。迭代器通常在迭代过程,或者使用 next 方法调用。描述器则比较简单,对象属性的时候会调用。

  1. In [15]: webframework = WebFramework()
  2.  
  3. In [16]: webframework.__get__(webframework, WebFramework)
  4. Out[16]: 'Flask'
描述器与对象属性

OOP的理论中,类的成员变量包括属性和方法。那么在Python里什么是属性?修改上面的PythonSite类如下:

  1. class PythonSite(object):
  2.  
  3. webframework = WebFramework()
  4.  
  5. version = 0.01
  6.  
  7. def __init__(self, site):
  8. self.site = site

这里增加了一个version的类属性,以及一个实例属性site。分别查看一下类和实例对象的属性:

  1. In [1]: pysite = PythonSite('ghost')
  2.  
  3. In [2]: vars(PythonSite).items()
  4. Out[2]:
  5. [('__module__', '__main__'),
  6. ('version', 0.01),
  7. ('__dict__', <attribute '__dict__' of 'PythonSite' objects>),
  8. ('webframework', <__main__.WebFramework at 0x10d55be90>),
  9. ('__weakref__', <attribute '__weakref__' of 'PythonSite' objects>),
  10. ('__doc__', None),
  11. ('__init__', <function __main__.__init__>)]
  12.  
  13. In [3]: vars(pysite)
  14. Out[3]: {'site': 'ghost'}
  15. In [4]: PythonSite.__dict__
  16. Out[4]:
  17. <dictproxy {'__dict__': <attribute '__dict__' of 'PythonSite' objects>,
  18. '__doc__': None,
  19. '__init__': <function __main__.__init__>,
  20. '__module__': '__main__',
  21. '__weakref__': <attribute '__weakref__' of 'PythonSite' objects>,
  22. 'version': 0.01,
  23. 'webframework': <__main__.WebFramework at 0x10d55be90>}>

vars方法用于查看对象的属性,等价于对象的__dict__内容。从上面的显示结果,可以看到类PythonSite和实例pysite的属性差别在于前者有 webframework,version两个属性,以及 __init__方法,后者仅有一个site属性。

类与实例的属性

类属性可以使用对象和类访问,多个实例对象共享一个类变量。但是只有类才能修改。

  1. In [6]: pysite1 = PythonSite('ghost')
  2.  
  3. In [7]: pysite2 = PythonSite('admin')
  4.  
  5. In [8]: PythonSite.version
  6. Out[8]: 0.01
  7.  
  8. In [9]: pysite1.version
  9. Out[9]: 0.01
  10.  
  11. In [10]: pysite2.version
  12. Out[10]: 0.01
  13.  
  14. In [11]: pysite1.version is pysite2.version
  15. Out[11]: True
  16.  
  17. In [12]: pysite1.version = 'pysite1'
  18.  
  19. In [13]: vars(pysite1)
  20. Out[13]: {'site': 'ghost', 'version': 'pysite1'}
  21.  
  22. In [14]: vars(pysite2)
  23. Out[14]: {'site': 'admin'}
  24.  
  25. In [15]: PythonSite.version = 0.02
  26.  
  27. In [16]: pysite1.version
  28. Out[16]: 'pysite1'
  29.  
  30. In [17]: pysite2.version
  31. Out[17]: 0.02

正如上面的代码显示,两个实例对象都可以访问version类属性,并且是同一个类属性。当pysite1修改了version,实际上是给自己添加了一个version属性。类属性并没有被改变。当PythonSite改变了version属性的时候,pysite2的该属性也对应被改变。

属性访问的原理与描述器

知道了属性访问的结果。这个结果都是基于Python的描述器实现的。通常,类或者实例通过.操作符访问属性。例如pysite1.sitepysite1.version的访问。先访问对象的__dict__,如果没有再访问类(或父类,元类除外)的__dict__。如果最后这个__dict__的对象是一个描述器,则会调用描述器的__get__方法。

  1. In [21]: pysite1.site
  2. Out[21]: 'ghost'
  3.  
  4. In [22]: pysite1.__dict__['site']
  5. Out[22]: 'ghost'
  6.  
  7. In [23]: pysite2.version
  8. Out[23]: 0.02
  9.  
  10. In [24]: pysite2.__dict__['version']
  11. ---------------------------------------------------------------------------
  12. KeyError Traceback (most recent call last)
  13. <ipython-input-24-73ef6aeba259> in <module>()
  14. ----> 1 pysite2.__dict__['version']
  15.  
  16. KeyError: 'version'
  17.  
  18. In [25]: type(pysite2).__dict__['version']
  19. Out[25]: 0.02
  20.  
  21. In [32]: type(pysite1).__dict__['webframework']
  22. Out[32]: <__main__.WebFramework at 0x103426e90>
  23.  
  24. In [38]: type(pysite1).__dict__['webframework'].__get__(None, PythonSite)
  25. Out[38]: 'Flask'
实例方法,类方法,静态方法与描述器

调用描述器的时候,实际上会调用object.__getattribute__()。这取决于调用描述其器的是对象还是类,如果是对象obj.x,则会调用type(obj).__dict__['x'].__get__(obj, type(obj))。如果是类,class.x, 则会调用type(class).__dict__['x'].__get__(None, type(class)

这样说还是比较抽象,下面来分析Python的方法,静态方法和类方法。把PythonSite重构一下:

  1. class PythonSite(object):
  2. webframework = WebFramework()
  3.  
  4. version = 0.01
  5.  
  6. def __init__(self, site):
  7. self.site = site
  8.  
  9. def get_site(self):
  10. return self.site
  11.  
  12. @classmethod
  13. def get_version(cls):
  14. return cls.version
  15.  
  16. @staticmethod
  17. def find_version():
  18. return PythonSite.version
类方法,@classmethod装饰器

先看类方法,类方法使用@classmethod装饰器定义。经过该装饰器的方法是一个描述器。类和实例都可以调用类方法:

  1. In [1]: ps = PythonSite('ghost')
  2.  
  3. In [2]: ps.get_version
  4. Out[2]: <bound method type.get_version of <class '__main__.PythonSite'>>
  5.  
  6. In [3]: ps.get_version()
  7. Out[3]: 0.01
  8.  
  9. In [4]: PythonSite.get_version
  10. Out[4]: <bound method type.get_version of <class '__main__.PythonSite'>>
  11.  
  12. In [5]: PythonSite.get_version()
  13. Out[5]: 0.01

get_version 是一个bound方法。下面再看下ps.get_version这个调用,会先查找它·的__dict__是否有get_version这个属性,如果没有,则查找其类。

  1. In [6]: vars(ps)
  2. Out[6]: {'site': 'ghost'}
  3.  
  4. In [7]: type(ps).__dict__['get_version']
  5. Out[7]: <classmethod at 0x108952e18>
  6.  
  7. In [8]: type(ps).__dict__['get_version'].__get__(ps, type(ps))
  8. Out[8]: <bound method type.get_version of <class '__main__.PythonSite'>>
  9.  
  10. In [9]: type(ps).__dict__['get_version'].__get__(ps, type(ps)) == ps.get_version
  11. Out[9]: True

并且vars(ps)中,__dict__并没有get_version这个属性,依据描述器协议,将会调用type(ps).__dict__['get_version']描述器的__get__方法,因为ps是实例,因此object.__getattribute__()会这样调用__get__(obj, type(obj))

现在再看类方法的调用:

  1. In [10]: PythonSite.__dict__['get_version']
  2. Out[10]: <classmethod at 0x108952e18>
  3.  
  4. In [11]: PythonSite.__dict__['get_version'].__get__(None, PythonSite)
  5. Out[11]: <bound method type.get_version of <class '__main__.PythonSite'>>
  6.  
  7. In [12]: PythonSite.__dict__['get_version'].__get__(None, PythonSite) == PythonSite.get_version
  8. Out[12]: True

因为这次调用get_version的是一个类对象,而不是实例对象,因此object.__getattribute__()会这样调用__get__(None, Class)

静态方法,@staticmethod

实例和类也可以调用静态方法:

  1. In [13]: ps.find_version
  2. Out[13]: <function __main__.find_version>
  3.  
  4. In [14]: ps.find_version()
  5. Out[14]: 0.01
  6.  
  7. In [15]: vars(ps)
  8. Out[15]: {'site': 'ghost'}
  9.  
  10. In [16]: type(ps).__dict__['find_version']
  11. Out[16]: <staticmethod at 0x108952d70>
  12.  
  13. In [17]: type(ps).__dict__['find_version'].__get__(ps, type(ps))
  14. Out[17]: <function __main__.find_version>
  15.  
  16. In [18]: type(ps).__dict__['find_version'].__get__(ps, type(ps)) == ps.find_version
  17. Out[18]: True
  18.  
  19. In [19]: PythonSite.find_version()
  20. Out[19]: 0.01
  21.  
  22. In [20]: PythonSite.find_version
  23. Out[20]: <function __main__.find_version>
  24.  
  25. In [21]: type(ps).__dict__['find_version'].__get__(None, type(ps))
  26. Out[21]: <function __main__.find_version>
  27.  
  28. In [22]: type(ps).__dict__['find_version'].__get__(None, type(ps)) == PythonSite.find_version
  29. Out[22]: True

和类方法差别不大,他们的主要差别是在类方法内部的时候,类方法可以有cls的类引用,静态访问则没有,如果静态方法想使用类变量,只能硬编码类名。

实例方法

实例方法最为复杂,是专门属于实例的,使用类调用的时候,会是一个unbound方法。

  1. In [2]: ps.get_site
  2. Out[2]: <bound method PythonSite.get_site of <__main__.PythonSite object at 0x1054ae2d0>>
  3.  
  4. In [3]: ps.get_site()
  5. Out[3]: 'ghost'
  6.  
  7. In [4]: type(ps).__dict__['get_site']
  8. Out[4]: <function __main__.get_site>
  9.  
  10. In [5]: type(ps).__dict__['get_site'].__get__(ps, type(ps))
  11. Out[5]: <bound method PythonSite.get_site of <__main__.PythonSite object at 0x1054ae2d0>>
  12.  
  13. In [6]: type(ps).__dict__['get_site'].__get__(ps, type(ps)) == ps.get_site
  14. Out[6]: True

一切工作正常,实例方法也是类的一个属性,但是对于类,描述器使其变成了unbound方法:

  1. In [7]: PythonSite.get_site
  2. Out[7]: <unbound method PythonSite.get_site>
  3.  
  4. In [8]: PythonSite.get_site()
  5. ---------------------------------------------------------------------------
  6. TypeError Traceback (most recent call last)
  7. <ipython-input-8-99c7d7607137> in <module>()
  8. ----> 1 PythonSite.get_site()
  9.  
  10. TypeError: unbound method get_site() must be called with PythonSite instance as first argument (got nothing instead)
  11.  
  12. In [9]: PythonSite.get_site(ps)
  13. Out[9]: 'ghost'
  14.  
  15. In [10]: PythonSite.__dict__['get_site']
  16. Out[10]: <function __main__.get_site>
  17.  
  18. In [11]: PythonSite.__dict__['get_site'].__get__(None, PythonSite)
  19. Out[11]: <unbound method PythonSite.get_site>
  20.  
  21. In [12]: PythonSite.__dict__['get_site'].__get__(None, PythonSite) == PythonSite.get_site
  22. Out[12]: True
  23.  
  24. In [14]: PythonSite.__dict__['get_site'].__get__(ps, PythonSite)
  25. Out[14]: <bound method PythonSite.get_site of <__main__.PythonSite object at 0x1054ae2d0>>
  26.  
  27. In [15]: PythonSite.__dict__['get_site'].__get__(ps, PythonSite)()
  28. Out[15]: 'ghost'

由此可见,类不能直接调用实例方法,除非在描述器手动绑定一个类实例。因为使用类对象调用描述器的时候,__get__的第一个参数是None,想要成功调用,需要把这个参数替换为实例ps,这个过程就是对方法的bound过程。

描述器的应用

描述器的作用主要在方法和属性的定义上。既然我们可以重新描述类的属性,那么这个魔法就可以改变类的一些行为。最简单的应用则是可以配合装饰器,写一个类属性的缓存。Flask的作者写了一个werkzeug网络工具库,里面就使用描述器的特性,实现了一个缓存器。

  1. class _Missing(object):
  2. def __repr__(self):
  3. return 'no value'
  4.  
  5. def __reduce__(self):
  6. return '_missing'
  7.  
  8. _missing = _Missing()
  9.  
  10. class cached_property(object):
  11. def __init__(self, func, name=None, doc=None):
  12. self.__name__ = name or func.__name__
  13. self.__module__ = func.__module__
  14. self.__doc__ = doc or func.__doc__
  15. self.func = func
  16.  
  17. def __get__(self, obj, type=None):
  18. if obj is None:
  19. return self
  20. value = obj.__dict__.get(self.__name__, _missing)
  21. if value is _missing:
  22. value = self.func(obj)
  23. obj.__dict__[self.__name__] = value
  24. return value
  25.  
  26. class Foo(object):
  27. @cached_property
  28. def foo(self):
  29. print 'first calculate'
  30. result = 'this is result'
  31. return result
  32.  
  33. f = Foo()
  34.  
  35. print f.foo # first calculate this is result
  36. print f.foo # this is result

运行结果可见,first calculate只在第一次调用时候被计算之后就把结果缓存起来了。这样的好处是在网络编程中,对HTTP协议的解析,通常会把HTTP的header解析成python的一个字典,而在视图函数的时候,可能不知一次的访问这个header,因此把这个header使用描述器缓存起来,可以减少多余的解析。

描述器在python的应用十分广泛,通常是配合装饰器一起使用。强大的魔法来自强大的责任。描述器还可以用来实现ORM中对sql语句的"预编译"。恰当的使用描述器,可以让自己的Python代码更优雅。

文/人世间(简书作者)

原文链接:http://www.jianshu.com/p/250f0d305c35

著作权归作者所有,转载请联系作者获得授权,并标注“简书作者”。

Python 黑魔法 --- 描述器(descriptor)的更多相关文章

  1. Python之描述器

    1.描述器的表现 用到三个魔术方法,__get__(), __set__(), __delete__() 方法签名如下 object.__get__(self,instance,owner) obje ...

  2. 【python】描述符descriptor

    开始看官方文档,各种看不懂,只看到一句Properties, bound and unbound methods, static methods, and class methods are all ...

  3. python理解描述符(descriptor)

    Descriptor基础 python中的描述符可以用来定义触发自动执行的代码,它像是一个对象属性操作(访问.赋值.删除)的代理类一样.前面介绍过的property是描述符的一种. 大致流程是这样的: ...

  4. python tips:描述符descriptor

    描述符(descriptor)是实现了__get__.__set__.__del__方法的类,进一步可以细分为两类: 数据描述符:实现了__get__和__set__ 非数据描述符:没有实现__set ...

  5. (转)面向对象(深入)|python描述器详解

    原文:https://zhuanlan.zhihu.com/p/32764345 https://www.cnblogs.com/aademeng/articles/7262645.html----- ...

  6. python 简单了解一下 描述器

    1.描述器是什么? 在Python中描述器也被称为描述符, 1)描述器实际上是任何新式类(新式类是继承自 type 或者 object 的类),这种类至少实现了3个特殊的方法__get__, __se ...

  7. python 黑魔法 ---上下文管理器(contextor)

    所谓上下文 计算机上下文(Context)对于我而言,一直是一个很抽象的名词.就像形而上一样,经常听见有人说,但是无法和现实认知世界相结合. 最直观的上下文,莫过于小学的语文课,经常会问联系上下文,推 ...

  8. python描述符(descriptor)、属性(property)、函数(类)装饰器(decorator )原理实例详解

     1.前言 Python的描述符是接触到Python核心编程中一个比较难以理解的内容,自己在学习的过程中也遇到过很多的疑惑,通过google和阅读源码,现将自己的理解和心得记录下来,也为正在为了该问题 ...

  9. python类:描述器Descriptors和元类MetaClasses

    http://blog.csdn.net/pipisorry/article/details/50444769 描述器(Descriptors) 描述器决定了对象属性是如何被访问的.描述器的作用是定制 ...

随机推荐

  1. mysql数据库 myisam数据存储引擎 表由于索引和数据导致的表损坏 的修复 和检查

    一.mysqlcheck 进行表的检查和修复 1.检查mysqlisam存储引擎表的状态 #mysqlcheck -uuser -ppassword database  table  -c  #检查单 ...

  2. poj3461 字符串匹配 熟悉kmp算法第一题

     题意:  计算一个字符串在另一个字符串中出现的次数. #include<cstdio> #include<cstring> #include<algorithm> ...

  3. ASP.NET SignalR 与 LayIM2.0 配合轻松实现Web聊天室 实战系列(不断更新中)

    项目简介 利用ASP.NET SignalR技术与Layim前端im框架实现的一个简单的web聊天室,包括单聊,群聊,加好友,加群,好友搜索,管理,群组管理,好友权限设置等功能.涉及技术: Elast ...

  4. Func<T,T>应用之Elasticsearch查询语句构造器的开发

    前言 之前项目中做Elasticsearch相关开发的时候,虽然借助了第三方的组件PlainElastic.Net,但是由于当时不熟悉用法,而选择了自己拼接查询语句.例如: string queryG ...

  5. Elasticsearch查询

    Elasticsearch支持两种类型的查询:基本查询和复合查询. 基本查询,如词条查询用于查询实际数据. 复合查询,如布尔查询,可以合并多个查询, 然而,这不是全部.除了这两种类型的查询,你还可以用 ...

  6. LAMP平台搭建菜鸟入门级实验

    LAMP平台搭建(菜鸟入门级) mysql 安装: (1)二进制安装  二进制安装 ,执行解压配置即可.无须执行三布安装. (2)源码编译安装 安装准备工作: (1)查看系统配置:#uname -a/ ...

  7. SpringMVC学习系列(5) 之 数据绑定-2

    在系列(4)中我们介绍了如何用@RequestParam来绑定数据,下面我们来看一下其它几个数据绑定注解的使用方法. 1.@PathVariable 用来绑定URL模板变量值,这个我们已经在系列(3) ...

  8. Linux-第一天

    1.etc 配置目录 2.swap 3.挂载点 建立一个目录,作为一个设备的访问入口,光盘镜像文件.移动硬盘.U盘以及Windows网络共享和UNIX NFS网络共享等 mnt目录, 建立挂载点:mn ...

  9. Java Socket网络编程的经典例子(转)

    事实上网络编程简单的理解就是两台计算机相互通讯数据而已,对于程序员而言,去掌握一种编程接口并使用一种编程模型相对就会显得简单的多了,Java SDK提供一些相对简单的Api来完成这些工作.Socket ...

  10. Storm Bolt接口

          Bolt是Topology中数据处理的基本单元,也是Storm针对处理过程的编程单元.Topology中所有的处理都是在这些bolt中完成的. Bolt可以将数据项发送至多个数据流(Str ...