上个月看了篇文章 “SAVING 9 GB OF RAM WITH PYTHON’S __SLOTS__”,原来Python也有类似结构体的东东。拖了一个月才写这篇,是因为太久没看python源码而生疏了,中间又捣鼓了一下tmux神马的。
简单的说,slots提供了一种强制声明对象属性的方法。如果在类定义的时候定义了__slots__的值(string列表),这个类的对象就只能使用列表中属性名。

class A(object):
     def __init__(self):
          self.uuid = 2
          self.word = ‘hello'

变成:

class B(object):
     __slots__ = ( 'value', ‘other')
     def __init__(self):
          self.uuid = 2
          self.word = ‘hello'
          self.other = ‘world'  # AttributeError: ‘B’ object has no attribute ‘other’

是不是很像C的结构体?注意__slots__只是起了限定的作用,属性还是要先赋值才读取。

引入slots的主要目的是节省内存。默认python会为每个对象创建一个dict,通过__dict__索引。脚本中定义的属性其实都存在这个dict中。如果类定义了__slots__,创建对象时就不会创建dict,这也就解释了为什么不能随意增加属性了。

能省多少内存呢?dict对象本身只有248bytes。而dict的容量通常是其中有效entry的2~4倍,使用slots不会减少有效entry的数量,因此大概能省一半的空entry。原文中能从25G内存中省下9G,应该是不仅对象很多,而且每个对象的属性很多。考虑到我们实际的应用环境,似乎达不到这样的量。而且服务端很多类都是在C中定义的,其实效果是一样的。

性能上会有提高吗?实测结果几乎没有,从实现上可以看出,其实还是需要做一次dict查找。

目前想到的一个用处是提高可维护性:虽然作为动态语言,允许随意增删对象的属性是个很方便的设定。但是也会对可维护性造成一定的影响。比如一不小心写错属性名。如果是赋值,python会默默的以为是一个新的,导致真正要改的数据没改到,如果是读取,一直到运行时跑到这段代码才会报错。通过定义slots,可以一定程度上避免错误赋值,但是对于错误读取就作用不大了。

关于slots的使用有一些规则和限制,在python自带的文档里有详细说明。

最后是实现的一些细节。代码主要在Objects/typeobject.c。下面两张图是普通类和使用slots的类的区别(红色部分)。

对于普通类A,我们可以看到,它的tp_dictoffset的值是一个偏移量,对应于这个类所创建的对象(比如a)内存中的从头部数到这个偏移量的内存地址,其实是一个PyObject指针。这个指针指向一个dict对象,也就是我们在运行期可以访问到的a.__dict__。脚本中定义的所有属性就保存在这个dict当中。由于这两个指针分别有8字节,因此整个对象a的大小是基本大小16加上8*2,总共32字节。

而对于使用了slots的类B,它的tp_dictoffset就变成了0。换句话说就是没有分配dict对象。那怎么索引到属性呢?其实是上升到了类的层次。在Python中,所有东西都是对象,包括类型本身也是对象,类型对象的类型是PyType_Type(脚本中的type)。听起来很绕,其实这里只是想说明,类型对象是变长对象,包括基本信息加上若干PyMemberDef对象。每个PyMemberDef对象其实就对应于slots中个每个属性声明。而这个类所创建的对象中,也会为每个属性声明分配一个PyObject指针的内存。在初始化类型的时候(PyType_Ready函数),系统会为每个PyMemberDef创建一个descriptor,并在类的__dict__(不是对象的__dict__,从类的tp_dict指向)中建立从属性名到descriptor的映射。

因此,无论哪种方法,都需要进行一次hash查找,区别只是在类的__dict__还是对象的__dict__中。

最后的最后,推荐一下这个不需要安装的在线画图工具:lucidchart

 
 
 
 
阅读(755)| 评论(0)

slots - Python的结构体 转的更多相关文章

  1. python 传递结构体指针到 c++ dll

    CMakeLists.txt # project(工程名) project(xxx) # add_library(链接库名称 SHARED 链接库代码) add_library(xxx SHARED ...

  2. python 实现结构体

    # python 使用类创建结构体 class Myclass(object): class Struct(object): def __init__(self, name, age, job): s ...

  3. c++调用python系列(1): 结构体作为入参及返回结构体

    最近在打算用python作测试用例以便对游戏服务器进行功能测试以及压力测试; 因为服务器是用c++写的,采用的TCP协议,当前的架构是打算用python构造结构体,传送给c++层进行socket发送给 ...

  4. Python与C++结构体交互

    需求:根据接口规范,实现与服务端的数据交互 服务端结构体分包头.包体.包尾 包头C++结构体示例如下 typedef struct head { BYTE string1; BYTE string2; ...

  5. ctypes 操作 python 与 c++ dll 互传结构体指针

    CMakeLists.txt # project(工程名) project(blog-3123958139-1) # add_library(链接库名称 SHARED 链接库代码) add_libra ...

  6. python如何将指定路径下的某类型文件,返回一个树形结构体,让前端显示为树形的目录结构

    最近遇到一个问题就是某个linux的目录下有各种文件现在的要求是只需要返回.kml格式的文件,并根据前端要求返回如下结构体即:[{'children': [{'children': [{'title' ...

  7. 『Python CoolBook』C扩展库_其四_结构体操作与Capsule

    点击进入项目 一.Python生成C语言结构体 C语言中的结构体传给Python时会被封装为胶囊(Capsule), 我们想要一个如下结构体进行运算,则需要Python传入x.y两个浮点数, type ...

  8. Python 定义及使用结构体

    Python中没有专门定义结构体的方法,但可以使用class标记定义类来代替结构体,其成员可以在构造函数__init__中定义,具体方法如下. class seqNode: def __init__( ...

  9. python调用c/c++时传递结构体参数

    背景:使用python调用linux的动态库SO文件,并调用里边的c函数,向里边传递结构体参数.直接上代码 //test1.c # include <stdio.h> # include ...

随机推荐

  1. codeforces 675C Money Transfers map

    上面是官方题解,写的很好,然后就A了,就是找到前缀和相等的最多区间,这样就可以减去更多的1 然后肯定很多人肯定很奇怪为什么从1开始数,其实从2开始也一样,因为是个环,从哪里开始记录前缀和都一样 我们的 ...

  2. 十字链表 Codeforces Round #367 E Working routine

    // 十字链表 Codeforces Round #367 E Working routine // 题意:给你一个矩阵,q次询问,每次交换两个子矩阵,问最后的矩阵 // 思路:暴力肯定不行.我们可以 ...

  3. Some_problem_with_octopress

    今天我总算是使用上了高大上的octopress了,不容易啊,现在我把之前的博客全部搬到了octopress上了,在github上办博客让我不用再担心流量和广告了!---爽啊 我使用octopress时 ...

  4. Trail: JDBC(TM) Database Access(3)

    java.sql,javax.sql,javax.naming包    默认TYPE_FORWARD_ONLY:结果集只能向前滚动,只能调用next(),不能重定位游标 TYPE_SCROLL_INS ...

  5. Hadoop学习之--Capaycity Scheduler源码分析

    Capacity Scheduler调度策略当一个新的job是否允许添加到队列中进行初始化,判断当前队列和用户是否已经达到了初始化数目的上限,下面就从代码层面详细介绍整个的判断逻辑.Capaycity ...

  6. 最近的bug列表总结(C++)

    最近写了一大段代码,抽象得厉害,容易绕进去,因为写单测的代价很大(借口),所以很多问题到联调的是否才发现. 而且花费了很大的经历才查出来,主要问题有如下几个问题 1. 变量未初始化 具体来说,就是指针 ...

  7. php编程冒泡排序

    <?//冒泡排序法 function bubble_sore($array) { $count = count($array); if ($count < 0) { return fals ...

  8. Oracle DB 执行用户管理的备份和恢复

    • 说明用户管理的备份和恢复与服务器管理的备份和恢复 之间的差异 • 执行用户管理的数据库完全恢复 • 执行用户管理的数据库不完全恢复 备份和恢复的使用类型 数据库备份和恢复的类型包括: • 用户管理 ...

  9. POJ 1088 滑雪 (记忆化搜索)

    题目链接:http://poj.org/problem?id=1088 题意很好懂,就是让你求一个最长下降路线的长度. dp[i][j]记录的是i j这个位置的最优的长度,然后转移方程是dp[i][j ...

  10. Mac下的eclipse 4.6的tomcat插件安装正确姿势

    最新版 eclipse 4.6 (Neon) tomcat 插件的安装, 解决tomcat插件tomcatPluginV331不能使用的问题. 1.打开最新版的 eclipse 4.6 (neon), ...