面试题

分别给出下述代码在终端(e.g. IPyhon)中和在程序中的运行结果：

a = 256

b = 256

c = 257

d = 257

def foo():

      e = 257

      f = 257

      print('a is b: %s' % (a is b))

      print('c is d: %s' % (c is d))

      print('c is e: %s' % (c is e))

      print('e is f: %s' % (e is f))

foo()

IPython 中运行的结果：

In [31]: a = 256

In [32]: b = 256

In [33]: c = 257

In [34]: d = 257

In [35]: def foo():

    ...:         e = 257

    ...:         f = 257

    ...:

    ...:         print('a is b: %s' % (a is b))

    ...:         print('c is d: %s' % (c is d))

    ...:         print('c is e: %s' % (c is e))

    ...:         print('e is f: %s' % (e is f))

    ...:

In [36]: foo()

a is b: True

c is d: False

c is e: False

e is f: True

在程序中运行的结果：

$ python foo.py

a is b: True

c is d: True

c is e: False

e is f: True

Emmmmm~ 显然两次执行的结果不尽相同，实际上在这个简单的代码之中包含了两个鲜为人知的 Python 技术内幕。

小整数与大整数

整数是最为简单且常用的数据类型，尤其在极端的科学计算场景中，上百万次计算就发生在数秒之间。对于这些场景，如果 Python 仍单纯的使用 malloc/free 函数来完成内存的分配与释放，那么其运行性能将会及其低下，并且会造成很大的浪费。所以，出于性能的考虑，Python 在内部对整数的实现做了许多优化工作，而优化的核心就是减少 malloc/free 函数的调用。

同时又因为在实际的应用中，应用程序对整数的使用有明显的数值区间划分。例如，数值较小的整数会更频繁的被使用，而数值较大的整数虽然使用得不那么频繁，但却要占用更大的内存空间。为了更好的区分优化，在 Python 的源码实现中，将整数的定义细分为「小整数」和「大整数」，前者的数值范围在 [-5, 257) 之间，其余的数值均归为后者。

小整数对象缓存池

小整数的使用是最为频繁的，为了避免反复创建和销毁带来的资源开销，Pyhton 干脆直接将这些小整数都缓存到一个特定的 small_ints 链表中，该链表会存在于 Python 解释器的整个生命周期中，但凡需要使用小整数时，则直接从链表中获取。这就是Python 的「小整数对象缓存池技术」，简单来说就是小整数对象会在 Python 全局解释器范围内被重复引用，且永远不会被 GC 回收。那么对于小整数而言，只会在初始化 small_ints 时调用 malloc/free 函数。

通用整数对象缓冲池

Python 运行环境会为大整数对象分配一定的缓冲内存空间，该内存空间会被大整数对象轮流使用，直到占满为止，再继续再开辟一块新的内存空间。这就是 Python 的「通用整数对象缓冲池技术」。

通用整数对象缓冲池相关的结构体定义：

struct _intblock {

    struct _intblock *next;

    PyIntObject objects[N_INTOBJECTS];

};

typedef struct _intblock PyIntBlock;

static PyIntBlock *block_list = NULL;

static PyIntObject *free_list = NULL;

PyIntObject（Python 整数对象）会以数组的形式存在于 PyIntBlock 中，一个 block 大约能够存放 82 个 PyIntObject。block_list 用于维护分配给 PyIntObject 所有的内存空间，而 free_list 则用于维护 PyIntObject 可用的剩余内存空间。只有当 free_list 为 NULL（剩余空间为 0）时，Python 才会调用 fill_free_list 函数再 malloc 出来一个 block。并且当一个大整数对象的引用计数为 0 而需要被回收时，其占有的内存并不会归还给系统，而是重新回到 free_list，供新创建的整数对象使用。由此可见，通用整数对象缓冲池同样能够有效的减少 malloc/free 函数的调用。

在理解了大、小整数实现的不同后，再看看下面的运行结果，我想大家应该不会再感到奇怪：

In [25]: a = 256

In [26]: b = 256

In [27]: a is b

Out[27]: True

In [28]: c = 257

In [29]: d = 257

In [30]: c is d

Out[30]: False

但这依旧不足以解释面试题中同为大整数的变量 c、d、e、f，为什么 c/d、e/f 的内存地址却是两两相同的结果。这就涉及到了另一个知识点——「Python 的解析模式」。

逐行解释与整体解释的差异

整体解释

整体解释指的是通过应用程序的方式来运行 Python 代码，对应面试题在程序中运行的结果。对于此时的 Python 代码而言，解析器 CPython 的「编译单元」是一个函数（Python 顶层代码也被当作一个函数来进行编译），即题目中的函数 foo 会被单独编译，而得到一个 PyFunctionObject 对象，该对象中包含了字节码、常量池等信息。

每个 PyFunctionObject 都拥有有一个独立的常量池，如果在同一个 PyFunctionObject 里创建了值相同的常量，那么这些常量只会在常量池里出现一份。也就是说位于顶层的变量 c、d 和位于 foo 函数中 e、f 实际上都分别引用了来自同一个 PyFunctionObject 的常量池中的内存对象，所以变量 c/d、e/f 的内存地址才会两两相同。同理，因为变量 c 和 e 分别存在于两个不同的 PyFunctionObject 中，所以即便两者的值相同，也不是同一个内存对象。

需要注意的是这里提到的「常量」，通常指的是整数类型对象。又因为整型中的小整数具有小整数缓存池机制，所以即便是在不同的 PyFunctionObject 中，小整数变量也依旧会引用同一个内存对象。

逐行解释

在交互式解释器中执行 Python 代码，对应面试题中在 IPython 中运行的代码。每输入一行语句就会立即执行，所以此时的「编译单元」为一行语句。注意这里所说的“一行”指的是一次完整性输入，例如：

In [33]: c = 257

In [34]: d = 257

In [35]: def foo():

    ...:     e = 257

    ...:     f = 257

    ...:

    ...:     print('a is b: %s' % (a is b))

    ...:     print('c is d: %s' % (c is d))

    ...:     print('c is e: %s' % (c is e))

    ...:     print('e is f: %s' % (e is f))

    ...:

上述代码块实际上属于 3 次完整性输入，分别得到了 3 个不同的 PyFunctionObject，所以变量 c、d 自然也就不存在于同一个常量池中，所以 (c is d) == False。

最后

实际上这一个看是并没有什么卵用的知识点，掌握与否并不会影响到日常的编程任务。但往往是这种“大隐隐与市”的知识点，最能区别出开发者对一门语言的理解，以及开发者是否具有专研精神的考量。

其次，我们能通过 Python 对整数实现的优化得到一些启发，就是 pool 的设计与机制是一种能够降低应用系统中性能损耗的有效手段。

Python 笔试集（2）：你不知道的 Python 整数的更多相关文章

Python 笔试集（4）：True + True == ？
目录目录前文列表面试题True Ture 布尔值布尔类型是特殊的整数类型前文列表 Python 笔试集:什么时候 i = i + 1 并不等于 i += 1? Python 笔试集(1):关 ...
Python 笔试集（3）：编译/解释？动态/静态？强/弱？Python 是一门怎样的语言
面试题解释/编译?动态/静态?强/弱?Python 到底是一门怎样的语言? 编译 or 解释? 编译.解释都是指将(与人类亲和的)编程语言翻译成(计算机能够理解的)机器语言(Machine code ...
Python 笔试集（1）：关于 Python 链式赋值的坑
前言 Python 的链式赋值是一种简易型批量赋值语句,一行代码即可为多个变量同时进行赋值. 例如: x = y = z = 1 链式赋值是一种非常优雅的赋值方式,简单.高效且实用.但同时它也是一个危 ...
Python 笔试集：什么时候 i = i + 1 并不等于 i += 1？
增强型赋值语句是经常被使用到的,因为从各种学习渠道中,我们能够得知 i += 1 的效率往往要比 i = i + 1 更高一些(这里以 += 为例,实际上增强型赋值语句不仅限于此).所以我们会乐此 ...
『Python题库 - 填空题』151道Python笔试填空题
『Python题库 - 填空题』Python笔试填空题 part 1. Python语言概述和Python开发环境配置 part 2. Python语言基本语法元素(变量,基本数据类型, 基础运算) ...
python垃圾回收机制与小整数池
python垃圾回收机制当引用计数为0时,python会删除这个值. 引用计数 x = 10 y = x del x print(y) 10 引用计数+1,引用计数+1,引用计数-1,此时引用计数为 ...
实现Redis Cluster并实现Python链接集群
目录一.Redis Cluster简单介绍二.背景三.环境准备 3.1 主机环境 3.2 主机规划四.部署Redis 4.1 安装Redis软件 4.2 编辑Redis配置文件 4.3 启动R ...
你不知道的Python容器
你不知道的Python容器你不知道的Python容器散列表 ChainMap MappingProxyType 线性表堆参考资料昨天阅读了<Python Tricks: The Boo ...
有哪些你不知道的python小工具
python作为越来越流行的一种编程语言,不仅仅是因为它语言简单,有许多现成的包可以直接调用. python中还有大量的小工具,让你的python工作更有效率. 1.- 快速共享 - HTTP服务器 ...

随机推荐

从安装 centos 到运行 laravel 的配置
# 安装 centos cd /etc/sysconfig/network-scripts/ vi ifcfg-xxx # 修改 ONBOOT="no" 为 "yes&q ...
windows核心编程01_错误处理
windows函数调用出错时,可以通过方法去查询出错根源在哪里. #include <Windows.h> #include <iostream> using namespac ...
nginx的简单介绍
nginx简单介绍 Nginx的负载均衡策略可以分两大类:内置策略和扩展侧略: 内置策略包括:轮询,加权轮询,IP hash 扩展策略是:url hash ,fair nginx.conf文件结构 1 ...
zencart产品批量采集伪原创方法，再也不用担心与别人的数据重复了
首先,请你提供与产品相关的关键词一份,至于关键词如何来,相信做SEO的你很清楚了,SEO关键词搜索工具应该很多,比如谷歌相关关键词搜索,用记事本的形式保存为每行一个关键词.采集产品的时候,我会帮你将关 ...
Android仿支付宝扣款顺序，动态改变ListView各Item次序
前言:今天遇到个需求,需要让用户动态选择语音传输方式的次序,突然想起支付宝选择扣款顺序的功能,恰好能满足需要,就花了点时间写了个demo,在此权当学习记录先上效果图支付宝的效果 demo的效果思 ...
SpringCloud组件架构图
总结一下spring cloud 的结构: 1.请求统一通过API网关(Zuul)来访问内部服务. 2.网关接收到请求后,从注册中心(Eureka)获取可用服务 3.由Ribbon进行均衡负载后,分发 ...
Linux文件命名规则
Linux目录结构命名规定几乎所有的Linux版本都会遵循FHS(Filesystem Hierarchy Standard),中文翻译过来即为文件系统层次化标准.类似于Windows操作系统中c盘 ...
Console Add Item –Java使用eBay API SDK刊登商品详解
准备工作: 1. 运行Eclipse (或其他Java IDE) 2.创建一个ConsoleAddItem工程(项目) 选JDK 1.5.1.6.1.8等版本,已测试1.6.1.8版本. 3.下载JA ...
web性能优化--服务器端（二）
静态资源用CDN部署添加Expires或者cache-control报文头 Gzip压缩传输文件配置Etags 使用Get ajax请求避免空图片src 尽早flush response 减少c ...
【NOIP2016提高组复赛day2】天天爱跑步
题目小 C 同学认为跑步非常有趣,于是决定制作一款叫做<天天爱跑步>的游戏. <天天爱跑步>是一个养成类游戏,需要玩家每天按时上线,完成打卡任务. 这个游戏的地图可以看作一棵 ...

Python 笔试集（2）：你不知道的 Python 整数

面试题