python小数据池，代码块的最详细、深入剖析

一，id，is，==

在Python中，id是什么？id是内存地址，比如你利用id()内置函数去查询一个数据的内存地址：

name = '太白'

print(id(name))  # 1585831283968

那么 is 是什么？ == 又是什么？

== 是比较的两边的数值是否相等，而 is 是比较的两边的内存地址是否相等。如果内存地址相等，那么这两边其实是指向同一个内存地址。

可以说如果内存地址相同，那么值肯定相同，但是如果值相同，内存地址不一定相同。

二，代码块。

根据官网提示我们可以获知：

根据提示我们从官方文档找到了这样的说法：

A Python program is constructed from code blocks. A block is a piece of Python program text that is executed as a unit. The following are blocks: a module, a function body, and a class definition. Each command typed interactively is a block. A script file (a file given as standard input to the interpreter or specified as a command line argument to the interpreter) is a code block. A script command (a command specified on the interpreter command line with the ‘-c‘ option) is a code block. The string argument passed to the built-in functions eval() and exec() is a code block.

A code block is executed in an execution frame. A frame contains some administrative information (used for debugging) and determines where and how execution continues after the code block’s execution has completed.

上面的主要意思是：

Python程序是由代码块构造的。块是一个python程序的文本，他是作为一个单元执行的。

代码块：一个模块，一个函数，一个类，一个文件等都是一个代码块。

而作为交互方式输入的每个命令都是一个代码块。

什么叫交互方式？就是咱们在cmd中进入Python解释器里面，每一行代码都是一个代码块，例如：

而对于一个文件中的两个函数，也分别是两个不同的代码块：

OK，那么现在我们了解了代码块，这和小数据池有什么关系呢？且听下面分析。

代码块的缓存机制

Python在执行同一个代码块的初始化对象的命令时，会检查是否其值是否已经存在，如果存在，会将其重用。换句话说：执行同一个代码块时，遇到初始化对象的命令时，他会将初始化的这个变量与值存储在一个字典中，在遇到新的变量时，会先在字典中查询记录，如果有同样的记录那么它会重复使用这个字典中的之前的这个值。所以在你给出的例子中，文件执行时（同一个代码块）会把i1、i2两个变量指向同一个对象，满足缓存机制则他们在内存中只存在一个，即：id相同。

代码块的缓存机制的适用范围： int（float），str，bool。

int(float):任何数字在同一代码块下都会复用。

bool:True和False在字典中会以1，0方式存在，并且复用。

str：几乎所有的字符串都会符合缓存机制，具体规定如下（了解即可！）：

1，非乘法得到的字符串都满足代码块的缓存机制：

s1 = '太白@！#*ewq'

s2 = '太白@！#*ewq'

print(s1 is s2)  # True

2,乘法得到的字符串分两种情况：

　　2.1 乘数为1时，任何字符串满足代码块的缓存机制：

b1 = '太白@5847395QQ0743895*&^%$#((&_+(())' *1

a1 = '太白@5847395QQ0743895*&^%$#((&_+(())' *1

print(a1 is b1)  # True

　　2.2 乘数>=2时：仅含大小写字母，数字，下划线，总长度<=20，满足代码块的缓存机制：

s1 = 'old_' * 5

s2 = 'old_' * 5

print(s1 is s2)  # True

优点：能够提高一些字符串，整数处理人物在时间和空间上的性能；需要值相同的字符串，整数的时候，直接从‘字典’中取出复用，避免频繁的创建和销毁，提升效率，节约内存。

三，小数据池

小数据池，也称为小整数缓存机制，或者称为驻留机制等等，博主认为，只要你在网上查到的这些名字其实说的都是一个意思，叫什么因人而异。

那么到底什么是小数据池？他有什么作用呢？

大前提：小数据池也是只针对 int(float)，str，bool。

小数据池是针对不同代码块之间的缓存机制！！！

官方对于整数，字符串的小数据池是这么说的:

对于整数，Python官方文档中这么说：

The current implementation keeps an array of integer objects for all integers between -5 and 256, when you create an int in that range you actually just get back a reference to the existing object. So it should be possible to change the value of 1. I suspect the behaviour of Python in this case is undefined.

对于字符串：

Incomputer science, string interning is a method of storing only onecopy of each distinct string value, which must be immutable. Interning strings makes some stringprocessing tasks more time- or space-efficient at the cost of requiring moretime when the string is created or interned. The distinct values are stored ina string intern pool. –引自维基百科

来，我给你们翻译并汇总一下，这个表达的意思就是：

Python自动将-5~256的整数进行了缓存，当你将这些整数赋值给变量时，并不会重新创建对象，而是使用已经创建好的缓存对象。

python会将一定规则的字符串在字符串驻留池中，创建一份，当你将这些字符串赋值给变量时，并不会重新创建对象，而是使用在字符串驻留池中创建好的对象。

其实，无论是缓存还是字符串驻留池，都是python做的一个优化，就是将~5-256的整数，和一定规则的字符串，放在一个‘池’（容器，或者字典）中，无论程序中那些变量指向这些范围内的整数或者字符串，那么他直接在这个‘池’中引用，言外之意，就是内存中之创建一个。

优点：能够提高一些字符串，整数处理人物在时间和空间上的性能；需要值相同的字符串，整数的时候，直接从‘池’里拿来用，避免频繁的创建和销毁，提升效率，节约内存。

int：那么大家都知道对于整数来说，小数据池的范围是-5~256 ，如果多个变量都是指向同一个（在这个范围内的）数字，他们在内存中指向的都是一个内存地址。

那么对于字符串的规定呢？

str:字符串要从下面这几个大方向讨论（了解即可！）：

1,字符串的长度为0或者1，默认都采用了驻留机制（小数据池）。

2,字符串的长度>1,且只含有大小写字母，数字，下划线时，才会默认驻留。

3,用乘法得到的字符串，分两种情况。

　　3.1 乘数为1时：

仅含大小写字母，数字，下划线，默认驻留。

含其他字符，长度<=1,默认驻留。

含其他字符，长度>1,默认驻留。

　　3.2 乘数>=2时：

仅含大小写字母，数字，下划线，总长度<=20,默认驻留。

4，指定驻留。

from sys import intern

a = intern('hello!@'*20)

b = intern('hello!@'*20)

print(a is b)

#指定驻留是你可以指定任意的字符串加入到小数据池中，让其只在内存中创建一个对象，多个变量都是指向这一个字符串。

满足以上字符串的规则时，就符合小数据池的概念。

bool值就是True，False，无论你创建多少个变量指向True，False，那么他在内存中只存在一个。

看一下用了小数据池（驻留机制）的效率有多高：

显而易见，节省大量内存在字符串比较时，非驻留比较效率o(n)，驻留时比较效率o(1)。

深浅copy

1，先看赋值运算。

l1 = [1,2,3,['barry','alex']]

l2 = l1

l1[0] = 111

print(l1)  # [111, 2, 3, ['barry', 'alex']]

print(l2)  # [111, 2, 3, ['barry', 'alex']]

l1[3][0] = 'wusir'

print(l1)  # [111, 2, 3, ['wusir', 'alex']]

print(l2)  # [111, 2, 3, ['wusir', 'alex']]

对于赋值运算来说，l1与l2指向的是同一个内存地址，所以他们是完全一样的。

2，浅拷贝copy。

#同一代码块下：

l1 = [1, '太白', True, (1,2,3), [22, 33]]

l2 = l1.copy()

print(id(l1), id(l2))  # 2713214468360 2713214524680

print(id(l1[-2]), id(l2[-2]))  # 2547618888008 2547618888008

print(id(l1[-1]),id(l2[-1]))  # 2547620322952 2547620322952

# 不同代码块下：

>>> l1 = [1, '太白', True, (1, 2, 3), [22, 33]]

>>> l2 = l1.copy()

>>> print(id(l1), id(l2))

1477183162120 1477183162696

>>> print(id(l1[-2]), id(l2[-2]))

1477181814032 1477181814032

>>> print(id(l1[-1]), id(l2[-1]))

1477183162504 1477183162504

对于浅copy来说，只是在内存中重新创建了开辟了一个空间存放一个新列表，但是新列表中的元素与原列表中的元素是公用的。

3，深拷贝deepcopy。

# 同一代码块下

import copy

l1 = [1, 'alex', True, (1,2,3), [22, 33]]

l2 = copy.deepcopy(l1)

print(id(l1), id(l2))  # 2788324482440 2788324483016

print(id(l1[0]),id(l2[0]))  # 1470562768 1470562768

print(id(l1[-1]),id(l2[-1]))  # 2788324482632 2788324482696

print(id(l1[-2]),id(l2[-2]))  # 2788323047752 2788323047752

# 不同代码块下

>>> import copy

>>> l1 = [1, '太白', True, (1, 2, 3), [22, 33]]

>>> l2 = copy.deepcopy(l1)

>>> print(id(l1), id(l2))

1477183162824 1477183162632

>>> print(id(0), id(0))

1470562736 1470562736

>>> print(id(-2), id(-2))

1470562672 1470562672

>>> print(id(l1[-1]), id(l2[-1]))

1477183162120 1477183162312

对于深copy来说，列表是在内存中重新创建的，列表中可变的数据类型是重新创建的，列表中的不可变的数据类型是公用的。

四，小结。

　　如果在同一代码块下，则采用同一代码块下的换缓存机制。

　　如果是不同代码块，则采用小数据池的驻留机制。

# pycharm 通过运行文件的方式执行下列代码：  这是在同一个文件下也就是同一代码块下，采用同一代码块下的缓存机制。

i1 = 1000

i2 = 1000

print(i1 is i2)  # 结果为True 因为代码块下的缓存机制适用于所有数字

通过交互方式中执行下面代码：   # 这是不同代码块下，则采用小数据池的驻留机制。

>>> i1 = 1000

>>> i2 = 1000

>>> print(i1 is i2)

False  # 不同代码块下的小数据池驻留机制 数字的范围只是-5~256.

更多验证：

# 虽然在同一个文件中，但是函数本身就是代码块，所以这是在两个不同的代码块下，不满足小数据池（驻存机制），则指向两个不同的地址。

def func():

    i1 = 1000

    print(id(i1))  # 2288555806672

def func2():

    i1 = 1000

    print(id(i1))  # 2288557317392

func()

func2()

总结day6 ---- set集合,基本类型的相互转化,编码,数据类型总结,循环时候不要动列表或者字典,深浅copy的更多相关文章

Python 第三篇(下)：collections系列、集合(set)、单双队列、深浅copy、内置函数
一.collections系列: collections其实是python的标准库,也就是python的一个内置模块,因此使用之前导入一下collections模块即可,collections在py ...
Python之几种重要的基本类型：元组，列表，字典，字符串，集合
写在前面:重点讲解元组,列表,字典相关概念和常用操作. 一.元组(tuple) 1.特性:不可更改的数据序列.[理解:一旦创建元组,则这个元组就不能被修改,即不能对元组进行更新.增加.删除操作] 2. ...
【转】HashMap集合中key只能为引用数据类型，不能为基本类型
在HashMap中,为什么不能使用基本数据类型作为key? 其实和HashMap底层的存储原理有关,HashMap存储数据的特点是:无序.无索引.不能存储重复元素. 存储元素采用的是hash表存储数据 ...
第二百九十八节，python操作redis缓存-Set集合类型，可以理解为不能有重复元素的列表
python操作redis缓存-Set集合类型,可以理解为不能有重复元素的列表 sadd(name,values)name对应的集合中添加元素 #!/usr/bin/env python # -*- ...
python基础——数字&集合&布尔类型
Python的核心数据类型内置对象对象类型例子数字 123,3.1415,3+4j,Decimal(小数),Fraction(分数) 字符串 'dodo',"guido's" ...
java基础小练习,1-打印一百次(1~10)的随机数,2-固定一个随机数(1~100)，然后猜出他,3-定义以指定格式打印集合(ArrayList类型作为参数)，使用{}括起来，使用@代替,分隔每个元素
推荐自己码一下,可以使用别的方法,面向对象,不需要注重过程 /* 题目:我需要打印一百次(1~10)的随机数 */ import java.util.Random; public class demo ...
python基础3（元祖、字典、深浅copy、集合、文件处理）
本次内容: 元祖字典浅copy和深copy 集合文件处理 1.1元祖元祖(tuple)与列表类似,不同之处在于元祖的元素不能修改,元祖使用小括号(),列表使用方括号[].元祖创建很简单,只需要 ...
Day2 - Python基础2 列表、字典、集合
Python之路,Day2 - Python基础2 本节内容列表.元组操作字符串操作字典操作集合操作文件操作字符编码与转码 1. 列表.元组操作列表是我们最以后最常用的数据类型之一, ...
python基础（6）：列表和字典类型
前面我们所接触的数据类型都是存单个值,今天我们来看看可以存多个值的列表和字典. 预习: 1.有列表data=['alex',49,[1900,3,18]],分别取出列表中的名字,年龄,出生的年,月,日 ...

随机推荐

mybatis使用foreach进行批量插入和删除操作
一.批量插入 1.mapper层 int insertBatchRoleUser(@Param("lists") List<RoleUser> lists);//@Pa ...
外层div高度不随内层div高度改变的解决办法
当b1和b2都是float=left时候,a1层的高度不会被b1和b2的高度撑开. <div id=“div1″> <div id=”div2″ style="float: ...
jQuery的节点操作
1.创建节点 var aa = $("<div id='cccc'>插入的内容</div>") var bb = $("<a href='h ...
手动制作CA证书
一.安装 CFSSL 证书下载官方地址:https://pkg.cfssl.org #下面三个安装包,无需下载,之前百度云中的压缩包中都有[root@linux-node1 ~]# cd /usr/l ...
static 与 extern 关键字描述说明
使用static 定义的变量和函数只能用于本模块即为本文件使用extern 定义的变量和函数可以用于其他模块的引用
怎样在Windows与Centos下的Linux间共享文件，如果mnt文件夹不显示，可能是mnt缺少共享支持
mnt中的hgfs文件夹就是Linux系统中挂载共享文件的默认文件夹.有的人按步骤共享之后mnt中没有出现共享的文件,可能是因为你的mnt缺少共享支持. 此时可以在Terminal中输入:sudo m ...
yarn 完美替代 npm
众所周知,npm是nodejs默认的包管理工具,我们通过npm可以下载安装或者发布包,但是npm其实存在着很多小问题,比如安装速度慢.每次都要在线重新安装等,而yarn也正是为了解决npm当前存在的问 ...
swift -pop的简单动画
//1.新建空文件命名Podfile //2.写入 pod ‘pop’,’~>1.0’ 保存 //3.打开终端,进入项目路径执行pod install //4.新建桥接头文件导入#im ...
user_mongo_in_a_docker_and_dump_database
使用 mongo docker 镜像使用 mongo 镜像是很方便的,直接使用官方镜像就好了,为了今后更方便使用,这里给出依据 restheart-docker 中的 docker-compose. ...
C的打印输出格式
#include<stdio.h> int main() { float test1=12.3224356546565461-0.1; int test2=13; char test3[] ...

总结day6 ---- set集合,基本类型的相互转化,编码,数据类型总结,循环时候不要动列表或者字典,深浅copy