【python进阶】Garbage collection垃圾回收2
前言
在上一篇文章【python进阶】Garbage collection垃圾回收1,我们讲述了Garbage collection(GC垃圾回收),画说Ruby与Python垃圾回收,Python中的循环数据结构以及引⽤计数以及Python中的GC阈值,这一节我们将继续介绍GC模块的一些应用和注意事项,下面开始今天的讲解~~
一、垃圾回收机制
Python中的垃圾回收是以引⽤计数为主,分代收集为辅。
1、导致引⽤计数+1的情况
- 对象被创建,例如a=23
- 对象被引⽤,例如b=a
- 对象被作为参数,传⼊到⼀个函数中,例如func(a)
- 对象作为⼀个元素,存储在容器中,例如list1=[a,a]
2、导致引⽤计数-1的情况
- 对象的别名被显式销毁,例如del a
- 对象的别名被赋予新的对象,例如a=24
- ⼀个对象离开它的作⽤域,例如f函数执⾏完毕时,func函数中的局部变量(全局变量不会)
- 对象所在的容器被销毁,或从容器中删除对象
3、查看⼀个对象的引⽤计数
In [1]: import sys In [2]: a = "hello world" In [3]: sys.getrefcount(a)
Out[3]: 2
可以查看a对象的引⽤计数,但是⽐正常计数⼤1,因为调⽤函数的时候传⼊ a,这会让a的引⽤计数+1
二、循环引⽤导致内存泄露
引⽤计数的缺陷是循环引⽤的问题
import sys
a = "hello world"
sys.getrefcount(a) import gc
class ClassA():
def __init__(self):
print('object born,id:%s'%str(hex(id(self)))) def f2():
while True:
c1 = ClassA()
c2 = ClassA()
c1.t = c2
c2.t = c1
del c1
del c2 #把python的gc关闭
gc.disable()
f2()
执⾏f2(),进程占⽤的内存会不断增⼤。

- 创建了c1,c2后这两块内存的引⽤计数都是1,执⾏ c1.t=c2 和 c2.t=c1 后,这两块内存的引⽤计数变成2.
- 在del c1后,内存1的对象的引⽤计数变为1,由于不是为0,所以内存1的对象不会被销毁,所以内存2的对象的引⽤数依然是2,在del c2后, 同理,内存1的对象,内存2的对象的引⽤数都是1。
虽然它们两个的对象都是可以被销毁的,但是由于循环引⽤,导致垃圾 回收器都不会回收它们,所以就会导致内存泄露。
三、垃圾回收
import gc
class ClassA():
def __init__(self):
print('object born,id:%s'%str(hex(id(self))))
#def __del__(self):
# print('object del,id:%s'%str(hex(id(self)))) def f3():
print("-----0------")
#print(gc.collect())
c1 = ClassA()
c2 = ClassA()
c1.t = c2
c2.t = c1
print("-----1------")
del c1
del c2
print("-----2------")
print(gc.garbage)
print("-----3------")
print(gc.collect())#显式执⾏垃圾回收
print("-----4------")
print(gc.garbage)
print("-----5------") if __name__ == '__main__':
gc.set_debug(gc.DEBUG_LEAK)#设置gc模块的日志
f3()
python3结果如下:
-----0------
object born,id:0x7fcd059190f0
object born,id:0x7fcd05919240
-----1------
-----2------
[]
-----3------
gc: collectable <ClassA 0x7fcd059190f0>
gc: collectable <ClassA 0x7fcd05919240>
gc: collectable <dict 0x7fcd05989d48>
gc: collectable <dict 0x7fcd058f24c8>
4
-----4------
[<__main__.ClassA object at 0x7fcd059190f0>, <__main__.ClassA object at 0x7fcd05919240>, {'t': <__main__.ClassA object at 0x7fcd05919240>}, {'t': <__main__.ClassA object at 0x7fcd059190f0>}]
-----5------
gc: collectable <module 0x7fcd059715e8>
gc: collectable <dict 0x7fcd0597af08>
gc: collectable <builtin_function_or_method 0x7fcd0596fdc8>
...
说明:
- 垃圾回收后的对象会放在gc.garbage列表⾥⾯
gc.collect()会返回不可达的对象数⽬,4等于两个对象以及它们对应的 dict
有三种情况会触发垃圾回收:
- 调⽤gc.collect(),
- 当gc模块的计数器达到阀值的时候。
程序退出的时候
四、gc模块常⽤功能解析
gc模块提供⼀个接⼝给开发者设置垃圾回收的选项 。上⾯说到,采⽤引⽤计数的⽅法管理内存的⼀个缺陷是循环引⽤,⽽gc模块的⼀个主要功能就是解决循环引⽤的问题。
常⽤函数:
1、gc.set_debug(flags) 设置gc的debug⽇志,⼀般设置为gc.DEBUG_LEAK
2、gc.collect([generation]) 显式进⾏垃圾回收,可以输⼊参数,0代表只检查第⼀代的对象,1代表检查⼀,⼆代的对象,2代表检查⼀,⼆,三代的对象,如果不传参数,执⾏⼀个full collection,也就是等于传2。 返回不可达(unreachable objects)对象的数⽬
3、gc.get_threshold() 获取的gc模块中⾃动执⾏垃圾回收的频率。
4、gc.set_threshold(threshold0[, threshold1[, threshold2]) 设置⾃动执⾏垃圾回收的频率。
5、gc.get_count() 获取当前⾃动执⾏垃圾回收的计数器,返回⼀个⻓度为3的列表。
gc模块的⾃动垃圾回收机制
必须要import gc模块,并且 is_enable()=True 才会启动⾃动垃圾回收。
这个机制的主要作⽤就是发现并处理不可达的垃圾对象 。
垃圾回收=垃圾检查+垃圾回收
在Python中,采⽤分代收集的⽅法。把对象分为三代,⼀开始,对象在创建的时候,放在⼀代中,如果在⼀次⼀代的垃圾检查中,改对象存活下来,就会被放到⼆代中,同理在⼀次⼆代的垃圾检查中,该对象存活下来,就会被放到三代中。
gc模块⾥⾯会有⼀个⻓度为3的列表的计数器,可以通过gc.get_count()获取。
例如(488,3,0),其中488是指距离上⼀次⼀代垃圾检查,Python分配内存的 数⽬减去释放内存的数⽬,注意是内存分配,⽽不是引⽤计数的增加。例如:
print(gc.get_count())#(590,8,0)
a = ClassA()
print(gc.get_count())#(590,8,0)
del a
print(gc.get_count())#(590,8,0)
3是指距离上⼀次⼆代垃圾检查,⼀代垃圾检查的次数,同理,0是指距离上 ⼀次三代垃圾检查,⼆代垃圾检查的次数。
gc模快有⼀个⾃动垃圾回收的阀值 ,即通过gc.get_threshold函数获取到的 ⻓度为3的元组,例如(700,10,10) 每⼀次计数器的增加,gc模块就会检查增加后的计数是否达到阀值的数⽬,如果是,就会执⾏对应的代数的垃圾检查,然后重置计数器.
例如,假设阀值是(700,10,10):
当计数器从(699,3,0)增加到(700,3,0),gc模块就会执⾏gc.collect(0),即检查⼀代对象的垃圾,并重置计数器
当计数器从(699,9,0)增加到(700,9,0),gc模块就会执⾏gc.collect(1),即检查⼀、⼆代对象的垃圾,并重置计数器
当计数器从(699,9,9)增加到(700,9,9),gc模块就会执⾏gc.collect(2),即检查⼀、⼆、三对象的垃圾,并重置计数器
注意点
gc模块唯⼀处理不了的是循环引⽤的类都有__del__⽅法,所以项⽬中要避免 定义__del__⽅法
import gc
class ClassA():
pass
#def __del__(self):
# print('object born,id:%s'%str(hex(id(self)))) gc.set_debug(gc.DEBUG_LEAK)
a = ClassA()
b = ClassA()
a.next = b
b.prev = a
print("--1--")
print(gc.collect())
print("--2--")
del a
print("--3--")
del b
print("--3-1--")
print(gc.collect())
print("--4--")
运行结果如下:
--1--
0
--2--
--3--
--3-1--
gc: collectable <ClassA 0x7f599dc690f0>
gc: collectable <ClassA 0x7f599dc69160>
gc: collectable <dict 0x7f599dcdcd48>
gc: collectable <dict 0x7f599dcdcdc8>
4
--4--
gc: collectable <module 0x7f599dcc45e8>
gc: collectable <dict 0x7f599dccdf08>
gc: collectable <builtin_function_or_method 0x7f599dcc2dc8>
...
如果把del打开,运⾏结果为:
--1--
0
--2--
--3--
--3-1--
gc: collectable <ClassA 0x7fb236853128>
gc: collectable <ClassA 0x7fb236853160>
gc: collectable <dict 0x7fb2368c5d48>
gc: collectable <dict 0x7fb2368c5ec8>
object born,id:0x7fb236853128
object born,id:0x7fb236853160
4
--4--
gc: collectable <module 0x7fb2368ad5e8>
gc: collectable <dict 0x7fb2368b6f08>
gc: collectable <builtin_function_or_method 0x7fb2368abdc8>
...
【python进阶】Garbage collection垃圾回收2的更多相关文章
- 【python进阶】Garbage collection垃圾回收1
前言 GC垃圾回收在python中是很重要的一部分,同样我将分两次去讲解Garbage collection垃圾回收,此篇为Garbage collection垃圾回收第一篇,下面开始今天的说明~~~ ...
- JVM-5-GC(Garbage Collection) 垃圾回收机制
GC(Garbage Collection) 垃圾回收机制 什么是垃圾回收机制 垃圾回收是一种动态存储管理技术,它自动地释放不再被程序引用的对象,按照特定的垃圾收集算法来实现资源自动回收的功能. ...
- An Introduction to Garbage Collection(垃圾回收简介)
1. Introduction 2. Principles 3. Advantages 4. Disadvantages 5. 常见的垃圾回收技术 5.1. 跟踪式垃圾回收 5.1.1. 基本算法 5 ...
- Python 内存管理与垃圾回收
Python 内存管理与垃圾回收 参考文献:https://pythonav.com/wiki/detail/6/88/ 引用计数器为主标记清除和分代回收为辅 + 缓存机制 1.1 大管家refcha ...
- JavaScirpt 的垃圾(garbage collection)回收机制
一.垃圾回收机制—GC Javascript具有自动垃圾回收机制(GC:Garbage Collecation),也就是说,执行环境会负责管理代码执行过程中使用的内存. 原理:垃圾收集器会定期(周期性 ...
- Python内存管理:垃圾回收
http://blog.csdn.net/pipisorry/article/details/39647931 Python GC主要使用引用计数(reference counting)来跟踪和回收垃 ...
- Python中深浅拷贝 垃圾回收与 super继承(六)
1 python拷贝 深拷贝,浅拷贝 与引用三者的区别 import copy a = [1, 2, 3, 4, ['a', 'b']] #原始对象 b = a #赋值,传对象的引用 c = copy ...
- python内存管理及垃圾回收
一.python的内存管理 python内部将所有类型分成两种,一种由单个元素组成,一种由多个元素组成.利用不同结构体进行区分 /* Nothing is actually declared to b ...
- python之MRO和垃圾回收机制
一.MOR 1.C3算法简介 为了解决原来基于深度优先搜索算法不满足本地优先级,和单调性的问题. python2.3版本之后不管是新式类还是经典类,查找继承顺序都采用C3算法 2.算法原理 C3算法的 ...
随机推荐
- Mac里安装配置Jdk
#下载jdk7的mac版 #官网下载地址http://www.oracle.com/technetwork/java/javase/downloads/jdk7-downloads-1880260.h ...
- linux下Tab及shell 补全python
Python自动补全 Python自动补全有vim编辑下和python交互模式下,下面分别介绍如何在这2种情况下实现Tab键自动补全. vim python自动补全插件:pydiction 可以实现下 ...
- 初试valgrind内存调试工具
虽然GDB调试工具功能强大,但对于平时做题调试的使用并不方便,这里尝试学习使用比较简单的valgrind工具 Valgrind是一个提供程序调试及性能分析的工具集.其包含的工具主要有Memcheck, ...
- Windows Socket的UDP和TCP编程介绍
1:网络中进程之间如何通信 为了实现进程之间通信,首要解决的问题是如何唯一标识一个进程,在本地可以通过进程PID来唯一标识一个进程,但是在网络中则是行不通的,其实TCP/IP协议族已经帮我们解决了这个 ...
- 使用WSUS离线下载补丁并安装在非联网的windows系统中(以Windows Server 2008 r2为例)
首先我失去https://serverfault.com/questions/322938/finding-and-downloading-all-available-win2008-r2-and-w ...
- Node.js系列文章:如何进行代码调试
使用任何一门编程语言,都少不了代码调试这一功能.我们在使用JavaScript编写浏览器端代码时,Chrome提供了强大的调试工具Dev Tools,但是在编写Node.js代码时,大多数人最开始都使 ...
- [LeetCode] Pour Water 倒水
We are given an elevation map, heights[i] representing the height of the terrain at that index. The ...
- 处处留心皆学问——由“display:inline-block;”导致的间距引发的思考。
昨天在做一个demo时遇到了一个问题:我有五个li需要并排排列,然后自然而然的我给它们设了display:inline-block;但是,过了很久之后发现,除了我写的样式外,它默认有一个间距,我们都不 ...
- [USACO 12DEC]Running Away From the Barn
Description It's milking time at Farmer John's farm, but the cows have all run away! Farmer John nee ...
- bzoj 3679: 数字之积
Description 一个数x各个数位上的数之积记为\(f(x)\) 求[L,R)中满足\(0<f(x)<=n\)的数的个数 solution 最后\(f(x)\)可以拆分成2,3,5, ...