深入理解 python 虚拟机:花里胡哨的魔术方法

在本篇文章当中主要给大家介绍在 cpython 当中一些比较花里胡哨的魔术方法,以帮助我们自己实现比较花哨的功能,当然这其中也包含一些也非常实用的魔术方法。

深入分析 hash 方法

在 Python 中,__hash__() 方法是一种特殊方法(也称为魔术方法或双下划线方法),用于返回对象的哈希值。哈希值是一个整数,用于在字典(dict)和集合(set)等数据结构中进行快速查找和比较。__hash__() 方法在创建自定义的可哈希对象时非常有用,例如自定义类的实例,以便可以将这些对象用作字典的键或集合的元素。

下面是一些需要注意的问题和示例来帮助理解 __hash__() 方法:

  • 如果两个对象相等(根据 __eq__() 方法的定义),它们的哈希值应该相等。即,如果 a == b 为真,则 hash(a) == hash(b) 也为真,这一点非常重要,因为我们在使用集合和字典的时候,就需要保证容器当中每种对象只能够有一个,如果不满足这个条还的话,那么就可能会导致同一种对象在容器当中会存在多个。
  • 重写 __hash__() 方法通常需要同时重写 __eq__() 方法,以确保对象的相等性和哈希值的一致性。
  • 如果对象没有定义 __eq__方法,那么也不要定义 __hash__方法,因为如果遇到哈希值相等的对象时候,如果无法对两个对象进行比较的话,那么也会导致容易当中有多个相同的对象。
import random

class Person:
def __init__(self, name, age):
self.name = name
self.age = age def __eq__(self, other):
return self.name == other.name and self.age == other.age def __hash__(self):
return hash((self.name, self.age)) + random.randint(0, 1024) def __repr__(self):
return f"[name={self.name}, age={self.age}]" person1 = Person("Alice", 25)
person2 = Person("Alice", 25) print(hash(person1))
print(hash(person2)) container = set()
container.add(person1)
container.add(person2)
print(container)

在上面代码当中我们重写了 __hash__ 函数,但是对象的哈希值每次调用的时候我们都加入一个随机数,因此即使 name 和 age 都相等,如果 hash 值不想等,那么可能会造成容器当中存在多个相同的对象,上面的代码就会造成相同的对象,上面的程序输出结果如下所示:

1930083569156318318
1930083569156318292
{[name=Alice, age=25], [name=Alice, age=25]}

如果重写上面的类对象:

class Person:
def __init__(self, name, age):
self.name = name
self.age = age def __eq__(self, other):
return self.name == other.name and self.age == other.age def __hash__(self):
return hash((self.name, self.age)) def __repr__(self):
return f"[name={self.name}, age={self.age}]"

那么容器器当中只会有一个对象。

如果我们只重写了 __hash__方法的时候也会造成容器当中有多个相同的对象。

class Person:
def __init__(self, name, age):
self.name = name
self.age = age # def __eq__(self, other):
# return self.name == other.name and self.age == other.age def __hash__(self):
return hash((self.name, self.age)) # + random.randint(0, 1024) def __repr__(self):
return f"[name={self.name}, age={self.age}]"

这是因为如果哈希值相同的时候还需要在比较两个对象是否相等,如果相等那么就不需要将这个对象保存到容器当中,如果不相等那么将会将这个对象加入到容器当中。

bool 方法

在 Python 中,object.__bool__() 方法是一种特殊方法,用于定义对象的布尔值。它在使用布尔运算符(如 if 语句和逻辑运算)时自动调用。__bool__() 方法应该返回一个布尔值,表示对象的真值。如果 __bool__() 方法未定义,Python 将尝试调用 __len__() 方法来确定对象的真值。如果 __len__() 方法返回零,则对象被视为假;否则,对象被视为真。

下面是一些需要注意的事项来帮助理解 __bool__() 方法:

  • __bool__() 方法在对象被应用布尔运算时自动调用。例如,在 if 语句中,对象的真值由 __bool__() 方法确定。
  • __bool__() 方法应该返回一个布尔值(TrueFalse)。
  • 如果 __bool__() 方法未定义,Python 将尝试调用 __len__() 方法来确定对象的真值。
  • 当对象的长度为零时,即 __len__() 方法返回零,对象被视为假;否则,对象被视为真。
  • 如果既未定义 __bool__() 方法,也未定义 __len__() 方法,则对象默认为真。

下面是一个示例,展示了如何在自定义类中使用 __bool__() 方法:

class NonEmptyList:
def __init__(self, items):
self.items = items def __bool__(self):
return len(self.items) > 0 my_list = NonEmptyList([1, 2, 3]) if my_list:
print("The list is not empty.")
else:
print("The list is empty.")

对象的属性访问

在Python中,我们可以通过一些特殊方法来定制属性访问的行为。本文将深入介绍这些特殊方法,包括__getitem__()__setitem__()__delitem__()__getattr__()方法,以帮助更好地理解属性访问的机制和应用场景。

__getitem__()方法是用于索引操作的特殊方法。当我们通过索引访问对象的属性时,Python会自动调用该方法,并传入索引值作为参数。我们可以在该方法中实现对属性的获取操作,并返回相应的值。

class MyList:
def __init__(self):
self.data = [] def __getitem__(self, index):
return self.data[index] my_list = MyList()
my_list.data = [1, 2, 3] print(my_list[1]) # 输出: 2

在上面的例子中,我们定义了一个名为MyList的类,它具有一个属性data,该属性是一个列表。通过重写__getitem__()方法,我们使得可以通过索引来访问MyList对象的data属性。当我们使用my_list[1]的形式进行索引操作时,Python会自动调用__getitem__()方法,并将索引值1作为参数传递给该方法。

__setitem__()方法用于属性的设置操作,即通过索引为对象的属性赋值。当我们使用索引操作并赋值给对象的属性时,Python会自动调用__setitem__()方法,并传入索引值和赋值的值作为参数。

class MyList:
def __init__(self):
self.data = [0 for i in range(2)] def __setitem__(self, index, value):
self.data[index] = value my_list = MyList() my_list[0] = 1
my_list[1] = 2 print(my_list.data) # 输出: [1, 2]

在上述示例中,我们重写了__setitem__()方法来实现对对象属性的设置操作。当我们执行my_list[0] = 1和my_list[1] = 2的赋值操作时,Python会自动调用__setitem__()方法,并将索引值和赋值的值传递给该方法。在__setitem__()方法中,我们将值赋给了对象的data属性的相应索引位置。

__delitem__()方法用于删除对象属性的特殊方法。当我们使用del语句删除对象属性时,Python会自动调用__delitem__()方法,并传入要删除的属性的索引值作为参数。

class MyDict:

    def __init__(self):
self.data = dict() def __delitem__(self, key):
print("In __delitem__")
del self.data[key] obj = MyDict()
obj.data["key"] = "val"
del obj["key"] # 输出 In __delitem__

__getattr__() 是一个特殊方法,用于在访问不存在的属性时自动调用。它接收一个参数,即属性名,然后返回相应的值或引发 AttributeError 异常。

class MyClass:
def __getattr__(self, name):
if name == 'color':
return 'blue'
else:
raise AttributeError(f"'MyClass' object has no attribute '{name}'") my_obj = MyClass()
print(my_obj.color) # 输出: blue
print(my_obj.size) # 引发 AttributeError: 'MyClass' object has no attribute 'size'

在上面的示例中,当访问 my_obj.color 时,由于 color 属性不存在,Python 会自动调用 __getattr__() 方法,并返回预定义的值 'blue'。而当访问 my_obj.size 时,由于该属性也不存在,__getattr__() 方法会引发 AttributeError 异常。

__setattr__() 是一个特殊方法,用于在设置属性值时自动调用。它接收两个参数,即属性名和属性值。我们可以在该方法中对属性进行处理、验证或记录。

class MyClass:
def __init__(self):
self.color = 'red' # 输出:Setting attribute 'color' to 'red' def __setattr__(self, name, value):
print(f"Setting attribute '{name}' to '{value}'")
super().__setattr__(name, value) my_obj = MyClass()
my_obj.color = 'blue' # 输出: Setting attribute 'color' to 'blue'

当我们使用 . 的方式去访问对象属性的时候,首先会调用对象的 __getattribute__ 函数,如果属性不存在才会调用 __getattr__。当 __getattribute__ 方法无法找到指定的属性时,Python 会调用 __getattr__ 方法。以下是在之前的示例类 CustomClass 上添加 __getattr__ 方法的代码:

class CustomClass:
def __init__(self):
self.attribute = "Hello, world!" def __getattribute__(self, name):
print(f"Accessing attribute: {name}")
return super().__getattribute__(name) def __getattr__(self, name):
print(f"Attribute {name} not found")
return None

在这个示例中,我们在 CustomClass 中添加了 __getattr__ 方法。当 __getattribute__ 方法无法找到指定的属性时,会自动调用 __getattr__ 方法,并打印出属性名称 "attribute" 以及未找到属性的提示信息。

我们执行下面的代码:

obj = CustomClass()
print(obj.attribute)
print(obj.nonexistent_attribute)

输出结果如下所示:

Accessing attribute: attribute
Hello, world!
Accessing attribute: nonexistent_attribute
Attribute nonexistent_attribute not found
None

首先,我们访问存在的属性 attribute,此时 __getattribute__ 方法被调用,并打印出属性名称 "attribute",然后返回属性的实际值 "Hello, world!"。接着,我们尝试访问不存在的属性 nonexistent_attribute,由于 __getattribute__ 方法无法找到该属性,因此会调用 __getattr__ 方法,并打印出属性名称 "nonexistent_attribute" 以及未找到属性的提示信息,然后返回 None

上下文管理器

当我们需要在特定的代码块执行前后进行一些操作时,上下文管理器是一种非常有用的工具。上下文管理器可以确保资源的正确分配和释放,无论代码块是否出现异常。在Python中,我们可以通过实现 __enter____exit__ 方法来创建自定义的上下文管理器。

下面是一个简单的上下文管理器示例,展示了如何使用 object.__enter__object.__exit__ 方法来创建一个文件操作的上下文管理器:

class FileContextManager:
def __init__(self, filename, mode):
self.filename = filename
self.mode = mode
self.file = None def __enter__(self):
self.file = open(self.filename, self.mode)
return self.file def __exit__(self, exc_type, exc_value, traceback):
self.file.close() with FileContextManager('example.txt', 'w') as file:
file.write('Hello, world!')

在上述示例中,FileContextManager 类实现了 __enter____exit__ 方法。在 __enter__ 方法中,我们打开文件并返回文件对象,这样在 with 语句块中就可以使用该文件对象。在 __exit__ 方法中,我们关闭文件。

无论代码块是否抛出异常,__exit__ 方法都会被调用来确保文件被正确关闭。这样可以避免资源泄露和文件锁定等问题。使用上下文管理器可以简化代码,并提供一致的资源管理方式,特别适用于需要打开和关闭资源的情况,如文件操作、数据库连接等。

上述上下文管理器的 __exit__ 方法有三个参数:exc_typeexc_valuetraceback。下面是对这些参数的详细介绍:

  • exc_type(异常类型):这个参数表示引发的异常的类型。如果在上下文管理器的代码块中没有引发异常,它的值将为 None。如果有异常被引发,exc_type 将是引发异常的类型。

  • exc_value(异常值):这个参数表示引发的异常的实例。它包含了关于异常的详细信息,如错误消息。如果没有异常被引发,它的值也将为 None

  • traceback(回溯信息):这个参数是一个回溯对象,它包含了关于异常的堆栈跟踪信息。它提供了导致异常的代码路径和调用关系。如果没有异常被引发,它的值将为 None

总结

在本篇文章当中主要给大家介绍了一些常用和比较重要的魔术方法,这些方法在我们平时用的可能也比较多,比如 hash 和 eq 还有对象的属性访问,为了方便异常处理可以使用 exit 和 enter 这个方法,其实还有很多其他的魔术方法,这些方法在 python 官网都有介绍,可以直接访问 https://docs.python.org/3/reference/datamodel.html


本篇文章是深入理解 python 虚拟机系列文章之一,文章地址:https://github.com/Chang-LeHung/dive-into-cpython

更多精彩内容合集可访问项目:https://github.com/Chang-LeHung/CSCore

关注公众号:一无是处的研究僧,了解更多计算机(Java、Python、计算机系统基础、算法与数据结构)知识。

深入理解 python 虚拟机:花里胡哨的魔术方法的更多相关文章

  1. 深入理解 Python 虚拟机:元组(tuple)的实现原理及源码剖析

    深入理解 Python 虚拟机:元组(tuple)的实现原理及源码剖析 在本篇文章当中主要给大家介绍 cpython 虚拟机当中针对列表的实现,在 Python 中,tuple 是一种非常常用的数据类 ...

  2. 深入理解 Python 虚拟机:浮点数(float)的实现原理及源码剖析

    深入理解 Python 虚拟机:浮点数(float)的实现原理及源码剖析 在本篇文章当中主要分析在 cpython 虚拟机当中 float 类型的实现原理以及与他相关的一些源代码. Float 数据结 ...

  3. 深入理解 Python 虚拟机:整型(int)的实现原理及源码剖析

    深入理解 Python 虚拟机:整型(int)的实现原理及源码剖析 在本篇文章当中主要给大家介绍在 cpython 内部是如何实现整型数据 int 的,主要是分析 int 类型的表示方式,分析 int ...

  4. 深入理解 Python 虚拟机:复数(complex)的实现原理及源码剖析

    深入理解 Python 虚拟机:复数(complex)的实现原理及源码剖析 在本篇文章当中主要给大家介绍在 cpython 虚拟机当中是如何实现 复数 complex 这个数据类型的,这个数据类型在 ...

  5. 深入理解 Python 虚拟机:集合(set)的实现原理及源码剖析

    深入理解 Python 虚拟机:集合(set)的实现原理及源码剖析 在本篇文章当中主要给大家介绍在 cpython 虚拟机当中的集合 set 的实现原理(哈希表)以及对应的源代码分析. 数据结构介绍 ...

  6. 深入理解 Python 虚拟机:字典(dict)的实现原理及源码剖析

    深入理解 Python 虚拟机:字典(dict)的实现原理及源码剖析 在本篇文章当中主要给大家深入介绍一下在 cpython 当中字典的实现原理,在本篇文章当中主要介绍在早期 python3 当中的版 ...

  7. 深入理解 Python 虚拟机:字典(dict)的优化

    深入理解 Python 虚拟机:字典(dict)的优化 在前面的文章当中我们讨论的是 python3 当中早期的内嵌数据结构字典的实现,在本篇文章当中主要介绍在后续对于字典的内存优化. 字典优化 在前 ...

  8. 深入理解 python 虚拟机:pyc 文件结构

    深入理解 python 虚拟机:pyc 文件结构 在本篇文章当中主要给大家介绍一下 .py 文件在被编译之后对应的 pyc 文件结构,pyc 文件当中的一个核心内容就是 python 字节码. pyc ...

  9. 深入理解 python 虚拟机:字节码教程(3)——深入剖析循环实现原理

    深入理解 python 虚拟机:字节码教程(3)--深入剖析循环实现原理 在本篇文章当中主要给大家介绍 cpython 当中跟循环相关的字节码,这部分字节码相比起其他字节码来说相对复杂一点,通过分析这 ...

  10. 深入理解python虚拟机:程序执行的载体——栈帧

    深入理解python虚拟机:程序执行的载体--栈帧 栈帧(Stack Frame)是 Python 虚拟机中程序执行的载体之一,也是 Python 中的一种执行上下文.每当 Python 执行一个函数 ...

随机推荐

  1. 【新版】使用 go-cqhttp 扫码登录,一键接入 ChatGPT 机器人到 QQ 群

    目录 项目效果 安装 go-cqhttp 虚拟文件 启动 ChatGPT 项目效果 由于 ChatGPT 目前只能在漂亮国使用,所以想要在国内使用 ChatGPT 必然险阻重重 不仅时时刻刻要跟企鹅公 ...

  2. JavaWeb相关学习环境的配置(一)

    JavaWeb相关学习环境的配置(一) 之 JDK的配置 步骤: 1.去官网找到自己想要下载的版本: 官网地址:https://www.oracle.com/java/technologies/dow ...

  3. 从0搭建Vue3组件库(七):使用 glup 打包组件库并实现按需加载

    使用 glup 打包组件库并实现按需加载 当我们使用 Vite 库模式打包的时候,vite 会将样式文件全部打包到同一个文件中,这样的话我们每次都要全量引入所有样式文件做不到按需引入的效果.所以打包的 ...

  4. SaaS、PaaS、IaaS区别

    SaaS SaaS 越久,觉得它个庞大的领域 SaaS 收入的"长江流域". 传统软件像买房:什么都得自己买,价格昂贵,一般人用不起.SaaS模式就像是租赁预先装修好的共享公寓,拎 ...

  5. 快速部署Ceph分布式高可用集群

    快速部署Ceph分布式高可用集群 Ceph简介 Ceph是一个PB,EB级别的分布式存储系统,可以提供文件存储,对象存储.和块存储,它可靠性高,易扩展,管理简便,其中对象存储和块存储可以和其他云平台集 ...

  6. Centos9网卡配置

    Centos9 网卡配置文件已修改,如下 [root@bogon ~]# cat /etc/NetworkManager/system-connections/ens18.nmconnection [ ...

  7. C++ 标准库 sort() / stable_sort() / partial_sort() 对比

    C++ STL标准库中提供了多个用于排序的Sort函数,常用的包括有sort() / stable_sort() / partial_sort(),具体的函数用法如下表所示: 函数 用法 std::s ...

  8. Kubernetes客户端认证——基于CA证书的双向认证方式

    1.Kubernetes 认证方式 Kubernetes集群的访问权限控制由API Server负责,API Server的访问权限控制由身份验证(Authentication).授权(Authori ...

  9. 在英特尔 CPU 上加速 Stable Diffusion 推理

    前一段时间,我们向大家介绍了最新一代的 英特尔至强 CPU (代号 Sapphire Rapids),包括其用于加速深度学习的新硬件特性,以及如何使用它们来加速自然语言 transformer 模型的 ...

  10. [apue] 一图读懂 Unix 时间日期例程相互关系

    概览 开门见山先上图 界定一些术语,方便后面说明: GMT:格林威治平均时,太阳每天经过位于英国伦敦郊区的皇家格林威治天文台的时间为中午 12 点,1972 年之前使用的国际标准时间,因地球在它的椭圆 ...