Python大神必须掌握的技能:多继承、super和MRO算法
本文主要以Python3.x为例讲解Python多继承、super以及MRO算法。
1. Python中的继承
任何面向对象编程语言都会支持继承,Python也不例外。但Python语言却是少数几个支持多继承的面向对象编程语言(另一个著名的支持多继承的编程语言是C++)。本文将深入阐述Python多继承中经常用到的super,并且会展示一个你所不知道的super。
相信继承的概念大家一定不会陌生。当类B从类A继承后,B类就会继承A类的所有非私有成员(由于Python没有私有成员的概念,所以B类就会继承A类的所有成员)。但有时需要在B类中直接访问A类的成员,也就是子类需要调用父类的成员,在这种情况下,有如下两种方法可以解决:
1. 在子类中直接通过父类名访问父类中的成员
2. 在子类中通过super访问父类中的成员
现在先说第一种方法。
inhert.py
- class A:
- def __init__(self):
- print('Start A')
- print('End A')
- def greet(self, name):
- return f'hello {name}'
- class B(A):
- def __init__(self):
- print('Start B')
- # 直接通过父类名调用父类的构造方法
- A.__init__(self)
- # 调用父类的greet方法
- print(A.greet(self,'Bill'))
- # 调用当前类的greet方法
- print(self.greet('Bill'))
- print('End B')
- # 覆盖父类的greet方法
- def greet(self,name):
- return f'你好 {name}'
- B() # 创建B类的实例
这段代码的运行结果如图1所示。
图1
在B类中,通过A. __init__(self)和A.greet(self,'Bill')调用了父类(A类)的成员。在Python2.2之前,Python类只支持这种访问父类成员的方式。尽管这种方式非常直接,但缺点是如果父类名改变,这就意味着所有使用父类名的子类都需要改变,如果某个类的子类非常多,就可能会增加非常多的代码维护工作量。所以从Python2.2开始,又增加了一种新的访问父类的方式,这就是本文主要介绍的super。当然,旧的方式也同样支持。
2.引入super
为了尽可能避免在子类中直接使用父类的名字,从Python2.2开始支持super。super并不是一个函数或方法,而是一个类。super类的构造方法需要两个参数:type和instance。其中type就是类型,例如,A、B等,instance就是B类或其子类的实例。至于为什么要传递这个实例。后面会详细介绍,总之,该实例与本文的另外一个重点MRO算法有关。
先看下面的代码:
super1.py
- class A:
- def __init__(self):
- print('Start A')
- print('End A')
- def greet(self, name):
- return f'hello {name}'
- class B(A):
- def __init__(self):
- print('Start B')
- # 通过super调用父类的构造方法
- super(B, self).__init__()
- # 通过super调用父类的成员方法
- print(super(B, self).greet('Bill'))
- print(self.greet('Bill'))
- print('End B')
- def greet(self,name):
- return f'你好 {name}'
- B()
执行这段代码,会输出与图1完全相同的效果。在B类中并没有直接使用A类的名字,而是使用了super。如果A类的名字变化了,只需要修改B类的父类即可,并不需要修改B类内部的代码,这样将大大减少维护B类的工作量。
可能有的同学会问,super的第2个参数的值为什么是self呢?我们都知道,在Python中,self表示类本身的实例,那么为什么不是B()或是A()呢?首先这个实例要求必须是B或B的子类的实例,所以A()以及其他不相关类的实例自然就排除在外,那么B()为什么不行呢?其实从语义上来说,B()没问题,但问题是这样将产生无限递归的后果。也就是在B类的构造方法又调用了B的构造方法(B()表示调用B类的构造方法),而且没有终止条件。所以这么做的后果就是栈溢出。
尽管不能在B类构造方法内部直接创建B类的实例,但却可以在外部创建好B类的实例或B类子类的实例,然后通过B类构造方法将该实例传入,看下面的代码。
super2.py
- class A:
- def __init__(self):
- print('Start A')
- print('End A')
- class B(A):
- def __init__(self,c):
- print('Start B')
- # 将外部创建的C类的实例传入super类的构造方法
- super(B, c).__init__()
- print('End B')
- class C(B):
- def __init__(self, c):
- super(C,self).__init__(c)
- c = C(None)
- b = B(None)
- B(b)
- B(c)
这段代码在创建B实例之前,先创建了一个C类的实例以及一个传入None的B实例。而在B类的构造方法中多了一个参数,用于传入这个外部实例,并将这个外部实例作为super类构造方法的第2个参数传入。由于在创建C类和B类实例时传入了None,所以super类构造方法的第2个参数值也是None。这样回就会导致super(B,c)无法调用父类(A类)的构造方法,这就相当于一个空操作(什么都不会做),至于为什么会这样,后面讲MRO算法时就会一清二楚。
3. 多继承,找到亲爹好难啊
其实如果Python不支持多继承,一切都好说,一切都好理解。但问题是,Python支持多继承,这就使得继承的问题变得扑朔迷离,尤其是对初学者,更是一头雾水。对于多继承来说,一个重要的问题就是:在多个父类拥有同名成员的情况下,在子类中访问该成员,到底是调用哪一个父类的成员呢? 毫无疑问,只有一个父类会为子类提供这个成员,也就是子类的亲爹。至于其他拥有同名成员的父类,与该子类毫无关系,尽管名义上都拥有该成员。
现在用一个最简单的多继承程序来说明问题:
super3.py
- class X1:
- def __init__(self):
- print('Start X1')
- print('End X1')
- class X2:
- def __init__(self,c):
- print('Start X2')
- print('End X2')
- class A(X1,X2):
- def __init__(self):
- print('Start A')
- super(A,self).__init__()
- print('End A')
- A()
在这段代码中,X1和X2都是A的父类,而在A类的构造方法中使用super(A,self).__init__()调用了父类的构造方法。任何Python类的构造方法可能都是同名的,都是__init__。如果A类只有一个父类,一切都好说。但如果A类有2个或2个以上的父类,那么到底调用哪一个父类的构造方法呢?
读者可以先运行这段代码,会看到输出如下的内容:
Start A
Start X1
End X1
End A
很明显,A调用了X1的构造方法。读者可以再做一个实验,将X1和X2的顺序调换一下,变成A(X2,X1),这时会输出如下的内容:
Start A
Start X2
End X2
End A
很明显,这时A调用了X2的构造方法。从观察运行结果可以找出一点规律,就是使用super(A,self),会调用A类的父类列表中第1个父类的成员(本例是X1)。那么结果真是这样吗?
下面再看一个更复杂的多继承案例:
super4.py
- class X1:
- def __init__(self):
- print('Start X1')
- print('End X1')
- class X2:
- def __init__(self):
- print('Start X2')
- print('End X2')
- class A(X1,X2):
- def __init__(self):
- print('Start A')
- super(A,self).__init__()
- print('End A')
- class B:
- def __init__(self):
- print('Start B')
- print('End B')
- class C:
- def __init__(self):
- print('Start C')
- print('End C')
- class D:
- def __init__(self):
- print('Start D')
- print('End D')
- class MyClass1(B,A,C):
- def __init__(self):
- print('Start MyClass1')
- super(MyClass1,self).__init__()
- print('End MyClass1')
- class MyClass2(MyClass1,D):
- def __init__(self):
- print('Start MyClass2')
- super(MyClass2,self).__init__()
- print('End MyClass2')
- MyClass2()
这段代码的继承关系比较复杂,可以用图2来表示。
图2
运行这段代码,会输出如下内容:
Start MyClass2
Start MyClass1
Start B
End B
End MyClass1
End MyClass2
从输出结果也可以再次验证前面的推论,也就是super会调用父类列表中第一个父类的成员。如MyClass1是MyClass2的第1个父类,所以MyClass2类会调用MyClass1类的构造方法,而B类是MyClass1类的第一个父类,所以MyClass1类会调用B类的构造方法。
但这里有一个问题,如果在MyClass2类中想调用D类的构造方法,在MyClass1类中想调用A类的构造方法,该怎么办呢?当然,可以直接使用父类名进行调用,那么使用super应该如何调用。
其实Python编译器在解析类时,会将当前类的所有父类(包括直接和间接父类)按一定的规则进行排序,然后会根据super类构造方法的第一个参数的值决定使用哪一个父类。那么这个顺序是怎样的呢?
现在先不用管这个顺序,先将图2的继承关系图倒过来,变成图3的多叉树。
图3
现在按深度优先遍历这颗多叉树,得到的遍历结果如下:
MyClass2 > MyClass1 > B > A > X1 > X2 > C > D
假设在MyClass2中要调用B类的构造方法,那么可以使用下面的代码。
super(MyClass1, self).__init__()
假设在MyClass2中要调用X2类的构造方法,那么可以使用下面的代码。
super(X1, self).__init__()
从这个规律可以看出,选择父类的规则是super类构造方法的第1个参数值在前面深度优先遍历序列中对应类的下一个类。例如,super(X1,self)就会去寻找X1的下一个类,也就是X2。如果super类构造方法的第1个参数值正好是深度优先遍历序列的最后一个类,本例是D,那么super将不会选择MyClass2的任何父类,也就是super什么都不会做(相当于一条空语句)。到现在为止,我们好像已经清楚了前面提到的一些疑问的答案。例如,super类构造方法的第1个参数值其实是对继承树深度优先遍历列表搜索的key,而第2个参数值其实是用来得到这个列表的。但真相真的是这样吗?
4. MRO算法
好像通过多叉树的深度优先遍历就可以解决父类的顺序问题,但很多时候,类的继承关系并不是传统的树,例如下面这段代码的继承关系就是一个菱形。
super5.py
- class Base:
- def __init__(self):
- print('Start Base')
- print('End Base')
- class A(Base):
- def __init__(self):
- print('Start A')
- super(A,self).__init__()
- print('End A')
- class B(Base):
- def __init__(self):
- print('Start B')
- super(B, self).__init__()
- print('End B')
- class C(A,B):
- def __init__(self):
- print('Start C')
- super(C, self).__init__()
- print('End C')
- C()
运行结果如下:
Start C
Start A
Start B
Start Base
End Base
End B
End A
End C
这段代码的继承关系如图4所示。
图4
你就算把图倒过来,样子仍然不会变,如图5所示。
图5
这压根不是一颗多叉树,有点像一个图。对于图6所示的继承关系,是无法用深度优先遍历得到父类的顺序的,所以为了弥补深度优先遍历的缺陷,有人提出了MRO算法,MRO是Method Resolution Order三个单词的缩写。
那么什么是MRO算法呢?
MRO算法:
MRO算法是一个典型的递归操作,现在假设有如下两个函数:
1. mro:用于得到指定类的父类MRO列表。接收一个type参数,表示指定的类,如mro(C)
2. merge:用于合并多个父类列表,合并的规则如下:
如果一个父类列表的第一个元素,在其他父类列表中也是第一个元素,或不在其他父类列表中出现,则从所有待合并父类列表中删除这个元素(不存在的不需要删除),合并到当前的mro父类列表中。 现在拿前面的菱形继承关系为例说明如何得到MRO序列。这个序列的第一个元素就是C。有如下公式:
mro(C) = [C] + merge(mro(A), mro(B) ,[A,B])
其中merge函数有3个参数,分别是mro(A)、mro(B)和[A,B],也就是要将A和B的序列和[A,B]合并。根据前面的规则,有如下推导过程
mro(C) = [C] + merge(mro(A), mro(B) ,[A,B])
= [C] + merge([A,Base],[B,Base] ,[A,B])
= [C,A] + merge([Base],[B,Base],[B])
= [C,A,B] + merge([Base],[Base])
= [C,A,B,Base]
所以最终C类对应的mro序列为[C,A,B,Base],读者可以运行前面的代码,会得到如下的结果:
Start C
Start A
Start B
Start Base
End Base
End B
End A
End C
这也就是为什么会依次调用A、B和Base类构造方法的原因,因为MRO序列就是按这个顺序排列的。如果想调用B类的构造方法,需要使用super(A,self).__init()__,系统会在MRO序列中搜索A,然后会调用A的下一个类(也就是B)的构造方法。对于更复杂的继承关系,使用MRO算法自己计算MRO序列非常麻烦,所以可以使用mro方法直接输出MRO序列,代码如下:
print(C.mro())
执行这行代码,会输出如下内容:
[<class '__main__.C'>, <class '__main__.A'>, <class '__main__.B'>, <class '__main__.Base'>, <class 'object'>]
下载本文完整源代码,请关注“极客起源”公众号,并输入获得下载地址。更多精彩技术文章,请关注“极客起源”公众号
Python大神必须掌握的技能:多继承、super和MRO算法的更多相关文章
- python小兵 面向对象继承super和c3算法
python多继承 在前面的学习过程中. 我们已经知道了Python中类与类之间可以有继承关系. 当出现了x是一种y的的时候. 就可以使⽤继承关系. 即"is-a" 关系. 在继承 ...
- 如何自学成 Python 大神?这里有些建议
人生苦短,我用 Python.为什么?简单明了的理由当然是开发效率高.但是学习 Python 的初学者往往会面临以下残酷的现状:网上充斥着大量的学习资源.书籍.视频教程和博客,但是大部分都是讲解基础知 ...
- Python学习宝典,Python400集让你成为从零基础到手写神经网络的Python大神
当您学完Python,你学到了什么? 开发网站! 或者, 基础语法要点.函数.面向对象编程.调试.IO编程.进程与线程.正则表达式... 当你学完Python,你可以干什么? 当程序员! 或者, 手写 ...
- 国内某Python大神自创完整版,系统性学习Python
很多小伙伴纠结于这个一百天的时间,我觉得完全没有必要,也违背了我最初放这个大纲上来的初衷,我是觉得这个学习大纲还不错,自学按照这个来也能相对系统的学习知识,而不是零散细碎的知识最后无法整合,每个人的基 ...
- Python大神成长之路: 第一次学习记录
一.Python发展史 二.Python2 or 3 博主选择了Python3. 从官网下载Python www.python.org Windows安装python3.5.python2.7.安装 ...
- Python大神成长之路: 第三次学习记录 集合 函数 装饰 re
学习记录day03 字符串可以直接切片,But字符串不可修改 字符串修改:生成了一个新的字符串 LIst修改,在原基础上修改(原内存上) 集合是一个无序的,不重复的数据组合,它的主要作用如 ...
- Python大神编程常用4大工具,你用过几个?
摘要:Python是一种跨平台的编程语言,能够在所有主要的操作系统上,运行你编写的任何Python程序.今天介绍几款常见的工具:Python自带的解释器.文本编辑器(Geany.Sublime Tex ...
- Python大神成长之路: 第二次学习记录
数据类型 数据操作 bytes 类型 "".encode() 编码-->二进制 "".decode() 解码 判断字符串里的字符是否全为 ...
- 大神:python怎么爬取js的页面
大神:python怎么爬取js的页面 可以试试抓包看看它请求了哪些东西, 很多时候可以绕过网页直接请求后面的API 实在不行就上 selenium (selenium大法好) selenium和pha ...
随机推荐
- animate.html
<!DOCTYPE html> <html> <head> <meta charset="UTF-8"> <title> ...
- Okhttp 请求流程梳理
最近在看 Okhttp 的源码.不得不说源码设计的很巧妙,从中能学到很多.其实网上关于 Okhttp 的文章已经很多了,自己也看了很多.但是俗话说得好,好记性不如烂笔头,当你动手的时候,你会发现你在看 ...
- java中Arrays.sort()对二位数组进行排序
int [][]a = new int [5][2]; //定义一个二维数组,其中所包含的一维数组具有两个元素 对于一个已定义的二位数组a经行如下规则排序,首先按照每一个对应的一维数组第一个元素进行升 ...
- Jquery动态bind绑定已有函数,函数自动执行的问题解决方法
在bind后面的方法,不能带括号,带括号函数就自动执行了... <script> //通过子元素删除某行 function deleteRow() { var flag = confirm ...
- 一个开源组件 bug 引发的分析
这是一个悲伤的故事.某日清晨,距离版本转测还剩一天,切图仔的我正按照计划有条不紊的画页面.当我点击一个下拉弹框组件中分页组件页数过多而出现的向后 5 页省略号时,悲剧开始了,弹框被收回了.情景再现 问 ...
- Linux学习使用Vim
Vim是从 vi 发展出来的一个文本编辑器.vi编辑器是所有Unix及Linux系统下标准的编辑器,他就相当于windows系统中的记事本一样.代码补完.编译及错误跳转等方便编程的功能特别丰富,在程序 ...
- python的位置参数、关键字参数、收集参数,关键字收集参数混合调用问题
参数混合调用顺序用法: 函数中参数顺序为:普通参数,收集参数,关键字参数,关键字收集参数,其顺序不能颠倒,颠倒会报错. 普通参数.关键字参数可以有n个,对量没有具体要求,收集参数和关键字收集参数要么没 ...
- 《Effective Java》 读书笔记(七)消除过期的对象引用
大概看了一遍这个小节,其实这种感觉体验最多的应该是C/C++程序,有多杀少个new就得有多个delete. 一直以为Java就不会存在这个问题,看来是我太年轻. 感觉<Effective Jav ...
- 『题解』LibreOJ6277 数列分块入门 1
更好的阅读体验 Portal Portal1: LibreOJ Description 给出一个长为\(n\)的数列,以及\(n\)个操作,操作涉及区间加法,单点查值. Input 第一行输入一个数字 ...
- Go 基础学习笔记(6)| 变量、函数使用
Go 变量定义与使用: 1.var 声明 (1)var identifier type 如:var x int =10 (2) var id ...