Python大神必须掌握的技能：多继承、super和MRO算法

本文主要以Python3.x为例讲解Python多继承、super以及MRO算法。

1. Python中的继承

任何面向对象编程语言都会支持继承，Python也不例外。但Python语言却是少数几个支持多继承的面向对象编程语言（另一个著名的支持多继承的编程语言是C++）。本文将深入阐述Python多继承中经常用到的super，并且会展示一个你所不知道的super。

相信继承的概念大家一定不会陌生。当类B从类A继承后，B类就会继承A类的所有非私有成员（由于Python没有私有成员的概念，所以B类就会继承A类的所有成员）。但有时需要在B类中直接访问A类的成员，也就是子类需要调用父类的成员，在这种情况下，有如下两种方法可以解决：

1. 在子类中直接通过父类名访问父类中的成员

2. 在子类中通过super访问父类中的成员

现在先说第一种方法。

inhert.py

class A:

    def __init__(self):

        print('Start A')

        print('End A')

    def greet(self, name):

        return f'hello {name}'

class B(A):

    def __init__(self):

        print('Start B')

        # 直接通过父类名调用父类的构造方法

        A.__init__(self)

        # 调用父类的greet方法

        print(A.greet(self,'Bill'))

        # 调用当前类的greet方法

        print(self.greet('Bill'))

        print('End B')

    # 覆盖父类的greet方法

    def greet(self,name):

        return f'你好 {name}'

B()  # 创建B类的实例

这段代码的运行结果如图1所示。

图1

在B类中，通过A. __init__(self)和A.greet(self,'Bill')调用了父类（A类）的成员。在Python2.2之前，Python类只支持这种访问父类成员的方式。尽管这种方式非常直接，但缺点是如果父类名改变，这就意味着所有使用父类名的子类都需要改变，如果某个类的子类非常多，就可能会增加非常多的代码维护工作量。所以从Python2.2开始，又增加了一种新的访问父类的方式，这就是本文主要介绍的super。当然，旧的方式也同样支持。

2.引入super

为了尽可能避免在子类中直接使用父类的名字，从Python2.2开始支持super。super并不是一个函数或方法，而是一个类。super类的构造方法需要两个参数：type和instance。其中type就是类型，例如，A、B等，instance就是B类或其子类的实例。至于为什么要传递这个实例。后面会详细介绍，总之，该实例与本文的另外一个重点MRO算法有关。

先看下面的代码：

super1.py

class A:

    def __init__(self):

        print('Start A')

        print('End A')

    def greet(self, name):

        return f'hello {name}'

class B(A):

    def __init__(self):

        print('Start B')

        # 通过super调用父类的构造方法

        super(B, self).__init__()

        # 通过super调用父类的成员方法

        print(super(B, self).greet('Bill'))

        print(self.greet('Bill'))

        print('End B')

    def greet(self,name):

        return f'你好 {name}'

B()

执行这段代码，会输出与图1完全相同的效果。在B类中并没有直接使用A类的名字，而是使用了super。如果A类的名字变化了，只需要修改B类的父类即可，并不需要修改B类内部的代码，这样将大大减少维护B类的工作量。

可能有的同学会问，super的第2个参数的值为什么是self呢？我们都知道，在Python中，self表示类本身的实例，那么为什么不是B()或是A()呢？首先这个实例要求必须是B或B的子类的实例，所以A()以及其他不相关类的实例自然就排除在外，那么B()为什么不行呢？其实从语义上来说，B()没问题，但问题是这样将产生无限递归的后果。也就是在B类的构造方法又调用了B的构造方法（B()表示调用B类的构造方法），而且没有终止条件。所以这么做的后果就是栈溢出。

尽管不能在B类构造方法内部直接创建B类的实例，但却可以在外部创建好B类的实例或B类子类的实例，然后通过B类构造方法将该实例传入，看下面的代码。
super2.py

class A:

    def __init__(self):

        print('Start A')

        print('End A')

class B(A):

    def __init__(self,c):

        print('Start B')

        # 将外部创建的C类的实例传入super类的构造方法

        super(B, c).__init__()

        print('End B')

class C(B):

    def __init__(self, c):

        super(C,self).__init__(c)

c = C(None)

b = B(None)

B(b)

B(c)

这段代码在创建B实例之前，先创建了一个C类的实例以及一个传入None的B实例。而在B类的构造方法中多了一个参数，用于传入这个外部实例，并将这个外部实例作为super类构造方法的第2个参数传入。由于在创建C类和B类实例时传入了None，所以super类构造方法的第2个参数值也是None。这样回就会导致super(B,c)无法调用父类（A类）的构造方法，这就相当于一个空操作（什么都不会做），至于为什么会这样，后面讲MRO算法时就会一清二楚。

3. 多继承，找到亲爹好难啊

其实如果Python不支持多继承，一切都好说，一切都好理解。但问题是，Python支持多继承，这就使得继承的问题变得扑朔迷离，尤其是对初学者，更是一头雾水。对于多继承来说，一个重要的问题就是：在多个父类拥有同名成员的情况下，在子类中访问该成员，到底是调用哪一个父类的成员呢？毫无疑问，只有一个父类会为子类提供这个成员，也就是子类的亲爹。至于其他拥有同名成员的父类，与该子类毫无关系，尽管名义上都拥有该成员。

现在用一个最简单的多继承程序来说明问题：

super3.py

class X1:

    def __init__(self):

        print('Start X1')

        print('End X1')

class X2:

    def __init__(self,c):

        print('Start X2')

        print('End X2')

class A(X1,X2):

    def __init__(self):

        print('Start A')

        super(A,self).__init__()

        print('End A')

A()

在这段代码中，X1和X2都是A的父类，而在A类的构造方法中使用super(A,self).__init__()调用了父类的构造方法。任何Python类的构造方法可能都是同名的，都是__init__。如果A类只有一个父类，一切都好说。但如果A类有2个或2个以上的父类，那么到底调用哪一个父类的构造方法呢？
读者可以先运行这段代码，会看到输出如下的内容：

Start A
Start X1
End X1
End A

很明显，A调用了X1的构造方法。读者可以再做一个实验，将X1和X2的顺序调换一下，变成A(X2,X1)，这时会输出如下的内容：
Start A
Start X2
End X2
End A

很明显，这时A调用了X2的构造方法。从观察运行结果可以找出一点规律，就是使用super(A,self)，会调用A类的父类列表中第1个父类的成员（本例是X1）。那么结果真是这样吗？

下面再看一个更复杂的多继承案例：

super4.py

class X1:

    def __init__(self):

        print('Start X1')

        print('End X1')

class X2:

    def __init__(self):

        print('Start X2')

        print('End X2')

class A(X1,X2):

    def __init__(self):

        print('Start A')

        super(A,self).__init__()

        print('End A')

class B:

    def __init__(self):

        print('Start B')

        print('End B')

class C:

    def __init__(self):

        print('Start C')

        print('End C')

class D:

    def __init__(self):

        print('Start D')

        print('End D')

class MyClass1(B,A,C):

    def __init__(self):

        print('Start MyClass1')

        super(MyClass1,self).__init__()

        print('End MyClass1')

class MyClass2(MyClass1,D):

    def __init__(self):

        print('Start MyClass2')

        super(MyClass2,self).__init__()

        print('End MyClass2')

MyClass2()

这段代码的继承关系比较复杂，可以用图2来表示。

图2

运行这段代码，会输出如下内容：
Start MyClass2
Start MyClass1
Start B
End B
End MyClass1
End MyClass2

从输出结果也可以再次验证前面的推论，也就是super会调用父类列表中第一个父类的成员。如MyClass1是MyClass2的第1个父类，所以MyClass2类会调用MyClass1类的构造方法，而B类是MyClass1类的第一个父类，所以MyClass1类会调用B类的构造方法。

但这里有一个问题，如果在MyClass2类中想调用D类的构造方法，在MyClass1类中想调用A类的构造方法，该怎么办呢？当然，可以直接使用父类名进行调用，那么使用super应该如何调用。

其实Python编译器在解析类时，会将当前类的所有父类（包括直接和间接父类）按一定的规则进行排序，然后会根据super类构造方法的第一个参数的值决定使用哪一个父类。那么这个顺序是怎样的呢？

现在先不用管这个顺序，先将图2的继承关系图倒过来，变成图3的多叉树。

图3

现在按深度优先遍历这颗多叉树，得到的遍历结果如下：

MyClass2 > MyClass1 > B > A > X1 > X2 > C > D

假设在MyClass2中要调用B类的构造方法，那么可以使用下面的代码。

super(MyClass1, self).__init__()

假设在MyClass2中要调用X2类的构造方法，那么可以使用下面的代码。

super(X1, self).__init__()

从这个规律可以看出，选择父类的规则是super类构造方法的第1个参数值在前面深度优先遍历序列中对应类的下一个类。例如，super(X1,self)就会去寻找X1的下一个类，也就是X2。如果super类构造方法的第1个参数值正好是深度优先遍历序列的最后一个类，本例是D，那么super将不会选择MyClass2的任何父类，也就是super什么都不会做（相当于一条空语句）。到现在为止，我们好像已经清楚了前面提到的一些疑问的答案。例如，super类构造方法的第1个参数值其实是对继承树深度优先遍历列表搜索的key，而第2个参数值其实是用来得到这个列表的。但真相真的是这样吗？

4. MRO算法

好像通过多叉树的深度优先遍历就可以解决父类的顺序问题，但很多时候，类的继承关系并不是传统的树，例如下面这段代码的继承关系就是一个菱形。

super5.py

class Base:

    def __init__(self):

        print('Start Base')

        print('End Base')

class A(Base):

    def __init__(self):

        print('Start A')

        super(A,self).__init__()

        print('End A')

class B(Base):

    def __init__(self):

        print('Start B')

        super(B, self).__init__()

        print('End B')

class C(A,B):

    def __init__(self):

        print('Start C')

        super(C, self).__init__()

        print('End C')

C()

运行结果如下：

Start C

Start A

Start B

Start Base

End Base

End B

End A

End C

这段代码的继承关系如图4所示。

图4

你就算把图倒过来，样子仍然不会变，如图5所示。

图5

这压根不是一颗多叉树，有点像一个图。对于图6所示的继承关系，是无法用深度优先遍历得到父类的顺序的，所以为了弥补深度优先遍历的缺陷，有人提出了MRO算法，MRO是Method Resolution Order三个单词的缩写。

那么什么是MRO算法呢？

MRO算法：

MRO算法是一个典型的递归操作，现在假设有如下两个函数：

1. mro：用于得到指定类的父类MRO列表。接收一个type参数，表示指定的类，如mro(C)

2. merge：用于合并多个父类列表，合并的规则如下：

如果一个父类列表的第一个元素，在其他父类列表中也是第一个元素，或不在其他父类列表中出现，则从所有待合并父类列表中删除这个元素（不存在的不需要删除），合并到当前的mro父类列表中。现在拿前面的菱形继承关系为例说明如何得到MRO序列。这个序列的第一个元素就是C。有如下公式：

mro(C) = [C] + merge(mro(A), mro(B) ,[A,B])

其中merge函数有3个参数，分别是mro(A)、mro(B)和[A,B]，也就是要将A和B的序列和[A,B]合并。根据前面的规则，有如下推导过程

mro(C) = [C] + merge(mro(A), mro(B) ,[A,B])

= [C] + merge([A,Base],[B,Base] ,[A,B])

= [C,A] + merge([Base],[B,Base],[B])

= [C,A,B] + merge([Base],[Base])

= [C,A,B,Base]

所以最终C类对应的mro序列为[C,A,B,Base]，读者可以运行前面的代码，会得到如下的结果：

Start C

Start A

Start B

Start Base

End Base

End B

End A

End C

这也就是为什么会依次调用A、B和Base类构造方法的原因，因为MRO序列就是按这个顺序排列的。如果想调用B类的构造方法，需要使用super(A,self).__init()__，系统会在MRO序列中搜索A，然后会调用A的下一个类（也就是B）的构造方法。对于更复杂的继承关系，使用MRO算法自己计算MRO序列非常麻烦，所以可以使用mro方法直接输出MRO序列，代码如下：

print(C.mro())

执行这行代码，会输出如下内容：

[<class '__main__.C'>, <class '__main__.A'>, <class '__main__.B'>, <class '__main__.Base'>, <class 'object'>]

下载本文完整源代码，请关注“极客起源”公众号，并输入获得下载地址。更多精彩技术文章，请关注“极客起源”公众号

Python大神必须掌握的技能：多继承、super和MRO算法的更多相关文章

python小兵面向对象继承super和c3算法
python多继承在前面的学习过程中. 我们已经知道了Python中类与类之间可以有继承关系. 当出现了x是一种y的的时候. 就可以使⽤继承关系. 即"is-a" 关系. 在继承 ...
如何自学成 Python 大神？这里有些建议
人生苦短,我用 Python.为什么?简单明了的理由当然是开发效率高.但是学习 Python 的初学者往往会面临以下残酷的现状:网上充斥着大量的学习资源.书籍.视频教程和博客,但是大部分都是讲解基础知 ...
Python学习宝典，Python400集让你成为从零基础到手写神经网络的Python大神
当您学完Python,你学到了什么? 开发网站! 或者, 基础语法要点.函数.面向对象编程.调试.IO编程.进程与线程.正则表达式... 当你学完Python,你可以干什么? 当程序员! 或者, 手写 ...
国内某Python大神自创完整版，系统性学习Python
很多小伙伴纠结于这个一百天的时间,我觉得完全没有必要,也违背了我最初放这个大纲上来的初衷,我是觉得这个学习大纲还不错,自学按照这个来也能相对系统的学习知识,而不是零散细碎的知识最后无法整合,每个人的基 ...
Python大神成长之路：第一次学习记录
一.Python发展史二.Python2 or 3 博主选择了Python3. 从官网下载Python www.python.org Windows安装python3.5.python2.7.安装 ...
Python大神成长之路：第三次学习记录集合函数装饰 re
学习记录day03 字符串可以直接切片,But字符串不可修改字符串修改:生成了一个新的字符串 LIst修改,在原基础上修改(原内存上) 集合是一个无序的,不重复的数据组合,它的主要作用如 ...
Python大神编程常用4大工具,你用过几个?
摘要:Python是一种跨平台的编程语言,能够在所有主要的操作系统上,运行你编写的任何Python程序.今天介绍几款常见的工具:Python自带的解释器.文本编辑器(Geany.Sublime Tex ...
Python大神成长之路：第二次学习记录
数据类型数据操作 bytes 类型 "".encode() 编码-->二进制 "".decode() 解码判断字符串里的字符是否全为 ...
大神：python怎么爬取js的页面
大神:python怎么爬取js的页面可以试试抓包看看它请求了哪些东西, 很多时候可以绕过网页直接请求后面的API 实在不行就上 selenium (selenium大法好) selenium和pha ...

随机推荐

django-Views之request（二）
book/views.py def index(request): http_list = { '<h1>请求协议: <span style="color:red" ...
LogBack.xml文件配置
Logback-spring.xml配置文件 1.日志级别:日志级别从低到高分为TRACE < DEBUG < INFO < WARN < ERROR < FATAL, ...
springboot集成log4j2 + logstash 异步输出日志
一. spring boot 集成log4j2 1.maven引入jar包 <dependency> <groupId>org.springframework.boot< ...
《Effective Java》读书笔记（五）使用依赖注入取代原本的资源依赖
相信接触过Spring的同学,对于依赖注入并不陌生. 刚开始在听说这个名字的时候,一直不明白到底什么叫依赖注入,后来才发现,依赖注入一直都存在我们日常代码中,只是我们没有刻意的把它提出来,然后再取这样 ...
学习笔记42_SpringMVC
SpringMVC中,Global.axas发生变化,其中 1.原来是 public class MvcApplication:System.web.HttpApplication 现在是 publi ...
Project Euler 53: Combinatoric selections
从12345这个数字中挑选出三个数共有十种方式: \[ 123, 124, 125, 134, 135, 145, 234, 235, 245,345 \] 在组合学中,我们将其记为\(C(5,3)= ...
Redis 的底层数据结构（压缩列表）
上一篇我们介绍了 redis 中的整数集合这种数据结构的实现,也谈到了,引入这种数据结构的一个很大的原因就是,在某些仅有少量整数元素的集合场景,通过整数集合既可以达到字典的效率,也能使用远少于字典的内 ...
linux 命令 | 常用命令导图（0）
request爬虫通用的小技巧
嵩天老师一直强调的通用代码框架,这个框架可以用在很多爬虫中用来获取HTML文本,并且它通过response.raise_for_status()方法判断返回的状态码是不是200,如果不是,就会引发HT ...
html5自动弹出软键盘的方法
html5自动弹出软键盘的方法<pre> <textarea placeholder="说点什么......" autofocus="autofocus ...

Python大神必须掌握的技能：多继承、super和MRO算法

Python大神必须掌握的技能：多继承、super和MRO算法的更多相关文章

随机推荐

热门专题