也许你已经觉得自己可以熟练使用python并能胜任许多开发任务,所以这篇文章是在浪费你的时间。不过别着急,我们先从一个例子开始:

  1. i = 0
  2. def f():
  3. print(i)
  4. i += 1
  5. print(i)
  6. f()
  7. print(i)

猜猜看输出是什么?你会说不就是0,1,1么,真的是这样吗?

  1. > python test.py
  2. Traceback (most recent call last):
  3. File "a.py", line 7, in <module>
  4. f()
  5. File "a.py", line 3, in f
  6. print(i)
  7. UnboundLocalError: local variable 'i' referenced before assignment

这是为什么?如果你还不清楚产生错误的原因,那就请继续往下阅读吧!

本文索引

LEGB原则

变量的作用域,这是一个老生常谈的问题了。

在python中作用域规则可以简单的归纳为LEGB原则,也就是说,对于一个变量name,首先会从当前的作用域开始查找,如果它不在函数里那就从global开始,没找到就查找builtin作用域,如果它位于函数中,就先从local作用域查找,接着如果当前的函数是一个闭包,那么就查找外层闭包的作用域,也就是规则中的E,接着是global和builtin,如果都没找到name这个变量,则抛出NameError

那么我们来看一段代码:

  1. i = 100
  2. def f():
  3. print(i)

在这段代码中,print位于builtin作用域,i位于global,那么:

  1. 在函数f中找不到这两个名字,所以从local向上查找,
  2. 首先f不是闭包,因此跳过闭包作用域的查找,
  3. 然后查找global,找到了i,但print还未找到,
  4. 然后查找builtin,找到了print的builtin模块里的一个函数。

至此名字查找结束,调用找到的函数,输出结果100。

现在你可能更加疑惑了,既然查找规则按照LEGB的方向进行,那么test.py中的f不就应该找到i为global中的变量吗,为什么会报错呢?

名字隐藏和暂时性死区

在揭晓答案之前,我们先复习一下名字隐藏。

它是指一个声明在局部作用中的名字会隐藏外层作用域中的同名的对象。许多语言都遵守这一特性,python也不例外。

那么暂时性死区是什么呢?这是es6的一个概念,当你在局部作用域中定义了一个非全局的名字时,这个名字会绑定在当前作用域中,并将外部作用域的同名对象隐藏:

  1. var i = 'hello'
  2. function f() {
  3. i = 'world'
  4. let i
  5. }

这段代码中函数中的i被绑定在局部作用域(也就是函数体内)中,在绑定的作用域中可见,并将外部的名字隐藏,而对一个未声明的局部变量赋值会导致错误,所以上面的代码会引发ReferenceError: i is not defined

对于python来说也是一样的问题,python代码在执行前首先会被编译成字节码,这就会导致某些时候实际执行的程序会和我们看到的产生出入。不过我们有dis模块帮忙,它可以输出python对象的字节码,下面我们就来看下经过编译后的f

  1. > dis(f)
  2. 2 0 LOAD_GLOBAL 0 (print)
  3. 2 LOAD_FAST 0 (i)
  4. 4 CALL_FUNCTION 1
  5. 6 POP_TOP
  6. 3 8 LOAD_CONST 1 ('a')
  7. 10 STORE_FAST 0 (i)
  8. 4 12 LOAD_GLOBAL 0 (print)
  9. 14 LOAD_FAST 0 (i)
  10. 16 CALL_FUNCTION 1
  11. 18 POP_TOP
  12. 20 LOAD_CONST 0 (None)
  13. 22 RETURN_VALUE

字节码的解释在这里

其中LOAD_FASTSTORE_FAST是读取和存储local作用域的变量,我们可以看到,i变成了局部作用域的变量!而对i的赋值早于i的定义,所以报错了。

产生这种现象的原因也很简单,python对函数的代码是独立编译的,如果未加说明而在函数内对一个变量赋值,那么就认为你定义了一个局部变量,从而把外部的同名对象屏蔽了。这么做无可厚非,毕竟python没有独立的声明一个局部变量的语法,但结果就会造成我们看到的类似暂时性死区的现象。所以请允许我把es6的概念套用在python身上。

消除暂时性死区

既然知道问题的症结在于python无法区分局部变量的声明和定义,那么我们就来解决它。

对于一个可以区分声明和定义的语言来说是没有这种烦恼的,比如c:

  1. int i = 0;
  2. void f(void)
  3. {
  4. i++;
  5. printf("%d\n", i); // 1
  6. const char *i = "hello";
  7. printf("%s\n", i); // "hello"
  8. }

python中不能这么做,但是我们可以换一个思路,声明一个变量是全局作用域的,这样不就解决了吗?

global运算符就是为了这个目的而存在的,它声明一个变量始终是全局作用域的变量,因此只要存在global声明,那么当前作用域里的这个名字就是一个对同名全局变量的引用。改进后的函数如下:

  1. def f():
  2. global i
  3. print(i)
  4. i += 1
  5. print(i)

现在运行程序就会是你想要的结果了:

  1. > python test.py
  2. 0
  3. 1
  4. 1

如果你还是不放心,那么我们再来看看字节码:

  1. > dis(f)
  2. 3 0 LOAD_GLOBAL 0 (print)
  3. 2 LOAD_GLOBAL 1 (i)
  4. 4 CALL_FUNCTION 1
  5. 6 POP_TOP
  6. 4 8 LOAD_CONST 1 ('a')
  7. 10 STORE_GLOBAL 1 (i)
  8. 5 12 LOAD_GLOBAL 0 (print)
  9. 14 LOAD_GLOBAL 1 (i)
  10. 16 CALL_FUNCTION 1
  11. 18 POP_TOP
  12. 20 LOAD_CONST 0 (None)
  13. 22 RETURN_VALUE

对于i的存取已经由LOAD_GLOBALSTORE_GLOBAL接手了,没问题。

当然global也有它的局限性:

  • 一旦声明global,那么这个名字始终是global作用域的一个变量,不可以再是局部变量
  • 名字必须存在于global里,因为python在运行时进行名字查找,所以你的变量在global里找不到的话对它的引用将会出错
  • 接上一条,因为global限定了名字查找的范围,所以像闭包作用域的变量就找不到了

事实上需要引用非global名字的需求是极其常见的,因此为了解决global的不足,python3引入了nonlocal

使用nonlocal声明闭包作用域变量

假设我们有一个需求,一个函数需要知道自己被调用了多少次,最简单的实现就是使用闭包:

  1. def closure():
  2. count = 0
  3. def func():
  4. # other code
  5. count += 1
  6. print(f'I have be called {count} times')
  7. return func

还是老问题,这样写对吗?

答案是不对,你又制造暂时性死区啦!

  1. >>> f=closure()
  2. >>> f()
  3. Traceback (most recent call last):
  4. File "<stdin>", line 1, in <module>
  5. File "<stdin>", line 5, in func
  6. UnboundLocalError: local variable 'count' referenced before assignment

这时候就要nonlocal出场了,它声明一个名字位于闭包作用域中,如果闭包作用域中未找到就报错。

所以修正后的函数如下:

  1. def closure():
  2. count = 0
  3. def func():
  4. # other code
  5. nonlocal count
  6. count += 1
  7. print(f'I have be called {count} times')
  8. return func

测试一下:

  1. >>> f=closure()
  2. >>> f()
  3. I have be called 1 times
  4. >>> f()
  5. I have be called 2 times
  6. >>> f()
  7. I have be called 3 times
  8. >>> f2=closure()
  9. >>> f2()
  10. I have be called 1 times

现在可以正常使用和修改闭包作用域的变量了。

总结

当然,在函数里修改外部变量往往会导致潜在的缺陷,但有时这样做又是对的,所以希望你在好好了解作用域规则的前提下合理地利用它们。

作用域规则可以总结为下:

  1. 名字查找按照LEGB规则进行,如果当前代码在global中则从global作用域开始查找,否则从local开始
  2. builtin作用域中是内置类型和函数,所以它们总是能被找到,前提是不要在局部作用域中对它们赋值
  3. global中存放着所有定义在当前模块和导入的名字
  4. local是局部作用域,存放在形成局部作用于的代码中有赋值行为的名字
  5. 闭包作用域是闭包函数的外层作用域,里面可以存放一些自定义的状态
  6. global声明一个名字在global作用域中
  7. nonlocal声明一个名字在闭包作用域中
  8. 最重要的一条,当你在能产生局部作用域的代码中对一个名字进行赋值,那么这个名字就会被认为是一个local作用域的变量从而屏蔽其他作用域中的同名对象

只要记住这些规则你就可以和因作用域引起的各种问题说再见了。而且理解了这些规则还会为你探索更深层次的python打下坚实的基础,所以请将它牢记于心。

python3的变量作用域规则和nonlocal关键字的更多相关文章

  1. python 装饰器(二):装饰器基础(二)变量作用域规则,闭包,nonlocal声明

    变量作用域规则 在示例 7-4 中,我们定义并测试了一个函数,它读取两个变量的值:一个是局部变量 a,是函数的参数:另一个是变量 b,这个函数没有定义它. >>> def f1(a) ...

  2. Python3中变量作用域nonlocal的总结

    最近,在工作中踩到了一个关于Python3中nonlocal语句指定的变量作用域的坑.今天趁周六休息总结记录一下. 众所周知,Python中最常见的作用域定义如下:   但是,为了更加方便地在闭包函数 ...

  3. OC的特有语法-分类Category、 类的本质、description方法、SEL、NSLog输出增强、点语法、变量作用域、@property @synthesize关键字、Id、OC语言构造方法

    一. 分类-Category 1. 基本用途:Category  分类是OC特有的语言,依赖于类. ➢ 如何在不改变原来类模型的前提下,给类扩充一些方法?有2种方式 ● 继承 ● 分类(Categor ...

  4. python3 之 变量作用域详解

    作用域: 指命名空间可直接访问的python程序的文本区域,这里的 ‘可直接访问’ 意味着:对名称的引用(非限定),会尝试在命名空间中查找名称: L:local,局部作用域,即函数中定义的变量: E: ...

  5. python 函数及变量作用域及装饰器decorator @详解

    一.函数及变量的作用   在python程序中,函数都会创建一个新的作用域,又称为命名空间,当函数遇到变量时,Python就会到该函数的命名空间来寻找变量,因为Python一切都是对象,而在命名空间中 ...

  6. python3学习笔记12(变量作用域)

    变量作用域 参考http://www.runoob.com/python3/python3-function.html Python 中,程序的变量并不是在哪个位置都可以访问的,访问权限决定于这个变量 ...

  7. Python3中 对local和nonlocal 关键字的改善认识(新手向)

    nonlocal关键字用来在函数或其他作用域中使用外层(非全局)变量. nonlocal用于声明,修改嵌套作用域(enclosing 作用域,外层非全局作用域)中的变量,如下实例: #!/usr/bi ...

  8. 函数的进阶(动态参数,命名空间和作用域,函数的嵌套,gloabal和nonlocal关键字)

    1. 函数参数--动态传参 昨天已经解过了传参, 如果需要给一个函数传参,而参数又是不确定的. 或者我们给一个函数传很多参数, 我的形参就要写很多, 写起来就很麻烦, 这时我们可以考虑使用动态参数.形 ...

  9. Python-变量、变量作用域、垃圾回收机制原理-global nonlocal

    变量实现原理决定了Python使用的垃圾回收机制为变量引用计数,当这个对象引用计数为0时候,则会自动执行__del__函数回收资源, del方法只是把变量指向的对象引用计数减一而已并删除这个变量 表达 ...

随机推荐

  1. 图片滚动(UP)的JS代码详解(offsetTop、scrollTop、offsetHeigh)【转】

    源地址 信息技术教材配套的光盘里有一段设置图片滚动的JS代码,与网络上差不多,实现思路:一个设定高度并且隐藏超出它高度的内容的容器demo,里面放demo1和 demo2,demo1是滚动内容,dem ...

  2. Java RandomAccessFile用法 【转】

    RandomAccessFile源地址:http://blog.csdn.net/akon_vm/article/details/7429245 RandomAccessFile是用来访问那些保存数据 ...

  3. Android官方开发文档下载

    Android官方开发文档 docs-24_r02.rar(链接:https://pan.baidu.com/s/12xC998JeUHj3ndfDXPM2ww 密码:bxyk) ADT下载.Andr ...

  4. CDH简易离线部署文档

        CDH 离线简易部署文档       文档说明 本文为开发部署文档,生产环境需做相应调整. 以下操作尽量在root用户下操作,避免权限问题. 目录 文档说明 2 文档修改历史记录 2 目录 3 ...

  5. .NET开发设计模式-模板模式

    using System; using System.Collections.Generic; using System.Linq; using System.Text; using System.T ...

  6. Java多线程-概念与原理

    一.操作系统中线程和进程的概念 现在的操作系统是多任务操作系统.多线程是实现多任务的一种方式. 进程是指一个内存中运行的应用程序,每个进程都有自己独立的一块内存空间,一个进程中可以启动多个线程.比如在 ...

  7. Ajax跨域之ContentType为application/json请求失败的问题

    项目里的接口都是用springmvc写的,其中在@requestmapping接口中定义了consumes="application/json",也就是该接口只接受ContentT ...

  8. mysql 创建用户

    以管理员方式打开cmd命令提示符进入MySql的Bin目录下 一.以管理员身份登录mysql 密码不隐藏的登录方式:mysql -u root -p 123456 密码隐藏的登录方式:mysql -u ...

  9. Python模块操作

    Exceptions 模块 该模块定义了以下标准异常: • Exception 是所有异常的基类. 强烈建议(但不是必须)自定义的异常异常也继承这个类. • SystemExit(Exception) ...

  10. Linux时间子系统之四:定时器的引擎:clock_event_device

    早期的内核版本中,进程的调度基于一个称之为tick的时钟滴答,通常使用时钟中断来定时地产生tick信号,每次tick定时中断都会进行进程的统计和调度,并对tick进行计数,记录在一个jiffies变量 ...