Python并发编程之从生成器使用入门协程(七)
大家好,并发编程
进入第七篇。
从今天开始,我们将开始进入Python的难点,那就是协程
。
为了写明白协程的知识点,我查阅了网上的很多相关资料。发现很难有一个讲得系统,讲得全面的文章,导致我们在学习的时候,往往半知半解,学完还是一脸懵逼。
学习协程的第一门课程,是要认识生成器
,有了生成器
的基础,才能更好地理解协程
。
如果你是新手,那么你应该知道迭代器
,对生成器
应该是比较陌生的吧。没关系,看完这系列文章,你也能从小白成功过渡为Ptyhon高手。
再次提醒:
本系列所有的代码均在Python3下编写,也建议大家尽快投入到Python3的怀抱中来。
本文目录
- 可迭代、迭代器、生成器
- 如何运行/激活生成器
- 生成器的执行状态
- 生成器的异常处理
- 从生成器过渡到协程:yield
. 可迭代、迭代器、生成器
初学Python的时候,对于这三货真的是傻傻分不清。甚至还认为他们是等价的。
其实,他们是不一样的。
可迭代的对象,很好理解,我们很熟悉的:字符串
,list
,dict
,tuple
,deque
等
为了验证我说的,需要借助collections.abc
这个模块(Python2没有),使用isinstance()
来类别一个对象是否是可迭代的(Iterable
),是否是迭代器(Iterator
),是否是生成器(Generator
)。
import collections
from collections.abc import Iterable, Iterator, Generator# 字符串
astr = "XiaoMing"
print("字符串:{}".format(astr))
print(isinstance(astr, Iterable))
print(isinstance(astr, Iterator))
print(isinstance(astr, Generator))# 列表
alist = [21, 23, 32,19]
print("列表:{}".format(alist))
print(isinstance(alist, Iterable))
print(isinstance(alist, Iterator))
print(isinstance(alist, Generator))# 字典
adict = {"name": "小明", "gender": "男", "age": 18}
print("字典:{}".format(adict))
print(isinstance(adict, Iterable))
print(isinstance(adict, Iterator))
print(isinstance(adict, Generator))# deque
adeque=collections.deque('abcdefg')
print("deque:{}".format(adeque))
print(isinstance(adeque, Iterable))
print(isinstance(adeque, Iterator))
print(isinstance(adeque, Generator))
输出结果
字符串:XiaoMing
True
False
False列表:[21, 23, 32, 19]
True
False
False字典:{'name': '小明', 'gender': '男', 'age': 18}
True
False
Falsedeque:deque(['a', 'b', 'c', 'd', 'e', 'f', 'g'])
True
False
False
从结果来看,这些可迭代对象都不是迭代器,也不是生成器。它们有一个共同点,就是它们都可以使用for
来循环。这一点,大家都知道,我们就不去验证了。
扩展知识:
可迭代对象,是其内部实现了,__iter__
这个魔术方法。
可以通过,dir()
方法来查看是否有__iter__
来判断一个变量是否是可迭代的。
接下来是,迭代器
。
对比可迭代对象,迭代器
其实就只是多了一个函数而已。就是__next__()
,我们可以不再使用for
循环来间断获取元素值。而可以直接使用next()方法来实现。
迭代器,是在可迭代的基础上实现的。要创建一个迭代器,我们首先,得有一个可迭代对象。
现在就来看看,如何创建一个可迭代对象,并以可迭代对象为基础创建一个迭代器。
from collections.abc import Iterable, Iterator, Generator
class MyList(object): # 定义可迭代对象类
def __init__(self, num):
self.end = num # 上边界# 返回一个实现了__iter__和__next__的迭代器类的实例
def __iter__(self):
return MyListIterator(self.end)class MyListIterator(object): # 定义迭代器类
def __init__(self, end):
self.data = end # 上边界
self.start = 0# 返回该对象的迭代器类的实例;因为自己就是迭代器,所以返回self
def __iter__(self):
return self# 迭代器类必须实现的方法,若是Python2则是next()函数
def __next__(self):
while self.start < self.data:
self.start += 1
return self.start - 1
raise StopIterationif __name__ == '__main__':
my_list = MyList(5) # 得到一个可迭代对象
print(isinstance(my_list, Iterable)) # True
print(isinstance(my_list, Iterator)) # False
# 迭代
for i in my_list:
print(i)my_iterator = iter(my_list) # 得到一个迭代器
print(isinstance(my_iterator, Iterable)) # True
print(isinstance(my_iterator, Iterator)) # True# 迭代
print(next(my_iterator))
print(next(my_iterator))
print(next(my_iterator))
print(next(my_iterator))
print(next(my_iterator))
输出
0
1
2
3
4True
FalseTrue
True0
1
2
3
4
如果上面的代码太多,也可以看这边,你更能理解。
from collections.abc import Iterator
aStr = 'abcd' # 创建字符串,它是可迭代对象
aIterator = iter(aStr) # 通过iter(),将可迭代对象转换为一个迭代器
print(isinstance(aIterator, Iterator)) # True
next(aIterator) # a
next(aIterator) # b
next(aIterator) # c
next(aIterator) # d
扩展知识:
迭代器,是其内部实现了,__next__
这个魔术方法。(Python3.x)
可以通过,dir()
方法来查看是否有__next__
来判断一个变量是否是迭代器的。
接下来,是我们的重点,生成器
。
生成器的概念在 Python 2.2 中首次出现,之所以引入生成器,是为了实现一个在计算下一个值时不需要浪费空间的结构。
前面我们说,迭代器,是在可迭代的基础上,加了一个next()方法。
而生成器,则是在迭代器的基础上(可以用for循环,可以使用next()
),再实现了yield
。
yield
是什么东西呢,它相当于我们函数里的return。在每次next(),或者for遍历的时候,都会yield这里将新的值返回回去,并在这里阻塞,等待下一次的调用。正是由于这个机制,才使用生成器在Python编程中大放异彩。实现节省内存,实现异步编程。
如何创建一个生成器,主要有如下两种方法
- 使用列表生成式
# 使用列表生成式,注意不是[],而是()
L = (x * x for x in range(10))
print(isinstance(L, Generator)) # True
- 实现yield的函数
# 实现了yield的函数
def mygen(n):
now = 0
while now < n:
yield now
now += 1if __name__ == '__main__':
gen = mygen(10)
print(isinstance(gen, Generator)) # True
可迭代对象和迭代器,是将所有的值都生成存放在内存中,而生成器
则是需要元素才临时生成,节省时间,节省空间。
. 如何运行/激活生成器
由于生成器并不是一次生成所有元素,而是一次一次的执行返回,那么如何刺激生成器执行(或者说激活)呢?
激活主要有两个方法
- 使用
next()
- 使用
generator.send(None)
分别看下例子,你就知道了。
def mygen(n):
now = 0
while now < n:
yield now
now += 1if __name__ == '__main__':
gen = mygen(4)# 通过交替执行,来说明这两种方法是等价的。
print(gen.send(None))
print(next(gen))
print(gen.send(None))
print(next(gen))
输出
0
1
2
3
. 生成器的执行状态
生成器在其生命周期中,会有如下四个状态
GEN_CREATED
# 等待开始执行GEN_RUNNING
# 解释器正在执行(只有在多线程应用中才能看到这个状态)GEN_SUSPENDED
# 在yield表达式处暂停GEN_CLOSED
# 执行结束
通过代码来感受一下,为了不增加代码理解难度,GEN_RUNNING
这个状态,我就不举例了。有兴趣的同学,可以去尝试一下多线程。若有疑问,可在后台回复我。
from inspect import getgeneratorstate
def mygen(n):
now = 0
while now < n:
yield now
now += 1if __name__ == '__main__':
gen = mygen(2)
print(getgeneratorstate(gen))print(next(gen))
print(getgeneratorstate(gen))print(next(gen))
gen.close() # 手动关闭/结束生成器
print(getgeneratorstate(gen))
输出
GEN_CREATED
0
GEN_SUSPENDED
1
GEN_CLOSED
. 生成器的异常处理
在生成器工作过程中,若生成器不满足生成元素的条件,就会
/应该
抛出异常(StopIteration
)。
通过列表生成式构建的生成器,其内部已经自动帮我们实现了抛出异常这一步。不信我们来看一下。
所以我们在自己定义一个生成器的时候,我们也应该在不满足生成元素条件的时候,抛出异常。
拿上面的代码来修改一下。
def mygen(n):
now = 0
while now < n:
yield now
now += 1
raise StopIterationif __name__ == '__main__':
gen = mygen(2)
next(gen)
next(gen)
next(gen)
. 从生成器过渡到协程:yield
通过上面的介绍,我们知道生成器为我们引入了暂停函数执行(yield
)的功能。当有了暂停的功能之后,人们就想能不能在生成器暂停的时候向其发送一点东西(其实上面也有提及:send(None)
)。这种向暂停的生成器发送信息的功能通过 PEP 342
进入 Python 2.5
中,并催生了 Python
中协程
的诞生。根据 wikipedia
中的定义
协程是为非抢占式多任务产生子程序的计算机程序组件,协程允许不同入口点在不同位置暂停或开始执行程序。
注意从本质上而言,协程并不属于语言中的概念,而是编程模型上的概念。
协程和线程,有相似点
,多个协程之间和线程一样,只会交叉串行执行;也有不同点
,线程之间要频繁进行切换,加锁,解锁,从复杂度和效率来看,和协程相比,这确是一个痛点。协程通过使用 yield
暂停生成器,可以将程序的执行流程交给其他的子程序,从而实现不同子程序的之间的交替执行。
下面通过一个简明的演示来看看,如何向生成器中发送消息。
def jumping_range(N):
index = 0
while index < N:
# 通过send()发送的信息将赋值给jump
jump = yield index
if jump is None:
jump = 1
index += jumpif __name__ == '__main__':
itr = jumping_range(5)
print(next(itr))
print(itr.send(2))
print(next(itr))
print(itr.send(-1))
输出。
0
2
3
2
这里解释下为什么这么输出。
重点是jump = yield index
这个语句。
分成两部分:
yield index
是将indexreturn
给外部调用程序。jump = yield
可以接收外部程序通过send()发送的信息,并赋值给jump
以上这些,都是讲协程并发的基础必备知识,请一定要亲自去实践并理解它,不然后面的内容,将会变得枯燥无味,晦涩难懂。
下一章,我将讲一个Python3.5新引入的语法:yield from
。篇幅也比较多,所以就单独拿出来讲。
好了,今天就讲这些。

Python并发编程之从生成器使用入门协程(七)的更多相关文章
- python并发编程之进程、线程、协程的调度原理(六)
进程.线程和协程的调度和运行原理总结. 系列文章 python并发编程之threading线程(一) python并发编程之multiprocessing进程(二) python并发编程之asynci ...
- py 并发编程(线程、进程、协程)
一.操作系统 操作系统是一个用来协调.管理和控制计算机硬件和软件资源的系统程序,它位于硬件和应用程序之间. 程序是运行在系统上的具有某种功能的软件,比如说浏览器,音乐播放器等.操作系统的内核的定义:操 ...
- day33_8_15 并发编程4,线程池与协程,io模型
一.线程池 线程池是一个处理线程任务的集合,他是可以接受一定量的线程任务,并创建线程,处理该任务,处理结束后不会立刻关闭池子,会继续等待提交的任务,也就是他们的进程/线程号不会改变. 当线程池中的任务 ...
- 并发编程 --进、线程池、协程、IO模型
内容目录: 1.socket服务端实现并发 2.进程池,线程池 3.协程 4.IO模型 1.socket服务端实现并发 # 客户端: import socket client = socket.soc ...
- Python并发编程之深入理解yield from语法(八)
大家好,并发编程 进入第八篇. 直到上一篇,我们终于迎来了Python并发编程中,最高级.最重要.当然也是最难的知识点--协程. 当你看到这一篇的时候,请确保你对生成器的知识,有一定的了解.当然不了解 ...
- Python 并发编程(下)
Python 并发编程(下) 课程目标:掌握多进程开发的相关知识点并初步认识协程. 今日概要: 多进程开发 进程之间数据共享 进程锁 进程池 协程 1. 多进程开发 进程是计算机中资源分配的最小单元: ...
- Python并发编程之初识异步IO框架:asyncio 上篇(九)
大家好,并发编程 进入第九篇. 通过前两节的铺垫(关于协程的使用),今天我们终于可以来介绍我们整个系列的重点 -- asyncio. asyncio是Python 3.4版本引入的标准库,直接内置了对 ...
- Python并发编程二(多线程、协程、IO模型)
1.python并发编程之多线程(理论) 1.1线程概念 在传统操作系统中,每个进程有一个地址空间,而且默认就有一个控制线程 线程顾名思义,就是一条流水线工作的过程(流水线的工作需要电源,电源就相当于 ...
- Python并发编程__多进程
Python并发编程_多进程 multiprocessing模块介绍 python中的多线程无法利用多核优势,如果想要充分地使用多核CPU的资源(os.cpu_count()查看),在python中大 ...
随机推荐
- FPGrowth 实现
在关联规则挖掘领域最经典的算法法是Apriori,其致命的缺点是需要多次扫描事务数据库.于是人们提出了各种裁剪(prune)数据集的方法以减少I/O开支,韩嘉炜老师的FP-Tree算法就是其中非常高效 ...
- RubyGem默认源安装太慢,修改国内淘宝源
原帖地址:http://www.hiceon.com/topic/Ruby-Gem-install-source-taobao/ WHY? 由于国内网络原因(你懂的),导致 rubygems.org ...
- Linux - grep的一些进阶选项
[root@www ~]# grep [-A] [-B] [--color=auto] '搜寻字串' filename 选项与参数: -A :后面可加数字,为 after 的意思,除了列出该行外,后续 ...
- linux内核自旋锁API
我们大概都了解,锁这种机制其实是为了保护临界区代码的,关于使用和定义,我总结的API如下: #include <linux/spinlock.h> 定义自旋锁 spinlock_t loc ...
- JAVA全套学习视频
链接: https://pan.baidu.com/s/1miE7kvQ 密码: jj8x
- Day20 Ajax
Ajax准备知识:json 什么是json? 定义: JSON(JavaScript Object Notation, JS 对象标记) 是一种轻量级的数据交换格式.它基于 ECMAScript (w ...
- 2013-8:SDCE大会笔记
百度移动云三大开发框架:Clouda,SiteApp,AppBuilder MBaaS解决高性能Server很难的问题 百度开放云的区域运营服务于创业者 Pinterest架构变迁: 互联网就是把线下 ...
- Nginx接收的host值会影响alias的规则匹配
一般内网接收的HTTP请求都是内网唯一的网关传过来的,nginx的alias匹配会直接使用网关穿过的host值,而不是从URL解析出来的,从而导致的问题是,容器的alias相关Server_name规 ...
- Manacher算法解析
Manacher算法 Manachar算法主要是处理字符串中关于回文串的问题的,它可以在 O(n) 的时间处理出以字符串中每一个字符为中心的回文串半径,由于将原字符串处理成两倍长度的新串,在每两个字符 ...
- 下载Github上某个项目的子文件夹和单个文件
preface Github下的项目可能很大,里面有很多的子文件夹,我们可能只需要使用某个子目录下的资源,可以不用下载完整的repo就能使用. 例如,我想下载这个repo中的字典文件:https:// ...