Python自动化开发 - 生成器、迭代器

本节内容

一、列表生成式

需求：把列表[0, 1, 2, 3, 4, 5, 6, 7, 8, 9]里，每个元素都加1

# 复制版，重新绑定

a = [0, 1, 2, 3, 4, 5, 6, 7, 8, 9]

b = []

for i in a:

    b.append(i + 1)

a = b

# enumerate版，原值修改

a = list(range(10))

print("a >:", a)

for index, value in enumerate(a):

    a[index] = value + 1

print("a+1 >:", a)

# map版

a = [0, 1, 2, 3, 4, 5, 6, 7, 8, 9]

a = map(lambda x: x + 1, a)

print(a)         # <map object at 0x000000E7FFF7B898>

print(list(a))   # [1, 2, 3, 4, 5, 6, 7, 8, 9, 10]

还有一种叫做列表生成式

# 列表生成式

a = [0, 1, 2, 3, 4, 5, 6, 7, 8, 9]

b = [i + 1 for i in a]

print(b)

二、生成器

通过列表生成式，可以直接创建一个列表。但是，受到内存限制，列表容量肯定是有限的。而且，创建一个包含100万个元素的列表，

不仅占用很大的存储空间，如果我们仅仅需要访问前面几个元素，那后面绝大多数元素占用的空间都白白浪费了。

所以，如果列表元素可以按照某种算法推算出来，那我们是否可以在循环的过程中不断推算出后续的元素呢？这样就不必创建完整的list，

从而节省大量的空间。在Python中，这种一边循环一边计算的机制，称为生成器：generator。

要创建一个generator，有很多种方法。

第一种方法很简单，只要把一个列表生成式的[]改成()，就创建了一个generator：

>>> L = [x * x for x in range(10)]

>>> L

[0, 1, 4, 9, 16, 25, 36, 49, 64, 81]

>>> g = (x * x for x in range(10))

>>> g

<generator object <genexpr> at 0x1022ef630>

创建L和g的区别仅在于最外层的[]和()，L是一个list，而g是一个generator。

我们可以直接打印出list的每一个元素，但我们怎么打印出generator的每一个元素呢？

如果要一个一个打印出来，可以通过next()函数获得generator的下一个返回值：

>>> next(g)

0

>>> next(g)

1

>>> next(g)

4

>>> next(g)

9

>>> next(g)

16

>>> next(g)

25

>>> next(g)

36

>>> next(g)

49

>>> next(g)

64

>>> next(g)

81

>>> next(g)

Traceback (most recent call last):

  File "<stdin>", line 1, in <module>

StopIteration

generator保存的是算法，每次调用next(g)，就计算出g的下一个元素的值，

直到计算到最后一个元素，没有更多的元素时，抛出StopIteration的错误。

当然，上面这种不断调用next(g)实在是太变态了，正确的方法是使用for循环，因为generator也是可迭代对象：

>>> g = (x * x for x in range(10))

>>> for n in g:print(n)

所以，我们创建了一个generator后，基本上永远不会调用next()，而是通过for循环来迭代它，并且不需要关心StopIteration的错误。

generator非常强大。如果推算的算法比较复杂，用类似列表生成式的for循环无法实现的时候，还可以用函数来实现

比如，著名的斐波拉契数列（Fibonacci），除第一个和第二个数外，任意一个数都可由前两个数相加得到：

1, 1, 2, 3, 5, 8, 13, 21, 34, ...

斐波拉契数列用列表生成式写不出来，但是，用函数把它打印出来却很容易：

def fib(max):

    n, a, b = 0, 0, 1

    while n < max:

        print(b)

        t = a +b

        b = a

        a = t

        n = n + 1

    return 'done'

    fib(10) # 调用函数fib

fib函数实际上是定义了斐波拉契数列的推算规则，可以从第一个元素开始，推算出后续任意的元素，这种逻辑其实非常类似generator

也就是说，上面的函数和generator仅一步之遥。要把fib函数变成generator，只需要把print(b)改为yield b就可以了：

def fib(max):

    n, a, b = 0, 0, 1

    while n < max:

        # print(b)

        yield b

        t = a +b

        b = a

        a = t

        n = n + 1

    return 'done'

这就是定义generator的另一种方法。如果一个函数定义中包含yield关键字，那么这个函数就不再是一个普通函数，而是一个generator：

>>> f = fib(6)

>>> f

<generator object fib at 0x104feaaa0>

这里，最难理解的就是generator和函数的执行流程不一样。

函数是顺序执行，遇到return语句或者最后一行函数语句就返回。

而变成generator的函数，在每次调用next()的时候执行，遇到yield语句返回，再次执行时从上次返回的yield语句处继续执行。

data = fib(10)

print(data)

print(data.__next__())

print(data.__next__())

print("do something else")

print(data.__next__())

print(data.__next__())

print(data.__next__())

print(data.__next__())

print(data.__next__())

#输出

<generator object fib at 0x101be02b0>

1

1

do something else

2

3

5

8

13

在上面fib的例子，我们在循环过程中不断调用yield，就会不断中断。当然要给循环设置一个条件来退出循环，不然就会产生一个无限数列出来

同样的，把函数改成generator后，我们基本上从来不会用next()来获取下一个返回值，而是直接使用for循环来迭代

for n in fib(6):

    print(n)

还可通过yield实现在单线程的情况下实现并发运算的效果

import time

def consumer(name):

    print("%s 准备吃包子啦！" % name)

    while True:

        baozi = yield   # 接收producer send过来的包子，赋值给包子变量

        print("包子【%s】来了，被【%s】吃了" % (baozi, name))

def producer(name):

    c1 = consumer("Jonathan")

    c2 = consumer("Linda")

    c1.__next__()

    c2.__next__()

    print("%s 开始做包子了" % name)

    for i in range(10):

        print("做了2个包子")

        c1.send(i)   # 调用next并传值给yield

        c2.send(i)

producer("Alex")

通过生成器实现协程并行运算

三、迭代器

可以直接作用于for循环的数据类型有以下几种：

一类是集合数据类型，如list、tuple、dict、set、str等；

一类是generator，包括生成器和带yield的generator function

这些可以直接作用于for循环的对象统称为可迭代对象：Iterable

可以使用isinstance()判断一个对象是否是Iterable对象：

>>> from collections import Iterable

>>> isinstance([], Iterable)

True

>>> isinstance({}, Iterable)

True

>>> isinstance('abc', Iterable)

True

>>> isinstance((x for x in range(10)), Iterable)

True

>>> isinstance(100, Iterable)

False

而生成器不但可以作用于for循环，还可以被next()函数不断调用并返回下一个值，直到最后抛出StopIteration错误表示无法继续返回下一个值

可以被next()函数调用并不断返回下一个值的对象称为迭代器：Iterator

可以使用isinstance()判断一个对象是否是Iterator对象：

>>> from collections import Iterator

>>> isinstance((x for x in range(10)), Iterator)

True

>>> isinstance([], Iterator)

False

>>> isinstance({}, Iterator)

False

>>> isinstance('abc', Iterator)

False

生成器都是Iterator对象，但list、dict、str虽然是Iterable，却不是Iterator

把list、dict、str等Iterable变成Iterator可以使用iter()函数

>>> isinstance(iter([]), Iterator)

True

>>> isinstance(iter('abc'), Iterator)

True

你可能会问，为什么list、dict、str等数据类型不是Iterator？

这是因为Python的Iterator对象表示的是一个数据流，Iterator对象可以被next()函数调用并不断返回下一个数据，

直到没有数据时抛出StopIteration错误。可以把这个数据流看做是一个有序序列，

但我们却不能提前知道序列的长度，只能不断通过next()函数实现按需计算下一个数据，

所以Iterator的计算是惰性的，只有在需要返回下一个数据时它才会计算。

Iterator甚至可以表示一个无限大的数据流，例如全体自然数。而使用list是永远不可能存储全体自然数的。

小结

凡是可作用于for循环的对象都是Iterable类型；

凡是可作用于next()函数的对象都是Iterator类型，它们表示一个惰性计算的序列；

集合数据类型如list、dict、str等是Iterable但不是Iterator，不过可以通过iter()函数获得一个Iterator对象。

Python的for循环本质上就是通过不断调用next()函数实现的，例如：

for x in [1, 2, 3, 4, 5]:

    pass

实际上完全等价于：

# 首先获得Iterator对象:

it = iter([1, 2, 3, 4, 5])

# 循环:

while True:

    try:

        # 获得下一个值:

        x = next(it)

    except StopIteration:

        # 遇到StopIteration就退出循环

        break

Python自动化开发 - 生成器、迭代器的更多相关文章

python高级之生成器&迭代器
python高级之生成器&迭代器本机内容概念梳理容器可迭代对象迭代器 for循环内部实现生成器 1.概念梳理容器(container):多个元素组织在一起的数据结构可迭代对象( ...
第三篇：python高级之生成器&迭代器
python高级之生成器&迭代器 python高级之生成器&迭代器本机内容概念梳理容器可迭代对象迭代器 for循环内部实现生成器 1.概念梳理容器(container ...
python自动化开发学习进程, 线程, 协程
python自动化开发学习进程, 线程, 协程前言在过去单核CPU也可以执行多任务,操作系统轮流让各个任务交替执行,任务1执行0.01秒,切换任务2,任务2执行0.01秒,在切换到任务3,这 ...
python自动化开发学习 I/O多路复用
python自动化开发学习 I/O多路复用一. 简介 socketserver在内部是由I/O多路复用,多线程和多进程,实现了并发通信.IO多路复用的系统消耗很小. IO多路复用底层就是监听so ...
python自动化开发-5
列表生成式生成器迭代器列表生成式举个例子列表[0, 1, 2, 3, 4, 5, 6],要求把列表里的每个值加1,如何实现呢? L=[0, 1, 2, 3, 4, 5, 6] a={i+ ...
python学习之- 生成器/迭代器
列表生成式写法: [ i*2 for i in range(10) ]也可以带函数 [ fun(i) for i in range(10) ] 生成器:一边循环一边计算的机制称为生成器.在常用函数中, ...
Python自动化开发
阅读目录第一篇:python入门第二篇:字符编码.文件处理第三篇:函数第四篇:迭代器.生成器.三元表达式.列表生成式第五篇:模块.包.软件开发规范第六篇:日志模块第七篇:常用模块第八篇 ...
python-学习笔记之-Day5 双层装饰器字符串格式化 python模块递归生成器迭代器序列化
1.双层装饰器 #!/usr/bin/env python # -*- coding: utf-8 -*- # author:zml LOGIN_INFO = False IS_ADMIN = Fal ...
Python自动化开发-简介
1.Python简介 Python创始人 Guido Van Rossum,人称"龟叔",1989年圣诞节期间,为了在阿姆斯特丹打发时间,开发的一个新的脚本解释程序作为ABC语 ...

随机推荐

探索未知种族之osg类生物---起源
任何程序都是有生命的,是生命就需要呼吸.例如普通的windows程序,当运行完main()函数后,就需要进入消息循环,来监听用户的各种操作,以便做出及时的回应.这样的每次循环就像生命的每次呼吸,来维持 ...
VS“当前上下文中不存在名称“ViewBag”，当前上下文不存在名称“model””-已解决
自己的项目出现了错误提示,却能编译成功,但是有点强迫症,总是想解决这个错误. 上网找了一堆,都是删除缓存等一些方法,但是没有多大用处,我觉得还是版本号不对,没有引用进来相应的配置,所以配置下了Conf ...
定时任务起的java进程没有释放导致oracle的问题not availavle & out of memory
最近发现一个问题,我们设置了一个定时任务,用于每天的对账,每天的对账都是启动一个java程序(jar包),时间久了,出现下面的问题: 有很多CardPaymentBatch.jar进程驻留在系统当中, ...
Codeforces 791B. Bear and Friendship Condition 联通快完全图
B. Bear and Friendship Condition time limit per test:1 second memory limit per test:256 megabytes in ...
Linux 内核态与用户态通信 netlink
参考资料: https://blog.csdn.net/zqixiao_09/article/details/77131283 https://www.cnblogs.com/lopnor/p/615 ...
约束 CONSTRAINT
约束用于限制加入表中数据的类型约束的种类: 非空约束(NOT NULL):约束列不接受NULL值,强制字段始终包含值. 唯一约束(UNIQUE):约束一列或一组列中的数据是唯一的.表中可以有多个唯一 ...
ApplicationContext（四）BeanFactory 功能扩展
ApplicationContext(四)BeanFactory 功能扩展上节我们提到容器刷新的第二步初始化 BeanFactory 工厂并解析配制文件,但此时 BeanFactory 的功能还很简 ...
mac install brew
$ ruby -e "$(curl -fsSL https://raw.githubusercontent.com/Homebrew/install/master/install)" ...
解决textarea 输出有空格问题
我们在使用textarea标签输出的时候,经常会出现前后都有空格.使用trim()处理也不行. 这个原因是因为我们在编写textarea标签对的时候使用了换行. 解决方法:就是<textare ...
NOIP水题测试(2017082401)
哈,水题测试又来了! 上次的水题简单吧! 答案是以单题形式发布的(旅行家的预算随后发布). 下面来看今天的题,还是水题. 时间限制:5小时题目一:看上去就很水题目二:比上面一题还水题目三:数的划 ...

Python自动化开发 - 生成器、迭代器

Python自动化开发 - 生成器、迭代器的更多相关文章

随机推荐

热门专题