可迭代对象和迭代器

迭代(iterate)意味着重复,就像 for 循环迭代序列和字典那样,但实际上也可使用 for 循环迭代其他对象:实现了方法 __iter__ 的对象(迭代器协议的基础)。

__iter__方法返回一个迭代器,它是包含方法 __next__ 的对象,调用时可不提供任何参数;

当你调用 __next__ 时,迭代器应返回其下一个值;如果没有可供返回的值,应引发 StopIteration 异常;

也可使用内置函数 next(),此种情况下,next(it) 与 it.__next()__ 等效。

至于为什么不用列表?因为在很多情况下,使用列表都有点太浪费了。例如,如果你有一个可逐个计算值的函数,你可能只想逐个地获取值,而不是使用列表一次性获取。这是因为如果有很多值,列表可能占用太多的内存。

下面来看一个不能使用列表的示例,因为如果使用,这个列表的长度将是无穷大的!

# 这个“列表”为斐波那契数列,表示该数列的迭代器如下:
class Fibs:
def __init__(self):
self.a = 0
self.b = 1 def __next__(self):
self.a, self.b = self.b, self.a + self.b
return self.a # 前面逻辑自定义,最后返回下一个值即可 def __iter__(self):
return self # 返回迭代器本身(一个包含 __next__ 方法的对象) fibs = Fibs() for f in fibs:
if f > 1000:
print(f) # 1597
break # 若不中断循环,将一直循环下去 next(fibs) # 2584
next(fibs) # 4181

更正规的定义是,实现了方法 __iter__ 的对象是 可迭代的,再实现了方法 __next__ 的对象是 迭代器。


内置函数 iter()

通过对可迭代对象调用内置函数 iter(),可以获得一个迭代器。还可使用它从函数或其他可调用对象创建可迭代对象。

不过,可迭代对象在转化为迭代器后,会丢失⼀些属性(如 __getitem__() ),但同时也会增加⼀些属性(如 __next__() )。

另外,迭代器一般都是⼀次性的,当迭代过⼀轮后,再次迭代将获取不到元素;而可迭代对象可以重复使用。

it = iter([1, 2, 3])  # list 是可迭代对象哦
next(it) # 1
next(it) # 2
next(it) # 3
next(it) # StopIretation; 普通的可迭代对象是可复用的,而迭代器是一次性的,回不了头的 it = iter("ABCD") # string 也是可迭代对象
for i in it:
print(i, end=" ") # A B C D
for i in it:
print(i, end=" ") # ⽆输出

查看对象是否实现了魔法方法 _iter_ 的四种方法:

# ⽅法1:dir()查看__iter__,详情请自己尝试
dir(2) # 没有
dir("abc") # 有 __iter__() # ⽅法2:isinstance()判断
import collections
isinstance(2, collections.Iterable) # False
isinstance("abc", collections.Iterable) # True # ⽅法3:hasattr()判断
hasattr(2,"__iter__") # False
hasattr("abc","__iter__") # True # ⽅法4:⽤iter()查看是否报错
iter(2) # 报错:'int' object is not iterable
iter("abc") # <str_iterator at 0x1e2396d8f28>

从迭代器创建序列

在可以使用序列的情况下,大多也可以使用迭代器或可迭代对象(诸如索引和切片等操作除外)。迭代器因为缺少 __getitem__ ,因此不能使⽤普通的切⽚语法,暂未深究。

# 使用构造函数 list() 显示的将迭代器转换为列表
class TestIterator:
value = 0 def __next__(self):
self.value += 1
if self.value > 10: raise StopIteration
return self.value def __iter__(self):
return self ti = TestIterator()
ti2 = list(ti) # [1, 2, 3, 4, 5, 6, 7, 8, 9, 10] for i in ti2:
print(i, end=" ") # 1 2 3 4 5 6 7 8 9 10 print('the second:') for i in ti2:
print(i, end=" ") # 1 2 3 4 5 6 7 8 9 10
生成器

生成器,也被称为简单生成器(simple generator),生成器自动创建了 iter() 和 next() 方法,是一种使用普通函数语法定义的迭代器。与函数的主要的形式差别就在于,它的函数体中有一句 yield 语句。

每次执行到 yield 处时,生成并返回一个值后,函数都将暂时停止执行,等待下一轮迭代调用,如此往复,直到迭代完。数据量大时,生成器能够极大地节省内存空间。下面还是通过斐波纳契数列来看看:

# 斐波纳契数列的生成器实现: 返回数列的前 n 项
def fibs(n):
a, b = 0, 1
for _ in range(n):
yield a # 返回的是一个生成器
a, b = b, b+a f = fibs(5)
print(f) # <generator object fibs at 0x05BB20B0>
print(list(f)) # [0, 1, 1, 2, 3]; 此处生成器 f 已经被迭代过一次了 for i in f:
print(i, end=" ") # ⽆输出; for循环会⾃动捕捉到 StopIteration 异常并停⽌调⽤ next() print(next(f)) # StopIteration

与 return 的区别:生成器不是像 return 一样返回一个值,而是可以生成多个值,每次返回一个;return 返回的话,这个函数就结束了。

生成器推导(生成式表达式)

将列表生成式的 [] 改成 () 之后,数据结构将从列表变为生成器,而不是元组。如果要包装可迭代对象(可能生成大量的值)时,若使用列表推导将立即实例化一个列表,从而丧失迭代的优势;但如果使用生成器推导的话,每迭代一次就生成一个值,没必要一次性生成全部值,这样就好的多了。而且,可以直接在既有的圆括号内(如在函数调用中)使用生成器推导时,无需再添加一对圆括号。

L = [x*x for x in range(10)]  # [0, 1, 4, 9, 16, 25, 36, 49, 64, 81]

g = (x*x for x in range(10))  # <generator object <genexpr> at 0x052AF8F0>
print(next(g)) # 0 sum(i ** 2 for i in range(10)) # 285
递归式生成器

创建一个将两层嵌套列表展开的函数:

nested = [[1, 2], [3, 4], [5], 6]

def flatten(nested):
try:
for sub in nested:
for ele in sub:
yield ele
except TypeError:
yield sub f = flatten(nested)
next(f) # 1
# print(list(f)) # [2, 3, 4, 5, 6] for i in f3:
print(i) # 2 3 4 5 6

创建一个将任意层嵌套列表展开的函数:

对一层列表进行遍历,遍历下层列表的时候,先对一层遍历出来的元素再调用一次 flatten 函数,这时,如果是不可再迭代的对象的话,就会报 TypeError 错误,捕捉到之后,yeild 返回,继续下一个;如果是可迭代的话,就递归下去;

def flatten(nested):
try:
for sub in nested:
for ele in flatten(sub):
yield ele
except TypeError:
yield nested nested = [[[1], 2], 3, 4, [5, [6, 7]], 8]
print(list(flatten(nested)))

不过,上面要注意的是:前面也提到了,字符串对象也是可迭代的,而且一般我们也不会将它拆开。更重要的是,字符串的第一个元素是一个长度为 1 的字符串,而长度为 1 的字符串的第一个元素是字符串本身。

s = 'ABCD'
s2 = s[0] # 'A'
s2[0] # 'A'

这样子会造成无穷递归的。所以还需要检查一下对象是否类似于字符串:

def flatten(nested):
try:
if isinstance(nested, str): raise TypeError for sub in nested:
for ele in flatten(sub):
yield ele
except TypeError:
yield nested nested = [[[1], '23'], 3, '43', [5, [6, '73']], 8]
print(list(flatten(nested))) # [1, '23', 3, '43', 5, 6, '73', 8]

不过,它有两个 yield 唉,这认哪个来着???pass

def flatten(nested):
try:
for sublist in nested:
for element in flatten(sublist):
print("element:", element)
yield element
except TypeError:
print("nested :", nested)
yield nested print(list(flatten([[1, 2], [3, 4], [5], 6])))

输出:

nested : 1
element: 1
element: 1 nested : 2
element: 2
element: 2 nested : 3
element: 3
element: 3 nested : 4
element: 4
element: 4 nested : 5
element: 5
element: 5 nested : 6
element: 6
[1, 2, 3, 4, 5, 6]

python 中的迭代器和生成器简单介绍的更多相关文章

  1. python is、==区别;with;gil;python中tuple和list的区别;Python 中的迭代器、生成器、装饰器

    1. is 比较的是两个实例对象是不是完全相同,它们是不是同一个对象,占用的内存地址是否相同 == 比较的是两个对象的内容是否相等 2. with语句时用于对try except finally 的优 ...

  2. Python中的迭代器和生成器

    本文以实例详解了python的迭代器与生成器,具体如下所示: 1. 迭代器概述: 迭代器是访问集合元素的一种方式.迭代器对象从集合的第一个元素开始访问,直到所有的元素被访问完结束.迭代器只能往前不会后 ...

  3. python中的迭代器和生成器学习笔记总结

    生成器就是一个在行为上和迭代器非常类似的对象.   是个对象! 迭代,顾名思意就是不停的代换的意思,迭代是重复反馈过程的活动,其目的通常是为了逼近所需目标或结果.每一次对过程的重复称为一次“迭代”,而 ...

  4. python中的迭代器与生成器

    迭代器 迭代器的引入 假如我现在有一个列表l=['a','b','c','d','e'],我想取列表中的内容,那么有几种方式? 1.通过索引取值 ,如了l[0],l[1] 2.通过for循环取值 fo ...

  5. 终于理解Python中的迭代器和生成器了!

    迭代器和生成器 目录 迭代器和生成器 可迭代对象和迭代器 基础概念 判断 for循环本质 不想用for循环迭代了,如何使用迭代器? 列表推导式 生成器Generator 概念 如何实现和使用? 生成器 ...

  6. Python中的装饰器的简单介绍02

    这篇博文转载自伯乐在线的12步轻松搞定python装饰器,重构成python3. 1. 函数 在python中,函数通过def关键字.函数名和可选的参数列表定义.通过return关键字返回值.我们举例 ...

  7. Python中的迭代器、生成器

    from collections import Iterable, Iterator 1. 可迭代(iterable)对象 参考官网链接 class I: def __init__(self, v): ...

  8. Python中的迭代器、生成器、装饰器

    1. 迭代器  1 """ 2 iterator 3 迭代器协议: 对象必须提供一个next()方法,执行该方法要么返回迭代中的下一项,要么引起一个StopIterati ...

  9. Python中的装饰器的简单介绍01

    一. 装饰器是什么? 简单来说,装饰器其实也就是一个函数,一个用来包装函数的函数,返回一个修改之后的函数对象,将其重新赋值原来的标识符,并永久丧失对原始函数对象的访问. 二.装饰器语法 (1)无参数装 ...

随机推荐

  1. IoC容器-Bean管理注解方式(组件扫描配置)

    4,开启组件扫描细节配置

  2. python02day

    回顾 1.编译型和解释型 编译型:一次性编译成二进制,再执行 执行效率高,但不能跨平台,开发效率低 代表语言:C 解释型:逐行解释成二进制,再执行 可以跨平台,开发效率高,但执行效率低 代表语言:py ...

  3. HTML 基础2

    当浏览器读到一个样式表,它就会按照这个样式表来对文档进行格式化.有以下三种方式来插入样式表: 外部样式表 内部样式 内联样式 外部样式表 当样式需要被应用到很多页面的时候,外部样式表将是理想的选择.使 ...

  4. Python中列表操作函数append的浅拷贝问题

    L=int(input())#L位数N=int(input())#N进制row=[]list1=[]for i in range(1,N): row.append(1)list1.append(row ...

  5. Xml的一些基本概念(摘抄自w3school.com.cn)

    一个Xml的文档示例: 点击查看代码 <?xml version="1.0" encoding="ISO-8859-1"?> <note> ...

  6. ApacheCN 人工智能知识树 v1.0

    贡献者:飞龙 版本:v1.0 最近总是有人问我,把 ApacheCN 这些资料看完一遍要用多长时间,如果你一本书一本书看的话,的确要用很长时间.但我觉得这是非常麻烦的,因为每本书的内容大部分是重复的, ...

  7. 【源码】Redis Server启动过程

    本文基于社区版Redis 4.0.8       1. 初始化参数配置 由函数initServerConfig()实现,具体操作就是给配置参数赋初始化值: //设置时区 setlocale(LC_CO ...

  8. AT [ABC176F] Brave CHAIN

    首先可以发现这样一个事实:在每次操作当中,都有三张牌是已经固定的,只有两张牌是不确定的,于是我们可以发下每一次操作的状态可以简单的使用这两张牌来描述,于是可以考虑令 \(dp_{i, j, k}\) ...

  9. 使用estimatedRowHeight的优缺点

    使用estimatedRowHeight的优缺点 1.优点 1> 可以降低tableView:heightForRowAtIndexPath:方法的调用频率 2> 将[计算cell高度的操 ...

  10. js-小知识点

    强类型定义语言和弱类型定义语言1)强类型定义语言: 强制数据类型定义的语言.也就是说,一旦一个变量被指定了某个数据类型,如果不经过强制转换,那么它就永远是这个数据类型了.举个例子:如果你定义了一个整型 ...