理解Python的迭代器
首先,廖雪峰老师的教程中解释了迭代器和生成器,这篇文章只是补充和我个人的总结。
什么是迭代
可以直接作用于for循环的对象统称为可迭代对象(Iterable)。
可以被next()函数调用并不断返回下一个值的对象称为迭代器(Iterator)。
所有的Iterable均可以通过内置函数iter()来转变为Iterator。
对迭代器来讲,有一个__next__()
就够了。在你使用for 和 in 语句时,程序就会自动调用即将被处理的对象的迭代器对象,然后使用它的__next__()
方法,直到监测到一个StopIteration异常。
>>> L = [1,2,3]
>>> [x**2 for x in L]
[1, 4, 9]
>>> next(L)
Traceback (most recent call last):
File "<stdin>", line 1, in <module>
TypeError: 'list' object is not an iterator
>>> I=iter(L)
>>> next(I)
1
>>> next(I)
2
>>> next(I)
3
>>> next(I)
Traceback (most recent call last):
File "<stdin>", line 1, in <module>
StopIteration
上面例子中,列表L可以被for进行循环但是不能被内置函数next()用来查找下一个值,所以L是Iterable。
L通过iter进行包装后设为I,I可以被next()用来查找下一个值,所以I是Iterator。
题外话:
- 内置函数iter()仅仅是调用了对象的
__iter__()
方法,所以list对象内部一定存在方法__iter__()
- 内置函数next()仅仅是调用了对象的
__next__()
方法,所以list对象内部一定不存在方法__next__()
,但是Itrator中一定存在这个方法。 - for循环内部事实上就是先调用iter()把Iterable变成Iterator在进行循环迭代的。
>>> L = [4,5,6]
>>> I = L.__iter__()
>>> L.__next__()
Traceback (most recent call last):
File "<stdin>", line 1, in <module>
AttributeError: 'list' object has no attribute '__next__'
>>> I.__next__()
4
>>> from collections import Iterator, Iterable
>>> isinstance(L, Iterable)
True
>>> isinstance(L, Iterator)
False
>>> isinstance(I, Iterable)
True
>>> isinstance(I, Iterator)
True
>>> [x**2 for x in I]
[25, 36]
- Iterator继承自Iterable,从下面的测试中可以很方便的看到Iterator包含
__iter__()
和__next__()
方法,而Iteratble仅仅包含__iter__()
。
>>> from collections import Iterator, Iterable
>>> help(Iterator)
Help on class Iterator:
class Iterator(Iterable)
| Method resolution order:
| Iterator
| Iterable
| builtins.object
|**注解:从这里可以看出Iterable继承自object, Iterator继承自Iterable。
| Methods defined here:
|
| __iter__(self)
|
| __next__(self)
| Return the next item from the iterator. When exhausted, raise StopIteration
......
>>> help(Iterable)
Help on class Iterable:
class Iterable(builtins.object)
| Methods defined here:
|
| __iter__(self)
......
iterable需要包含有__iter__()方法用来返回iterator,而iterator需要包含有__next__()方法用来被循环
如果我们自己定义迭代器,只要在类里面定义一个 __iter__()
函数,用它来返回一个带 __next__()
方法的对象就够了。
直接上代码
class Iterable:
def __iter__(self):
return Iterator()
class Iterator:
def __init__(self):
self.start=-1
def __next__(self):
self.start +=2
if self.start >10:
raise StopIteration
return self.start
I = Iterable()
for i in I:
print(i)
上面的代码实现的是找到10以内的奇数,代码中的类名可以随便取,不是一定需要使用我上面提供的类名的。
如果在Iterator的__next__
方法中没有实现StopIteration异常,那么则是表示的全部奇数,那么需要在调用的时候设置退出循环的条件。
class Iterable:
def __iter__(self):
return Iterator()
class Iterator:
def __init__(self):
self.start=-1
def __next__(self):
self.start +=2
return self.start
I = Iterable()
for count, i in zip(range(5),I): #也可以用内置函数enumerate来实现计数工作。
print(i)
我们通过range来实现打印多少个元素,这里表示打印5个元素,返回结果和上面一致。
当然,我们可以把这两个类合并在一起,这样实现程序的简练。
最终版本如下
class Iterable:
def __iter__(self):
return self
def __init__(self):
self.start=-1
def __next__(self):
self.start +=2
if self.start >10:
raise StopIteration
return self.start
I = Iterable()
for i in I:
print(i)
复制迭代器
迭代器是一次性消耗品,使用完了以后就空了,请看。
>>> L=[1,2,3]
>>> I=iter(L)
>>> for i in I:
... print(i, end='-')
...
1-2-3-
>>>next(I)
Traceback (most recent call last):
File "<stdin>", line 1, in <module>
StopIteration
当循环以后就殆尽了,再次使用调用时会引发StopIteration异常。
我们想通过直接赋值的形式把迭代器保存起来,可以下次使用。
但是通过下面的范例可以看出来,根本不管用。
>>> I=iter(L)
>>> J=I
>>> next(I)
1
>>> next(J)
2
>>> next(I)
3
>>> next(J)
Traceback (most recent call last):
File "<stdin>", line 1, in <module>
StopIteration
那怎么样才能达到我们要的效果呢?
我们需要使用copy包中的deepcopy了,请看下面:
>>> import copy
>>> I=iter(L)
>>> J=copy.deepcopy(I)
>>> next(I)
1
>>> next(I)
2
>>> next(J)
1
补充:迭代器不能向后移动, 不能回到开始。
所以需要做一些特殊的事情才能实现向后移动等功能。
以上代码均在Python 3.4 中测试通过。
日志:
- 8月13日完成
- 8月14日添加关于Iterator, Iterable的更多解释在题外话的第4点。
理解Python的迭代器的更多相关文章
- 理解Python的迭代器(转)
原文地址: http://python.jobbole.com/81916/ 另外一篇文章: http://www.cnblogs.com/kaituorensheng/p/3826911.html ...
- 完全理解 Python 迭代对象、迭代器、生成器(转)
完全理解 Python 迭代对象.迭代器.生成器 本文源自RQ作者的一篇博文,原文是Iterables vs. Iterators vs. Generators » nvie.com,俺写的这篇文章是 ...
- 完全理解 Python 迭代对象、迭代器、生成器
完全理解 Python 迭代对象.迭代器.生成器 2017/05/29 · 基础知识 · 9 评论 · 可迭代对象, 生成器, 迭代器 分享到: 原文出处: liuzhijun 本文源自RQ作者 ...
- 怎么理解Python迭代器与生成器?
怎么理解Python迭代器与生成器?在Python中,使用for ... in ... 可以对list.tuple.set和dict数据类型进行迭代,可以把所有数据都过滤出来.如下: ...
- Python:迭代器的简单理解
一.什么是迭代器 迭代,顾名思义就是重复做一些事很多次(就现在循环中做的那样).迭代器是实现了__next__()方法的对象(这个方法在调用时不需要任何参数),它是访问可迭代序列的一种方式,通常其从序 ...
- python之迭代器与生成器
python之迭代器与生成器 可迭代 假如现在有一个列表,有一个int类型的12345.我们循环输出. list=[1,2,3,4,5] for i in list: print(i) for i i ...
- 第十六篇 Python之迭代器与生成器
一.迭代器 一. 递归和迭代 生活实例说明什么是递归和迭代 A想去腾达大厦,问B怎么走路,B 说我不知道,我给你问问C,C也不知道,C又去问D,D知道,把路告诉了C,C又告诉B,B最后告诉A, 这就是 ...
- 搞清楚 Python 的迭代器、可迭代对象、生成器
很多伙伴对 Python 的迭代器.可迭代对象.生成器这几个概念有点搞不清楚,我来说说我的理解,希望对需要的朋友有所帮助. 1 迭代器协议 迭代器协议是核心,搞懂了这个,上面的几个概念也就很好理解了. ...
- 用一个简单的例子来理解python高阶函数
============================ 用一个简单的例子来理解python高阶函数 ============================ 最近在用mailx发送邮件, 写法大致如 ...
随机推荐
- C# - 系统类 - String类
String类 ns:System String类封装了一系列不能被改变的Unicode字符序列 字符属于引用类型 但它又具有值类型的行为 固定不变意味着 一旦在托管堆中分配了一块内存来存储字符 字符 ...
- AIDL通信原理
AIDL (Android Interface Definition Language),通过定义通信接口来实现进程间通信.这是Google提供的一种在安卓应用进程间通信的工具.所以要了解AIDL的通 ...
- mysql 中间件 分析
360的Atlas 1.读写分离 2.从库负载均衡 3.IP过滤 4.自动分表 5.DBA可平滑上下线DB 6.自动摘除宕机的DB altas 在10000/s的请求量级应该是毫无问题的 https: ...
- CentOS7安装小小输入法
添加epel源 $ sudo yum install epel-release 安装centos7缺失依赖包 libwayland-client $ sudo rpm -Uvh ftp://ftp.p ...
- php插件机制实现原理
插件,亦即Plug-in,是指一类特定的功能模块(通常由第三方开发者实现) 它的特点: 1. 随时安装.卸载.激活.禁用 2. 无论什么状态都不影响系统核心模块的运行, 3. 是一种非侵入式的模块化设 ...
- select unit_timestamp(); 和select unit_timestamp("1970-1-1 08:00:00")和 select from_unixtime(1)
偶然看到MySQL的一个函数 unix_timestamp(),不明就里,于是就试验了一番. unix_timestamp()函数的作用是返回一个确切的时间点的UNIX时间戳,这个Unix时间戳是一个 ...
- 注册一个比较大小Handlebars
1.显示的数据 var datas = { id:"number" } 2.temp模板 <script id="template" type=" ...
- jQuery动态效果实例
jQuery常见的动态效果: 隐藏/显示效果: 1.(1):隐藏,显示:通过 jQuery,使用 hide() 和 show() 方法可以用来隐藏和显示 HTML 元素. (2):隐藏/显示的速度: ...
- java之泛型潜在错误
如果使用带泛型声明的类时,没有传入类型参数,那么这个类型参数默认是声明该参数时指定的第一个上限类型,这个类型参数被称为raw type(原始类型 ). eg: public class Lis ...
- 暑假集训(2)第二弹 ----- The Suspects(POJ1611)
B - The Suspects Crawling in process... Crawling failed Time Limit:1000MS Memory Limit:20000KB ...