python3-cookbook笔记:第四章 迭代器与生成器
python3-cookbook中每个小节以问题、解决方案和讨论三个部分探讨了Python3在某类问题中的最优解决方式,或者说是探讨Python3本身的数据结构、函数、类等特性在某类问题上如何更好地使用。这本书对于加深Python3的理解和提升Python编程能力的都有显著帮助,特别是对怎么提高Python程序的性能会有很好的帮助,如果有时间的话强烈建议看一下。
本文为学习笔记,文中的内容只是根据自己的工作需要和平时使用写了书中的部分内容,并且文中的示例代码大多直接贴的原文代码,当然,代码多数都在Python3.6的环境上都验证过了的。不同领域的编程关注点也会有所不同,有兴趣的可以去看全文。
python3-cookbook:https://python3-cookbook.readthedocs.io/zh_CN/latest/index.html
4.2 代理迭代
如果想要迭代一个不可迭代对象,只需要为这个对象定义一个__iter__()方法即可,__iter__()方法必须返回一个实现了__next__()方法的迭代器对象。
class Node:
"""Node类似一个树节点"""
def __init__(self, value):
self._value = value
self._children = [] def __repr__(self):
return 'Node({!r})'.format(self._value) def add_child(self, node):
self._children.append(node) def __iter__(self):
# iter(s)只是简单的通过调用s.__iter__()方法来返回对应的迭代器对象,就跟len(s)会调用s.__len__()原理是一样的
return iter(self._children) if __name__ == '__main__':
root = Node(0)
child1 = Node(1)
child2 = Node(2)
root.add_child(child1)
root.add_child(child2)
# 输出当前节点下其他节点的打印值
for ch in root:
print(ch)
Node(1)
Node(2)
4.4 实现迭代器协议
想在迭代某个对象时按照自己的方式来迭代,最简单的方法就是使用yield定义一个生成器函数,但是需要注意的是,在迭代操作时,如果不是使用for循环,就需要先使用iter()函数转换一下,再去迭代它。比如以下示例代码中在树形结构中定义一个深度优先的生成器函数:
class Node:
"""Node类似一个树节点""" def __init__(self, value):
self._value = value
self._children = [] def __repr__(self):
return 'Node({!r})'.format(self._value) def add_child(self, node):
self._children.append(node) def __iter__(self):
# 返回一个可以迭代子节点的迭代器
return iter(self._children) def depth_first(self):
"""深度优先遍历节点"""
# 使用yield定义一个生成器
yield self
for c in self:
# 注意这里是yield from
yield from c.depth_first() if __name__ == '__main__':
root = Node(0)
child1 = Node(1)
child2 = Node(2)
root.add_child(child1)
root.add_child(child2)
child1.add_child(Node(3))
child1.add_child(Node(4))
child2.add_child(Node(5))
# 以深度优先原则遍历节点
for ch in root.depth_first():
print(ch)
Node(0)
Node(1)
Node(3)
Node(4)
Node(2)
Node(5)
4.7 迭代器切片
想要对迭代对象切片,或者说只想要其中某一段,可以使用itertools.islice,但是需要注意的是这样会消耗掉这个迭代器,之后就不能使用了,因为迭代器是不可逆的。
>>> def count(n):
while True:
yield n
n += 1 >>> c = count(0)
>>> c[10:20]
Traceback (most recent call last):
File "<pyshell#105>", line 1, in <module>
c[10:20]
TypeError: 'generator' object is not subscriptable
>>> import itertools
>>> for x in itertools.islice(c, 10, 20):
print(x) 10
11
12
13
14
15
16
17
18
19
>>>
4.8 跳过可迭代对象的开始部分
在遍历一个可迭代对象时,想要跳过开始的某些元素,可以使用itertools.dropwhile,为它传入一个函数和可迭代对象,如果知道确切的索引位置,也可以使用itertools.islice。
>>> from itertools import dropwhile, islice
>>> items = ['a', 'b', 'c', 1, 4, 10, 15]
>>> for x in dropwhile(lambda i: isinstance(i, str), items):
print(x) 1
4
10
15
>>> for x in islice(items, 3, None):
print(x) 1
4
10
15
>>>
4.11 同时迭代多个序列
内置函数zip的使用有时候很方便,但是它只会遍历到最短的那个序列完就结束了,如果想要遍历完最长的那个序列,可以使用itertools.zip_longest()。
>>> a = [1, 2, 3]
>>> b = ['w', 'x', 'y', 'z']
>>> for i in zip(a,b):
print(i) (1, 'w')
(2, 'x')
(3, 'y')
>>> from itertools import zip_longest
>>> for i in zip_longest(a, b):
print(i) (1, 'w')
(2, 'x')
(3, 'y')
(None, 'z')
>>>
4.12 不同集合上元素的迭代
想要遍历多个可迭代对象中的元素,但又不想单独遍历每个对象,或者把它们都整合在一个对象中再遍历,此时可以使用itertools.chain()。
>>> from itertools import chain
>>> a = [1, 2, 3, 4]
>>> b = ['x', 'y', 'z']
>>> for x in chain(a, b):
print(x) 1
2
3
4
x
y
z
>>>
4.14 展开嵌套的序列
展开嵌套的序列,这个问题或许有其他的解决方式,但文中使用递归生成器的方式还是很很不错的。
from collections import Iterable def flatten(items, ignore_types=(str, bytes)):
for x in items:
if isinstance(x, Iterable) and not isinstance(x, ignore_types):
yield from flatten(x)
else:
yield x items = [1, 2, [3, 4, [5, 6], 7], 8]
for x in flatten(items):
print(x)
1
2
3
4
5
6
7
8
4.15 顺序迭代合并后的排序迭代对象
你有多个可迭代对象,想要将它们合并排序后遍历里面的元素,那么可以使用heapq.merge(*iterables, key=None, reverse=False),但是需要注意,使用这个函数前每个可迭代对象都要预先排序好,因为这个函数只是每次从多个序列的第一个元素中选出最小或最大的元素。并且因为它是可迭代的,意味着它可以处理非常长的序列而不用担心内存消耗。
>>> import heapq
>>> a = [1, 4, 7, 10] # 预先排好序的序列
>>> b = [2, 5, 6, 11]
>>> for c in heapq.merge(a, b):
print(c) 1
2
4
5
6
7
10
11
>>>
4.16 迭代器代替while无限循环
某些情况下可以使用iter创建一个迭代器来替换while循环,iter函数它接受一个可选的 callable 对象和一个标记(结尾)值作为输入参数。当以这种方式使用iter的时候,它会创建一个迭代器, 这个迭代器会不断调用 callable 对象直到返回值和标记值相等为止。虽然文中并没有说这两种方式在性能上有什么差别,但是从代码编写上看,iter的方式会更加优雅些。
CHUNKSIZE = 8192 def reader(s):
while True:
# 接收数据
data = s.recv(CHUNKSIZE)
if data == b'':
break
# 处理数据
process_data(data)
def reader2(s):
for data in iter(lambda: s.recv(CHUNKSIZE), b''):
# 处理数据
process_data(data)
python3-cookbook笔记:第四章 迭代器与生成器的更多相关文章
- Android群英传笔记——第四章:ListView使用技巧
Android群英传笔记--第四章:ListView使用技巧 最近也是比较迷茫,但是有一点点还是要坚持的,就是学习了,最近离职了,今天也是继续温习第四章ListView,也拖了其实也挺久的了,list ...
- 《Linux内核设计与实现》第八周读书笔记——第四章 进程调度
<Linux内核设计与实现>第八周读书笔记——第四章 进程调度 第4章 进程调度35 调度程序负责决定将哪个进程投入运行,何时运行以及运行多长时间,进程调度程序可看做在可运行态进程之间分配 ...
- 《Linux内核设计与实现》 第八周读书笔记 第四章 进程调度
20135307 张嘉琪 第八周读书笔记 第四章 进程调度 调度程序负责决定将哪个进程投入运行,何时运行以及运行多长时间,进程调度程序可看做在可运行态进程之间分配有限的处理器时间资源的内核子系统.只有 ...
- 《Linux内核分析》读书笔记(四章)
<Linux内核分析>读书笔记(四章) 标签(空格分隔): 20135328陈都 第四章 进程调度 调度程序负责决定将哪个进程投入运行,何时运行以及运行多长时间,进程调度程序可看做在可运行 ...
- 4 Visual Effects 视觉效果 读书笔记 第四章
4 Visual Effects 视觉效果 读书笔记 第四章 Well, circles and ovals are good, but how about drawing r ...
- 重温《STL源码剖析》笔记 第四章
源码之前,了无秘密 ——侯杰 序列式容器 关联式容器 array(build in) RB-tree vector set heap map priority-queue multiset li ...
- 鸟哥的Linux私房菜笔记第四章
前言 对着<鸟哥的Linux私房菜-基础版>做了简化笔记.不想让自己知其然而不知其所然.所以写个博客让自己好好巩固一下,当然不可能把书中的内容全部写下来.在这里就简化一点把命令写下来. 让 ...
- 《Linux内核设计与实现》读书笔记 第四章 进程调度
第四章进程调度 进程调度程序可看做在可运行太进程之间分配有限的处理器时间资源的内核子系统.调度程序是多任务操作系统的基础.通过调度程序的合理调度,系统资源才能最大限度地发挥作用,多进程才会有并发执行的 ...
- 《利用python进行数据分析》读书笔记--第四章 numpy基础:数组和矢量计算
http://www.cnblogs.com/batteryhp/p/5000104.html 第四章 Numpy基础:数组和矢量计算 第一部分:numpy的ndarray:一种多维数组对象 实话说, ...
随机推荐
- 在vue中使用jquery
首先默认你已经有了一个vue程序,如果你想在vue中使用jquery,那么请继续阅读. 当然,加入你没有一个vue程序,这里也给出创建一个vue程序的命令.当然,你肯定装了vue-cli,不然你不会点 ...
- 【学习笔记】Linux基础(二):Linux的基本操作
二.Linux的基本操作 0.正确的开关机操作 开机和登陆: 安全起见,一般不使用最高权限的root账户登入系统,光立系统时再使用 登录时为login程序提供账户名和密码即可,密码不会被显示,登陆后显 ...
- ProxySQL 基础篇
1.ProxySQL 介绍 ProxySQL 是基于 MySQL 的一款开源的中间件的产品,是一个灵活的 MySQL 代理层,可以实现读写分离,支持 Query 路由功能,支持动态指定某个 SQL 进 ...
- Magicodes.IE在Docker中使用
Magicodes.IE在Docker中使用 更新日志 2019.02.13 [Nuget]版本更新到2.0.2 [导入]修复单列导入的Bug,单元测试"OneColumnImporter_ ...
- Web框架之Gin介绍及使用
Gin是一个用Go语言编写的web框架.它是一个类似于martini但拥有更好性能的API框架, 由于使用了httprouter,速度提高了近40倍. 如果你是性能和高效的追求者, 你会爱上Gin. ...
- 脚本、脚本语言、shell脚本
脚本是批处理文件的延伸,是一种纯文本保存的程序,一般来说的计算机脚本程序是确定的一系列控制计算机进行运算操作动作的组合,在其中可以实现一定的逻辑分支等.脚本程序相对一般程序开发来说比较接近自然语言,可 ...
- 用例建模Use Case Modeling——传感器智能分析引擎
系统用例分析 我的工程实践小组做的课题主要是实现传感器数据采集平台的设计与开发.该搜索引擎完成对传感器数据的采集和发布,企业可以在平台上上传自己的传感器数据信息,同时也能够浏览市面上其他传感器信息,以 ...
- Codeforces 1156E Special Segments of Permutation(启发式合并)
题意: 给一个n的排列,求满足a[l]+a[r]=max(l,r)的(l,r)对数,max(l,r)指的是l到r之间的最大a[p] n<=2e5 思路: 先用单调栈处理出每个点能扩展的l[i], ...
- 2、HotSpot虚拟机对象探秘
基于使用优先的原则,以常用的虚拟机HotSpot和常用的内存区域Java堆为例,深入探讨HotSpot虚拟机在Java堆中对象分配.布局和访问的全过程. 1.对象的创建 划分可用空间 在语言层面上,创 ...
- False注入,以及SQL注入技巧总结
title: False注入,以及SQL注入技巧总结 date: 2017-04-25 00:23:31 tags: ['SQL注入'] --- 利用False我们可以绕过一些特定的WAF以及一些未来 ...