python3-cookbook笔记：第四章迭代器与生成器

python3-cookbook中每个小节以问题、解决方案和讨论三个部分探讨了Python3在某类问题中的最优解决方式，或者说是探讨Python3本身的数据结构、函数、类等特性在某类问题上如何更好地使用。这本书对于加深Python3的理解和提升Python编程能力的都有显著帮助，特别是对怎么提高Python程序的性能会有很好的帮助，如果有时间的话强烈建议看一下。
本文为学习笔记，文中的内容只是根据自己的工作需要和平时使用写了书中的部分内容，并且文中的示例代码大多直接贴的原文代码，当然，代码多数都在Python3.6的环境上都验证过了的。不同领域的编程关注点也会有所不同，有兴趣的可以去看全文。
python3-cookbook：https://python3-cookbook.readthedocs.io/zh_CN/latest/index.html

4.2 代理迭代

如果想要迭代一个不可迭代对象，只需要为这个对象定义一个__iter__()方法即可，__iter__()方法必须返回一个实现了__next__()方法的迭代器对象。

class Node:

    """Node类似一个树节点"""

    def __init__(self, value):

        self._value = value

        self._children = []

    def __repr__(self):

        return 'Node({!r})'.format(self._value)

    def add_child(self, node):

        self._children.append(node)

    def __iter__(self):

        # iter(s)只是简单的通过调用s.__iter__()方法来返回对应的迭代器对象，就跟len(s)会调用s.__len__()原理是一样的

        return iter(self._children)

if __name__ == '__main__':

    root = Node(0)

    child1 = Node(1)

    child2 = Node(2)

    root.add_child(child1)

    root.add_child(child2)

    # 输出当前节点下其他节点的打印值

    for ch in root:

        print(ch)

Node(1)

Node(2)

4.4 实现迭代器协议

想在迭代某个对象时按照自己的方式来迭代，最简单的方法就是使用yield定义一个生成器函数，但是需要注意的是，在迭代操作时，如果不是使用for循环，就需要先使用iter()函数转换一下，再去迭代它。比如以下示例代码中在树形结构中定义一个深度优先的生成器函数：

class Node:

    """Node类似一个树节点"""

    def __init__(self, value):

        self._value = value

        self._children = []

    def __repr__(self):

        return 'Node({!r})'.format(self._value)

    def add_child(self, node):

        self._children.append(node)

    def __iter__(self):

        # 返回一个可以迭代子节点的迭代器

        return iter(self._children)

    def depth_first(self):

        """深度优先遍历节点"""

        # 使用yield定义一个生成器

        yield self

        for c in self:

            # 注意这里是yield from

            yield from c.depth_first()

if __name__ == '__main__':

    root = Node(0)

    child1 = Node(1)

    child2 = Node(2)

    root.add_child(child1)

    root.add_child(child2)

    child1.add_child(Node(3))

    child1.add_child(Node(4))

    child2.add_child(Node(5))

    # 以深度优先原则遍历节点

    for ch in root.depth_first():

        print(ch)

Node(0)

Node(1)

Node(3)

Node(4)

Node(2)

Node(5)

4.7 迭代器切片

想要对迭代对象切片，或者说只想要其中某一段，可以使用itertools.islice，但是需要注意的是这样会消耗掉这个迭代器，之后就不能使用了，因为迭代器是不可逆的。

>>> def count(n):

    while True:

        yield n

        n += 1

>>> c = count(0)

>>> c[10:20]

Traceback (most recent call last):

  File "<pyshell#105>", line 1, in <module>

    c[10:20]

TypeError: 'generator' object is not subscriptable

>>> import itertools

>>> for x in itertools.islice(c, 10, 20):

    print(x)

10

11

12

13

14

15

16

17

18

19

>>>

4.8 跳过可迭代对象的开始部分

在遍历一个可迭代对象时，想要跳过开始的某些元素，可以使用itertools.dropwhile，为它传入一个函数和可迭代对象，如果知道确切的索引位置，也可以使用itertools.islice。

>>> from itertools import dropwhile, islice

>>> items = ['a', 'b', 'c', 1, 4, 10, 15]

>>> for x in dropwhile(lambda i: isinstance(i, str), items):

    print(x)

1

4

10

15

>>> for x in islice(items, 3, None):

    print(x)

1

4

10

15

>>>

4.11 同时迭代多个序列

内置函数zip的使用有时候很方便，但是它只会遍历到最短的那个序列完就结束了，如果想要遍历完最长的那个序列，可以使用itertools.zip_longest()。

>>> a = [1, 2, 3]

>>> b = ['w', 'x', 'y', 'z']

>>> for i in zip(a,b):

    print(i)

(1, 'w')

(2, 'x')

(3, 'y')

>>> from itertools import zip_longest

>>> for i in zip_longest(a, b):

    print(i)

(1, 'w')

(2, 'x')

(3, 'y')

(None, 'z')

>>>

4.12 不同集合上元素的迭代

想要遍历多个可迭代对象中的元素，但又不想单独遍历每个对象，或者把它们都整合在一个对象中再遍历，此时可以使用itertools.chain()。

>>> from itertools import chain

>>> a = [1, 2, 3, 4]

>>> b = ['x', 'y', 'z']

>>> for x in chain(a, b):

    print(x)

1

2

3

4

x

y

z

>>>

4.14 展开嵌套的序列

展开嵌套的序列，这个问题或许有其他的解决方式，但文中使用递归生成器的方式还是很很不错的。

from collections import Iterable

def flatten(items, ignore_types=(str, bytes)):

    for x in items:

        if isinstance(x, Iterable) and not isinstance(x, ignore_types):

            yield from flatten(x)

        else:

            yield x

items = [1, 2, [3, 4, [5, 6], 7], 8]

for x in flatten(items):

    print(x)

4.15 顺序迭代合并后的排序迭代对象

你有多个可迭代对象，想要将它们合并排序后遍历里面的元素，那么可以使用heapq.merge(*iterables, key=None, reverse=False)，但是需要注意，使用这个函数前每个可迭代对象都要预先排序好，因为这个函数只是每次从多个序列的第一个元素中选出最小或最大的元素。并且因为它是可迭代的，意味着它可以处理非常长的序列而不用担心内存消耗。

>>> import heapq

>>> a = [1, 4, 7, 10]  # 预先排好序的序列

>>> b = [2, 5, 6, 11]

>>> for c in heapq.merge(a, b):

    print(c)

1

2

4

5

6

7

10

11

>>>

4.16 迭代器代替while无限循环

某些情况下可以使用iter创建一个迭代器来替换while循环，iter函数它接受一个可选的 callable 对象和一个标记(结尾)值作为输入参数。当以这种方式使用iter的时候，它会创建一个迭代器，这个迭代器会不断调用 callable 对象直到返回值和标记值相等为止。虽然文中并没有说这两种方式在性能上有什么差别，但是从代码编写上看，iter的方式会更加优雅些。

CHUNKSIZE = 8192

def reader(s):

    while True:

        # 接收数据

        data = s.recv(CHUNKSIZE)

        if data == b'':

            break

        # 处理数据

        process_data(data)

def reader2(s):

    for data in iter(lambda: s.recv(CHUNKSIZE), b''):

        # 处理数据

        process_data(data)

python3-cookbook笔记：第四章迭代器与生成器的更多相关文章

Android群英传笔记——第四章：ListView使用技巧
Android群英传笔记--第四章:ListView使用技巧最近也是比较迷茫,但是有一点点还是要坚持的,就是学习了,最近离职了,今天也是继续温习第四章ListView,也拖了其实也挺久的了,list ...
《Linux内核设计与实现》第八周读书笔记——第四章进程调度
<Linux内核设计与实现>第八周读书笔记——第四章进程调度第4章进程调度35 调度程序负责决定将哪个进程投入运行,何时运行以及运行多长时间,进程调度程序可看做在可运行态进程之间分配 ...
《Linux内核设计与实现》第八周读书笔记第四章进程调度
20135307 张嘉琪第八周读书笔记第四章进程调度调度程序负责决定将哪个进程投入运行,何时运行以及运行多长时间,进程调度程序可看做在可运行态进程之间分配有限的处理器时间资源的内核子系统.只有 ...
《Linux内核分析》读书笔记（四章）
<Linux内核分析>读书笔记(四章) 标签(空格分隔): 20135328陈都第四章进程调度调度程序负责决定将哪个进程投入运行,何时运行以及运行多长时间,进程调度程序可看做在可运行 ...
4 Visual Effects 视觉效果读书笔记第四章
4 Visual Effects 视觉效果读书笔记第四章 Well, circles and ovals are good, but how about drawing r ...
重温《STL源码剖析》笔记第四章
源码之前,了无秘密 ——侯杰序列式容器关联式容器 array(build in) RB-tree vector set heap map priority-queue multiset li ...
鸟哥的Linux私房菜笔记第四章
前言对着<鸟哥的Linux私房菜-基础版>做了简化笔记.不想让自己知其然而不知其所然.所以写个博客让自己好好巩固一下,当然不可能把书中的内容全部写下来.在这里就简化一点把命令写下来. 让 ...
《Linux内核设计与实现》读书笔记第四章进程调度
第四章进程调度进程调度程序可看做在可运行太进程之间分配有限的处理器时间资源的内核子系统.调度程序是多任务操作系统的基础.通过调度程序的合理调度,系统资源才能最大限度地发挥作用,多进程才会有并发执行的 ...
《利用python进行数据分析》读书笔记--第四章 numpy基础：数组和矢量计算
http://www.cnblogs.com/batteryhp/p/5000104.html 第四章 Numpy基础:数组和矢量计算第一部分:numpy的ndarray:一种多维数组对象实话说, ...

随机推荐

orcle导入大数据文件
0,创建ctl文件内容为 OPTIONS (skip=0) LOAD DATA CHARACTERSET 'UTF8' INFILE 'F:\anhui_data\20180814\shangh ...
Powershell下git中文乱码
问题使用git log查看提交历史, 发现中文的部分出现了乱码, 如图解决方案 powershell中输入下面的命令 git config --global core.quotepath fals ...
Android: Fragment编程指南
本文来自于www.lanttor.org Fragment代表了Activity里的一个行为,或者Activity UI的一部分.你可以在一个activity里构造多个Fragment,也可以在多个a ...
qt客户端程序使用svg图片资源的几种方法
直接使用svg格式文件资源的情况 1. 直接在UI控件属性面板中选择部分支持icon图标的控件的icon来源,这样图标可以显示 2.给toolbutton添加样式 qproperty-icon: ur ...
POJ_1006_中国剩余
http://poj.org/problem?id=1006 中国剩余定理用来解求模方程组,用到了逆元. 这题三个数互质,直接用扩展欧几里德可得逆元. #include<iostream> ...
CBAM（Convolutional Block Attention Module）使用指南
转自知乎这货就是基于 SE-Net [5]中的 Squeeze-and-Excitation module 来进行进一步拓展具体来说,文中把 channel-wise attention 看成是教 ...
Go语言实现：【剑指offer】矩阵覆盖
该题目来源于牛客网<剑指offer>专题. 我们可以用21的小矩形横着或者竖着去覆盖更大的矩形.请问用n个21的小矩形无重叠地覆盖一个2*n的大矩形,总共有多少种方法? 先放21,则f(n ...
Go语言实现：【剑指offer】和为S的连续正数序列
该题目来源于牛客网<剑指offer>专题. 小明很喜欢数学,有一天他在做数学作业时,要求计算出9~16的和,他马上就写出了正确答案是100.但是他并不满足于此,他在想究竟有多少种连续的正数 ...
一个工程中cpp文件的编译顺序
做了一个实验. 最后build失败,失败的原因是变量i被重定义了.原本按照我的思路,是不应该失败的.因为我用了条件编译,若先编译Source.cpp,则会#define __HEADER_H__并且定 ...
不用'+'完成a + b
这也是'+'底层运算原理: #include<bits/stdc++.h> using namespace std; int a,b; int main() { scanf("% ...

python3-cookbook笔记：第四章 迭代器与生成器

python3-cookbook笔记：第四章 迭代器与生成器的更多相关文章

随机推荐

热门专题

python3-cookbook笔记：第四章迭代器与生成器

python3-cookbook笔记：第四章迭代器与生成器的更多相关文章