解析、迭代和生成系列文章:https://www.cnblogs.com/f-ck-need-u/p/9832640.html


Python中的解析

Python支持各种解析(comprehension)操作,比如列表解析、集合解析、元组解析、字典解析。它们根据某些元素来创建(推导)出一个新的列表、集合、元组、字典等。所以有的地方也称为推导,比如列表推导、集合推导等。

下面是一个列表解析的示例:

  1. >>> [ i*2 for i in range(10) if i % 2 == 0 ]
  2. [0, 4, 8, 12, 16]

这里是列表解析,因为使用的中括号[ xxxx ],它表示根据条件推导出一个新的列表。Python中几种内置类型的解析规则为:

  • 如果使用的是中括号,表示列表解析
  • 如果使用的是大括号,表示集合解析
  • 如果使用的是大括号,且里面的元素是key:value模式,表示字典解析

注意:如果使用的是括号,表示的是生成器表达式,而不是解析。

例如:

  1. # 集合解析
  2. >>> { i*2 for i in "abcd"}
  3. {'aa', 'cc', 'dd', 'bb'}
  4. # 字典解析
  5. >>> { k:v for k,v in zip(("one","two","three"),(1,2,3)) }
  6. {'one': 1, 'two': 2, 'three': 3}
  7. >>> { k: k*2 for k in "abcd" }
  8. {'a': 'aa', 'b': 'bb', 'c': 'cc', 'd': 'dd'}

Python中还有其它解析模式,稍后会解释。

数学概念中的解析

参考:https://en.wikipedia.org/wiki/List_comprehension

计算机语言中的解析来自于数学概念中的集合描述(对应于集合解析)。如下图:

将此与下面的列表解析进行对应:

  1. [ i * 2 for i in range(10) if i % 2 == 0 ]

其中:

  • x ∈ N表示的是装元素的容器,这个容器里的元素是解析时被迭代的对象

    • 这对应于列表解析中的range(10),对于Python来说,只要是可迭代的数据对象,都可以作为元素的提供容器
  • x是变量,是容器中的元素
    • 对应于列表解析中的i
  • x² > 3表示的是谓词,是可选的条件判断式,用来筛选解析过程中的符合条件的元素
    • 这对应于列表解析中的if i % 2 == 0,注意,谓词部分是可选的
  • 2 * x表示的是外部表达式,用来生成新的列表/集合/字典/元组中的元素
    • 对应于列表解析中的i * 2
  • {}意味着外部表达式的元素所存放的容器是集合容器
    • 对应于列表解析中的[],表示新生成的元素是列表中的元素

解析操作是如何工作的

Python中的解析操作常用来生成各种数据容器,且生成的效率非常高,它在底层完全是以C的方式运行的。

在了解了数学中集合描述和解析的对应方式后,要理解解析的工作方式很简单,以列表解析为例。

首先用迭代工具for对容器中的元素进行迭代,每个元素都经过谓词进行筛选,对符合条件的元素执行外部表达式,每个外部表达式都生成一个新的元素,然后作为新列表的一个元素,从而推导出一个新的列表。

解析是一个表达式,在后面的文章中还会看到大部分解析可以写成等价的函数map、filter等函数式,但解析的逻辑要更清晰且更简洁。

与解析操作等价的普通循环

python中的解析行为由for这个迭代工具来迭代,它和普通的for循环逻辑一样,但用法稍有不同。从前面的示例中也可以看出解析操作的外部表达式部分在for关键字的前面,而普通for循环的表达式则是在for关键字后面。

解析操作也能由普通的循环来生成。例如:

  1. # for循环实现列表解析操作
  2. L1 = []
  3. for i in range(10):
  4. if i % 2 == 0 :
  5. L1.append(i * 2)
  6. # 列表解析
  7. L2 = [ i * 2 for i in range(10) if i % 2 == 0 ]
  8. print(L1)
  9. print(L2)

结果:

  1. [0, 4, 8, 12, 16]
  2. [0, 4, 8, 12, 16]

而且,解析操作比普通的for循环运行速度更快,解析操作在Python解释器中是完全使用C来运行的,而普通for循环则是在python VM中通过步进的方式运行的。一般来说,解析操作和map函数速度差不多(解释器中都是C的运行方式),它们都要比普通for快上1-2倍。特别是要生成的元素较多时,解析操作往往要比等价的普通循环快上一倍多。

用解析来操作文件

对于open()打开的文件,有一个readlines()函数可以将所有行读取到一个列表中,每一行都是这个列表中的一个元素。

以下是文件a.txt的文件内容:

  1. first line
  2. second line
  3. third line

通过readlines()读取a.txt:

  1. >>> f = open('a.txt')
  2. >>> lines = f.readlines()
  3. >>> lines
  4. ['first line\n', 'second line\n', 'third line\n']

这里每一个元素都包含了尾随换行符\n,这在编程时是非常令人厌恶的,因为不好控制是不是要自己添加一个换行符。所以,往往会对每一行都执行一个去除尾随换行符的操作,这可以通过列表解析来执行:

  1. >>> lines = [ line.rstrip() for line in lines ]
  2. >>> lines
  3. ['first line', 'second line', 'third line']

实际上,open()打开的文件对象是一个可迭代对象,可以直接进行迭代,所以也可以直接用于解析操作:

  1. >>> lines = [line.rstrip() for line in open('a.txt')]
  2. >>> lines
  3. ['first line', 'second line', 'third line']

看上去真的很简洁,而且很简单很方便,实际上这也很高效。

嵌套的解析

解析操作可以变得更加复杂,比如可以进行for嵌套。

  1. >>> [x + y for x in "abcd" for y in "ABCD"]
  2. ['aA', 'aB', 'aC', 'aD', 'bA', 'bB', 'bC', 'bD', 'cA', 'cB', 'cC', 'cD', 'dA', 'dB', 'dC', 'dD']

它等价于:

  1. L = []
  2. for x in "abcd":
  3. for y in "ABCD":
  4. L.append(x + y)

for嵌套的时候,每一个for中用于筛选元素的if语句都是可选的。

例如,下面的嵌套for解析中,使用偶数和奇数的组合:

  1. >>> [ (x,y) for x in range(5) if x % 2 == 0 for y in range(5) if y % 2 ==1 ]
  2. [(0, 1), (0, 3), (2, 1), (2, 3), (4, 1), (4, 3)]

这个解析表达式等价于:

  1. >>> L = []
  2. >>> for x in range(5):
  3. ... if x % 2 == 0:
  4. ... for y in range(5):
  5. ... if y % 2 == 1:
  6. ... L.append((x, y))
  7. [(0, 1), (0, 3), (2, 1), (2, 3), (4, 1), (4, 3)]

Python迭代和解析(1):列表解析的更多相关文章

  1. 《转》python学习(12)-列表解析

    转自 http://www.cnblogs.com/BeginMan/p/3164937.html 一.列表解析 列表解析来自函数式编程语言(haskell),语法如下: [expr for iter ...

  2. Python filter,map,lambda,reduce,列表解析

    filter用法 filter(func,seq) 将seq的元素逐一代入func,通过func的返回值来判断是保留还是过滤 >>> def foo(x): return x> ...

  3. python迭代器 生成器 三元运算 列表解析

    1.迭代器 迭代器是访问集合元素的一种方式.迭代器对象从集合的第一个元素开始访问,直到所有的元素被访问完结束.迭代器只能往前不会后退,不过这也没什么,因为人们很少在迭代途中往后退.另外,迭代器的一大优 ...

  4. Python高级特性:Python迭代、生成器、列表生成式

    迭代 给定一个list或tuple,我们可以通过for循环来遍历这个list或tuple,这种遍历称为迭代(Iteration). 在java和C语言中,迭代是通过循环list的下标来完成的,Pyth ...

  5. Python自学:第五章 列表解析

    # -*- coding: GBK -*- squares = [value**2 for value in range(1,11)] print(squares) 输出为: [1, 4, 9, 16 ...

  6. Python 迭代器之列表解析与生成器

     [TOC] 1. 列表解析 1.1 列表解析基础 列表解析把任意一个表达式应用到一个迭代对象中的元素 Python内置ord函数会返回一个字符的ASCII整数编码(chr函数是它的逆过程, 它将A ...

  7. 第4.4节 Python解析与推导:列表解析、字典解析、集合解析

    一.    引言 经过前几个章节的介绍,终于把与列表解析的前置内容介绍完了,本节老猿将列表解析.字典解析.集合解析进行统一的介绍. 前面章节老猿好几次说到了要介绍列表解析,但老猿认为涉及知识层面比较多 ...

  8. julia与python中的列表解析.jl

    julia与python中的列表解析.jl #=julia与python中的列表解析.jl 2016年3月16日 07:30:47 codegay julia是一门很年轻的科学计算语言 julia文档 ...

  9. for 循环新的写法==列表解析

    1. (for x in L1) 是一个可迭代对象: 2. 列表解析比for 循环快,列表解析的迭代在解释器内部是以C语言速度执行, 而不是手动python代码执行: (x+10 for x in L ...

  10. 对 Python 迭代的深入研究

    在程序设计中,通常会有 loop.iterate.traversal 和 recursion 等概念,他们各自的含义如下: 循环(loop),指的是在满足条件的情况下,重复执行同一段代码.比如 Pyt ...

随机推荐

  1. cadence焊盘及元件封装制作

    前面学习了元件封装的制作,由于琐碎事情的耽误,加上学习python,没有及时的总结这部分内容,现在做一个补充!

  2. 基于jQuery的控件:弹框

    ★页面展示 ★属性 属性 值 说明 默认值 div Object jQuery对象 $('body') width Number 控件的宽度 auto height Number 控件的高度 auto ...

  3. layui select使用问题

    1.需要引用form模板 layui.use(['form'], function () { var form = layui.form; }); 2.html代码 <div class=&qu ...

  4. oracle启动服务和监听

    1.故障问题:tomcat显示启动oracle数据库失败,数据库服务启动正常 操作1:重启tomcat查看错误信息 2:重启数据库服务 命令: (1) 启动Oracle服务 C:\Users\Admi ...

  5. JDK 1.8判断集合种的元素是否存在相同

    List<String> str=new ArrayList<>(); str.add("a"); str.add("a"); str. ...

  6. 前端基础之JS

    流程控制 if-else var a = 10; if (a > 5){ console.log("yes"); }else { console.log("no&q ...

  7. Delphi 开发手机 App 与其他工具之间的比较分析

    写在前头 关于各种手机App开发的工具,从2010年前后到现在已经在很多不同的场合介绍过,在元智大学.中台科技大学.德霖科技大学等不同学校的讲座.课程当中,都有类似的主题,所以对我来说,这个主题属于驾 ...

  8. JAVA小白开发环境配置(编译器为Idea)

    JDK配置 1.首先到官网下载最新版JDK:Oracle官网下载 Accept License Agreement–>下载适合自己pc版本的jdk(此处以64位windows为例.x86是32位 ...

  9. oracle 分析函数和开窗函数

    最近遇到一个需求,将查询出的数据按照地区分组,随机取出每个区域的2条数据,这里用到了oracle的分析和开窗函数: 最终写出的sql如下: select * from (select region,r ...

  10. [Swift]LeetCode763. 划分字母区间 | Partition Labels

    A string S of lowercase letters is given. We want to partition this string into as many parts as pos ...