我们把文本、列表和表格叫做数据火车。。。FOR命令通常能作用于数据火车上。      ---ABC Programmer's Handbook

不管是哪种数据结构,字符串、列表、字节序列、数组、XML元素,或是数据库查询结果,他们都共用一套丰富的操作:迭代、切片、排序、还有拼接。

1、内置序列类型概览

容器序列:list、tuple和collections.duque这些序列能存放不同类型的数据。

扁平序列:str、bytes、bytearray、memoryview和array.array这些序列只能容纳一种类型。

可变序列:list、bytearray、array.array、collections.duque和memoryview

不可变序列:tuple、str、bytes

可变序列从不可变序列那里继承了一些方法。

2、列表推导和可读性

列表推导只有一作用:生成列表。列表推导读起来更方便:

>>> symbols = "python"
>>> codes = [ord(symbol) for symbol in symbols] # 使用列表推导读起来更方便
>>> codes
[112, 121, 116, 104, 111, 110]

其他的写法如下(不太建议):

>>> codes = []
>>> for symbol in symbols:
... codes.append(ord(symbol))
...
>>> codes
[112, 121, 116, 104, 111, 110]

只用列表推导来创建新的列表,并且尽量保持简单,如果列表推导的代码超过了两行,那么就要考虑是不是要用for循环了。

python会忽略代码里的[],{}和()的换行。

列表推导不会再有变量泄露的问题:

>>> x = "my precious"
>>> dummy = [ord(x) for x in 'ABC']
>>> dummy
[65, 66, 67]
>>> x # 在python2中x的取值会是'C'
'my precious'

列表推导可以帮助我们过滤或者加工序列中的元素,其运行速度不一定会比map/filter组合慢。

>>> symbols = "python"
>>> beyond_ascii = [ord(s) for s in symbols if ord(s) > 110] # 这种方法不一定慢
>>> beyond_ascii
[112, 121, 116, 111]
>>>
>>> beyond_ascii = list(filter(lambda c:c > 110, map(ord, symbols)))
>>> beyond_ascii
[112, 121, 116, 111]

生成笛卡尔积,循环的顺序调整,颜色和尺寸显示的顺序也会跟着调整。

>>> colors = ['black', 'white']
>>> sizes = ['S', 'M', 'L']
>>> tshirts = [(color, size) for color in colors for size in sizes]
>>> tshirts
[('black', 'S'), ('black', 'M'), ('black', 'L'), ('white', 'S'), ('white', 'M'), ('white', 'L')]
>>> tshirts = [(color, size) for size in sizes
... for color in colors]
>>> tshirts
[('black', 'S'), ('white', 'S'), ('black', 'M'), ('white', 'M'), ('black', 'L'), ('white', 'L')]

3、生成器

生成器表达式的语法跟列表推导的差不多,只不过把方括号变成了圆括号。生成器是逐个产出元素,而不是先建立一个完整的列表。

>>> colors = ['black', 'white']
>>> sizes = ['S', 'M', 'L']
>>> for tshirt in ('%s %s' % (c, s) for c in colors for s in sizes):
... print(tshirt)
...
black S
black M
black L
white S
white M
white L

4、元组

元组其实是对数据的记录,其每个元素都存放了记录中一个字段的数据和响应的位置。

>>> lax_coordinates = (33.9425, -118.408056)   # 洛杉矶国际机场的经纬度
>>> city, year, pop, chg, area = ('Tokyo', 2003, 32450, 0.66, 8014) # 东京市的一些信息
>>> traveler_ids = [('USA', ''), ('BRA', 'CE342567'), # 一个元组列表(country_code,passport_number)
... ('ESP', 'XDA205856')]
>>> for passport in sorted(traveler_ids): # passport变量被绑定在每个元组上
... print('%s/%s' % passport) # %运算符能被匹配到对应的元组元素上
...
BRA/CE342567
ESP/XDA205856
USA/31195855
>>> for country, _ in traveler_ids: # for分别提取元组里的元素,也叫做拆包。因为元组中的第二个元素没有用,就赋值给'_'占位符
... print(country)
...
USA
BRA
ESP

4.1 元组拆包

下面都是属于元组拆包的应用:

1、所有赋值只用一行声明就写完了:city, year, pop, chg, area = ('Tokyo', 2003, 32450, 0.66, 8014)

2、用%把passport元组里的元素对应到print函数的格式化字符串的空档中:('%s/%s' % passport)

元组拆包的要求是被可迭代对象中的元素数量必须要跟接受这些元素的元素的空档数一致。另外可以用'*'来处理多余的元素。

>>> latitude, longitude = (33.9425, -118.408056)  # 元组拆包,平行赋值
>>> latitude
33.9425
>>> longitude
-118.408056
>>> a = 1
>>> b = 2
>>> b, a = a, b # 交换两个变量的值
>>> a
2
>>> b
1
>>> divmod(20, 8)
(2, 4)
>>> t = (20, 8)
>>> divmod(*t) # 用*运算符把一个可迭代对象拆开作为函数的参数
(2, 4)

如同之前的例子所示,'_'是一个很好的占位符,另外还可以用'*'来处理剩下的元素。在python中,函数用*args来获取不确定数量的参数,这种概念被扩展到了平行赋值中。在平行赋值中,*前缀只能用在一个变量名前面,这个变量可以出现在赋值表达式的任何位置。

>>> a, b, *rest = range(5)
>>> a, b, rest
(0, 1, [2, 3, 4])
>>> a, b, *rest = range(3)
>>> a, b, rest
(0, 1, [2])
>>> a, b, *rest = range(2)
>>> a, b, rest
(0, 1, [])
>>> a, *body, c, d = range(5)
>>> a, body, c, d
(0, [1, 2], 3, 4)
>>> *head, b, c, d = range(5)
>>> head, b, c, d
([0, 1], 2, 3, 4)

接受表达式的元组是可以嵌套的,例如(a, b, (c, d))。

4.2 具名元组

collections.namedtuple是一个工厂函数,可以用来构建一个带字段名的元组和一个有名字的类--这个对调试程序有很大帮助。

>>> from collections import namedtuple
>>> #具名元组需要两个参数,一个是类名,一个是类的各字段的名字,由空格分隔开
>>> City = namedtuple('City', 'name country population coordinates')
>>> tokyo = City('Tokyo', 'JP', 36.933, (35.689722, 139.691667)) # 存放的数据要以一串参数的形式传入到构造函数中
>>> tokyo
City(name='Tokyo', country='JP', population=36.933, coordinates=(35.689722, 139.691667))
>>> tokyo.population # 通过字段名或者位置来获取字段的信息
36.933
>>> tokyo.coordinates
(35.689722, 139.691667)
>>> tokyo[1]
'JP'

5、切片

在列表list、元组tuple、字符串str这类序列都支持切片操作。

那为什么切片和区间会忽略最后一个元素?

  • 当只有最后一个位置信息时,可以快速看出有几个元素:range(3)和my_list[:3]都返回3个元素
  • 当起止位置都可见时,可以快速计算出长度,用stop-start即可
  • 便于利用任意一个下表把序列分割成不重叠的两部分,只要写my_list[: x]和my_list[x: ]即可。

可以用s[a: b: c]的形式对s在a和b之间以c为间隔取值。c的值为负数意味着反向取值。

>>> s = 'bicycle'
>>> s[::3]
'bye'
>>> s[::-1]
'elcycib'
>>> s[::-2]
'eccb'

6、对序列使用+和*

+:+号两侧的序列由相同类型的数据所构成,在拼接的过程,两个被操作的序列都不会被修改。

*:把一个序列复制几份然后再拼接起来,把这个序列乘以一个整数。

+和*不会修改原来的操作对象,而是构建一个全新的序列。

>>> l = [1, 2, 3]
>>> l * 3
[1, 2, 3, 1, 2, 3, 1, 2, 3]
>>> m = ['a', 'b']
>>> l + m
[1, 2, 3, 'a', 'b']

流畅的python--2 序列构成的数组的更多相关文章

  1. 流畅的python之序列

    python对开发者友好的根源在于:1.序列的泛型操作2.内置的元组和映身类型3.用缩进来架构的源码4.无需变量声明的强类型 序列数据共用的一套丰富的操作:迭代.切片.排序和拼接.内置序列类型:1.容 ...

  2. 《流畅的Python》第二部分 数据结构 【序列构成的数组】【字典和集合】【文本和字节序列】

    第二部分 数据结构 第2章 序列构成的数组 内置序列类型 序列类型 序列 特点 容器序列 list.tuple.collections.deque - 能存放不同类型的数据:- 存放的是任意类型的对象 ...

  3. 《流畅的python》读书笔记

    流畅的python 第1章 python数据模型 ---1.1 一摞Python风格的纸牌 特殊方法,即__method__,又被称为魔术方法(magic method)或者双下方法(dunder-m ...

  4. 流畅的python(笔记)

    流畅的python中有很多奇技淫巧,整本书都在强调如何最大限度地利用Python 标准库.介绍了很多python的不常用的数据类型.操作.库等,对于入门python后想要提升对python的认识应该有 ...

  5. python经典书籍必看:流畅的Python

    作者:熊猫烧香 链接:www.pythonheidong.com/blog/article/26/ 来源:python黑洞网 目标读者 本书的目标读者是那些正在使用 Python,又想熟悉 Pytho ...

  6. 流畅的python笔记

    鸭子类型协议不完全总结序列:len,getitem切片:getitemv[0]分量的取值和写值:getitem和setitemv.x属性的取值和写值:getattr和setattr迭代:1)iter, ...

  7. 点读系列《流畅的python》

    第1章 python数据模型 python的写法是由背后的魔法方法实现的,比如obj[key],解释器实际调用的是obj.__getitem__(key) 作者把魔法方法叫做双下方法,因为有两个下划线 ...

  8. 《流畅的Python》 第一部分 序章 【数据模型】

    流畅的Python 致Marta,用我全心全意的爱 第一部分 序幕 第一章 Python数据模型 特殊方法 定义: Python解释器碰到特殊句法时,使用特殊方法激活对象的基本操作,例如python语 ...

  9. Redis入门 – Jedis存储Java对象 - (Java序列化为byte数组方式)

    Redis入门 – Jedis存储Java对象 - (Java序列化为byte数组方式) 原文地址:http://alanland.iteye.com/admin/blogs/1600685(欢迎转载 ...

  10. 在python 中有时候我们用数组

    在python 中有时候我们用数组操作数据可以极大的提升数据的处理效率, 类似于R的向量化操作,是的数据的操作趋于简单化,在python 中是使用numpy模块可以进行数组和矢量计算. 下面来看下简单 ...

随机推荐

  1. mpi4python

    转载:https://zhuanlan.zhihu.com/p/25332041 前言 在高性能计算的项目中我们通常都会使用效率更高的编译型的语言例如C.C++.Fortran等,但是由于Python ...

  2. Nginx GoAccess安装与配置

    1.下载并安装Geoip $ wget https://github.com/maxmind/geoip-api-c/releases/download/v1.6.12/GeoIP-1.6.12.ta ...

  3. DRF 版本 认证

    DRF的版本 版本控制是做什么用的, 我们为什么要用 首先我们要知道我们的版本是干嘛用的呢大家都知道我们开发项目是有多个版本的 当我们项目越来越更新~版本就越来越多我们不可能新的版本出了~以前旧的版本 ...

  4. 基于FPGA的数字秒表(数码管显示模块和按键消抖)实现

    本文主要是学习按键消抖和数码管动态显示,秒表显示什么的,个人认为,拿FPGA做秒表真是嫌钱多. 感谢 感谢学校和至芯科技,笔者专业最近去北京至芯科技培训交流了一周.老师的经验还是可以的,优化了自己的代 ...

  5. python学习日记(格式化输出,初始编码,运算符)

    格式化输出 顾名思义,按照个人意愿定制想输出的格式. name = input('请输入姓名:') age = int(input('请输入年龄:')) job = input('请输入工作:') h ...

  6. Leetcode 167. 两数之和 II - 输入有序数组 By Python

    给定一个已按照升序排列 的有序数组,找到两个数使得它们相加之和等于目标数. 函数应该返回这两个下标值 index1 和 index2,其中 index1 必须小于 index2. 说明: 返回的下标值 ...

  7. 05 Zabbix4.0触发器表达式Trigger expression支持的函数

    点击返回:自学Zabbix之路 点击返回:自学Zabbix4.0之路 点击返回:自学zabbix集锦 05 Zabbix4.0触发器表达式Trigger expression支持的函数 所有函数返回值 ...

  8. ubuntu配置mysql

    1.安装mysql: sudo apt-get install mysql-server sudo apt-get install mysql-client sudo apt-get install ...

  9. bzoj3796(后缀数组)(SA四连)

    bzoj3796Mushroom追妹纸 题目描述 Mushroom最近看上了一个漂亮妹纸.他选择一种非常经典的手段来表达自己的心意——写情书.考虑到自己的表达能力,Mushroom决定不手写情书.他从 ...

  10. CANOE入门(一)

    CANoe是Vector公司的针对汽车电子行业的总线分析工具,现在我用CANoe7.6版本进行介绍,其他版本功能基本差不多. 硬件我使用的是CAN case XL. 1,CANoe软件的安装很简单,先 ...