流畅的python--2 序列构成的数组
我们把文本、列表和表格叫做数据火车。。。FOR命令通常能作用于数据火车上。 ---ABC Programmer's Handbook
不管是哪种数据结构,字符串、列表、字节序列、数组、XML元素,或是数据库查询结果,他们都共用一套丰富的操作:迭代、切片、排序、还有拼接。
1、内置序列类型概览
容器序列:list、tuple和collections.duque这些序列能存放不同类型的数据。
扁平序列:str、bytes、bytearray、memoryview和array.array这些序列只能容纳一种类型。
可变序列:list、bytearray、array.array、collections.duque和memoryview
不可变序列:tuple、str、bytes
可变序列从不可变序列那里继承了一些方法。
2、列表推导和可读性
列表推导只有一作用:生成列表。列表推导读起来更方便:
>>> symbols = "python"
>>> codes = [ord(symbol) for symbol in symbols] # 使用列表推导读起来更方便
>>> codes
[112, 121, 116, 104, 111, 110]
其他的写法如下(不太建议):
>>> codes = []
>>> for symbol in symbols:
... codes.append(ord(symbol))
...
>>> codes
[112, 121, 116, 104, 111, 110]
只用列表推导来创建新的列表,并且尽量保持简单,如果列表推导的代码超过了两行,那么就要考虑是不是要用for循环了。
python会忽略代码里的[],{}和()的换行。
列表推导不会再有变量泄露的问题:
>>> x = "my precious"
>>> dummy = [ord(x) for x in 'ABC']
>>> dummy
[65, 66, 67]
>>> x # 在python2中x的取值会是'C'
'my precious'
列表推导可以帮助我们过滤或者加工序列中的元素,其运行速度不一定会比map/filter组合慢。
>>> symbols = "python"
>>> beyond_ascii = [ord(s) for s in symbols if ord(s) > 110] # 这种方法不一定慢
>>> beyond_ascii
[112, 121, 116, 111]
>>>
>>> beyond_ascii = list(filter(lambda c:c > 110, map(ord, symbols)))
>>> beyond_ascii
[112, 121, 116, 111]
生成笛卡尔积,循环的顺序调整,颜色和尺寸显示的顺序也会跟着调整。
>>> colors = ['black', 'white']
>>> sizes = ['S', 'M', 'L']
>>> tshirts = [(color, size) for color in colors for size in sizes]
>>> tshirts
[('black', 'S'), ('black', 'M'), ('black', 'L'), ('white', 'S'), ('white', 'M'), ('white', 'L')]
>>> tshirts = [(color, size) for size in sizes
... for color in colors]
>>> tshirts
[('black', 'S'), ('white', 'S'), ('black', 'M'), ('white', 'M'), ('black', 'L'), ('white', 'L')]
3、生成器
生成器表达式的语法跟列表推导的差不多,只不过把方括号变成了圆括号。生成器是逐个产出元素,而不是先建立一个完整的列表。
>>> colors = ['black', 'white']
>>> sizes = ['S', 'M', 'L']
>>> for tshirt in ('%s %s' % (c, s) for c in colors for s in sizes):
... print(tshirt)
...
black S
black M
black L
white S
white M
white L
4、元组
元组其实是对数据的记录,其每个元素都存放了记录中一个字段的数据和响应的位置。
>>> lax_coordinates = (33.9425, -118.408056) # 洛杉矶国际机场的经纬度
>>> city, year, pop, chg, area = ('Tokyo', 2003, 32450, 0.66, 8014) # 东京市的一些信息
>>> traveler_ids = [('USA', ''), ('BRA', 'CE342567'), # 一个元组列表(country_code,passport_number)
... ('ESP', 'XDA205856')]
>>> for passport in sorted(traveler_ids): # passport变量被绑定在每个元组上
... print('%s/%s' % passport) # %运算符能被匹配到对应的元组元素上
...
BRA/CE342567
ESP/XDA205856
USA/31195855
>>> for country, _ in traveler_ids: # for分别提取元组里的元素,也叫做拆包。因为元组中的第二个元素没有用,就赋值给'_'占位符
... print(country)
...
USA
BRA
ESP
4.1 元组拆包
下面都是属于元组拆包的应用:
1、所有赋值只用一行声明就写完了:city, year, pop, chg, area = ('Tokyo', 2003, 32450, 0.66, 8014)
2、用%把passport元组里的元素对应到print函数的格式化字符串的空档中:('%s/%s' % passport)
元组拆包的要求是被可迭代对象中的元素数量必须要跟接受这些元素的元素的空档数一致。另外可以用'*'来处理多余的元素。
>>> latitude, longitude = (33.9425, -118.408056) # 元组拆包,平行赋值
>>> latitude
33.9425
>>> longitude
-118.408056
>>> a = 1
>>> b = 2
>>> b, a = a, b # 交换两个变量的值
>>> a
2
>>> b
1
>>> divmod(20, 8)
(2, 4)
>>> t = (20, 8)
>>> divmod(*t) # 用*运算符把一个可迭代对象拆开作为函数的参数
(2, 4)
如同之前的例子所示,'_'是一个很好的占位符,另外还可以用'*'来处理剩下的元素。在python中,函数用*args来获取不确定数量的参数,这种概念被扩展到了平行赋值中。在平行赋值中,*前缀只能用在一个变量名前面,这个变量可以出现在赋值表达式的任何位置。
>>> a, b, *rest = range(5)
>>> a, b, rest
(0, 1, [2, 3, 4])
>>> a, b, *rest = range(3)
>>> a, b, rest
(0, 1, [2])
>>> a, b, *rest = range(2)
>>> a, b, rest
(0, 1, [])
>>> a, *body, c, d = range(5)
>>> a, body, c, d
(0, [1, 2], 3, 4)
>>> *head, b, c, d = range(5)
>>> head, b, c, d
([0, 1], 2, 3, 4)
接受表达式的元组是可以嵌套的,例如(a, b, (c, d))。
4.2 具名元组
collections.namedtuple是一个工厂函数,可以用来构建一个带字段名的元组和一个有名字的类--这个对调试程序有很大帮助。
>>> from collections import namedtuple
>>> #具名元组需要两个参数,一个是类名,一个是类的各字段的名字,由空格分隔开
>>> City = namedtuple('City', 'name country population coordinates')
>>> tokyo = City('Tokyo', 'JP', 36.933, (35.689722, 139.691667)) # 存放的数据要以一串参数的形式传入到构造函数中
>>> tokyo
City(name='Tokyo', country='JP', population=36.933, coordinates=(35.689722, 139.691667))
>>> tokyo.population # 通过字段名或者位置来获取字段的信息
36.933
>>> tokyo.coordinates
(35.689722, 139.691667)
>>> tokyo[1]
'JP'
5、切片
在列表list、元组tuple、字符串str这类序列都支持切片操作。
那为什么切片和区间会忽略最后一个元素?
- 当只有最后一个位置信息时,可以快速看出有几个元素:range(3)和my_list[:3]都返回3个元素
- 当起止位置都可见时,可以快速计算出长度,用stop-start即可
- 便于利用任意一个下表把序列分割成不重叠的两部分,只要写my_list[: x]和my_list[x: ]即可。
可以用s[a: b: c]的形式对s在a和b之间以c为间隔取值。c的值为负数意味着反向取值。
>>> s = 'bicycle'
>>> s[::3]
'bye'
>>> s[::-1]
'elcycib'
>>> s[::-2]
'eccb'
6、对序列使用+和*
+:+号两侧的序列由相同类型的数据所构成,在拼接的过程,两个被操作的序列都不会被修改。
*:把一个序列复制几份然后再拼接起来,把这个序列乘以一个整数。
+和*不会修改原来的操作对象,而是构建一个全新的序列。
>>> l = [1, 2, 3]
>>> l * 3
[1, 2, 3, 1, 2, 3, 1, 2, 3]
>>> m = ['a', 'b']
>>> l + m
[1, 2, 3, 'a', 'b']
流畅的python--2 序列构成的数组的更多相关文章
- 流畅的python之序列
python对开发者友好的根源在于:1.序列的泛型操作2.内置的元组和映身类型3.用缩进来架构的源码4.无需变量声明的强类型 序列数据共用的一套丰富的操作:迭代.切片.排序和拼接.内置序列类型:1.容 ...
- 《流畅的Python》第二部分 数据结构 【序列构成的数组】【字典和集合】【文本和字节序列】
第二部分 数据结构 第2章 序列构成的数组 内置序列类型 序列类型 序列 特点 容器序列 list.tuple.collections.deque - 能存放不同类型的数据:- 存放的是任意类型的对象 ...
- 《流畅的python》读书笔记
流畅的python 第1章 python数据模型 ---1.1 一摞Python风格的纸牌 特殊方法,即__method__,又被称为魔术方法(magic method)或者双下方法(dunder-m ...
- 流畅的python(笔记)
流畅的python中有很多奇技淫巧,整本书都在强调如何最大限度地利用Python 标准库.介绍了很多python的不常用的数据类型.操作.库等,对于入门python后想要提升对python的认识应该有 ...
- python经典书籍必看:流畅的Python
作者:熊猫烧香 链接:www.pythonheidong.com/blog/article/26/ 来源:python黑洞网 目标读者 本书的目标读者是那些正在使用 Python,又想熟悉 Pytho ...
- 流畅的python笔记
鸭子类型协议不完全总结序列:len,getitem切片:getitemv[0]分量的取值和写值:getitem和setitemv.x属性的取值和写值:getattr和setattr迭代:1)iter, ...
- 点读系列《流畅的python》
第1章 python数据模型 python的写法是由背后的魔法方法实现的,比如obj[key],解释器实际调用的是obj.__getitem__(key) 作者把魔法方法叫做双下方法,因为有两个下划线 ...
- 《流畅的Python》 第一部分 序章 【数据模型】
流畅的Python 致Marta,用我全心全意的爱 第一部分 序幕 第一章 Python数据模型 特殊方法 定义: Python解释器碰到特殊句法时,使用特殊方法激活对象的基本操作,例如python语 ...
- Redis入门 – Jedis存储Java对象 - (Java序列化为byte数组方式)
Redis入门 – Jedis存储Java对象 - (Java序列化为byte数组方式) 原文地址:http://alanland.iteye.com/admin/blogs/1600685(欢迎转载 ...
- 在python 中有时候我们用数组
在python 中有时候我们用数组操作数据可以极大的提升数据的处理效率, 类似于R的向量化操作,是的数据的操作趋于简单化,在python 中是使用numpy模块可以进行数组和矢量计算. 下面来看下简单 ...
随机推荐
- springcloud-app
https://gitee.com/vmaps/springcloud-app https://yq.aliyun.com/articles/329019?spm=a2c4e.11153940.blo ...
- kvm 一些web管理3方工具
OpenNebula Proxmox VE
- 在 Activity 中实现 getContentView 操作
2017/9/8 17:17:03 前言 最近接到个需要优化Android原生系统设置APK的任务.这个任务里面有一个更换应用背景图片的需求.我手里的这个设备是一个平板设备,使用了一下这个 ...
- 树形DP和状压DP和背包DP
树形DP和状压DP和背包DP 树形\(DP\)和状压\(DP\)虽然在\(NOIp\)中考的不多,但是仍然是一个比较常用的算法,因此学好这两个\(DP\)也是很重要的.而背包\(DP\)虽然以前考的次 ...
- Ubuntu下编写终端界面交互式C++小程序的一些Trick(小技巧,gnome-terminal)
类getch()功能的实现 I 只要在Windows下用过C/C++就会很熟悉conio.h库中的一个函数getch(),它可以绕过终端输入缓冲区直接从键盘读取一个字符,并且不在界面上显示. 但如果想 ...
- Hdoj 1785.You Are All Excellent 题解
Problem Description 本次集训队共有30多人参加,毫无疑问,你们都是很优秀的,但是由于参赛名额有限,只能选拔部分队员参加省赛.从学校的角度,总是希望选拔出最优秀的18人组成6支队伍来 ...
- 【HDU3595】GG and MM(博弈论)
[HDU3595]GG and MM(博弈论) 题面 HDU 一个游戏由多个游戏组成,每次每个操作者必须操作所有可以操作的游戏,操作集合为空者输. 每个游戏由两堆石子组成,每次可以从较多的那一堆中取走 ...
- 【转】STM32擦除内部FLASH时间过长导致IWDG复位分析
@20119-01-29 [小记] STM32擦除内部FLASH时间过长导致IWDG复位分析
- MVC接收列表参数
ASP.NET MVC 表单参数如果有列表时要怎么写呢. 虽然很久不用MVC了,但几乎每次遇到一次就要研究一下.然后又忘了. 其实也明白这是未完全弄清楚表单参数的传递形式,如果明白了,就知道MVC为 ...
- 540. Single Element in a Sorted Array
题目大意: 给你一个由小到大排好序的数组,里面只有一个数出现了一次,其他数都出现了两次,要求找出那个只出现一次的数,而且时间复杂度为O(logn) 题目思路: 说实话一开始没想到,因为几乎每个数都出现 ...