翻译:《实用的Python编程》02_01_Datatypes
目录 | 上一节 (1.7 函数) | 下一节 (2.2 容器)
2.1 数据类型和数据结构
本节以元组和字典为代表介绍数据结构。
原始数据类型
Python 有一些原始数据类型:
- 整数
- 浮点数
- 字符串(文本)
空类型
email_address = None
None
常用作可选值或缺失值的占位符。它在条件语句中计算为 False
。
if email_address:
send_email(email_address, msg)
数据结构
实际的程序具有更复杂的数据。例如,关于股票的持有信息:
100 shares of GOOG at $490.10
这是一个包含三个部分的“对象”:
- 股票的名称或符号("GOOG",字符串)
- 股份数目(100,整数)
- 价格(490.10,浮点数)
元组
元组是分组在一起的值的集合。
示例:
s = ('GOOG', 100, 490.1)
有时候会在语法上省略 ()
。
s = 'GOOG', 100, 490.1
特殊情况(0 元组,1 元组)。
t = () # An empty tuple
w = ('GOOG', ) # A 1-item tuple
元组一般用来表示简单的记录或结构。
通常,它是由多个部分组成的单个对象。这有一个很好的类比:元组就像数据库表中的一行。
元组的内容是有序的(类似于数组)。
s = ('GOOG', 100, 490.1)
name = s[0] # 'GOOG'
shares = s[1] # 100
price = s[2] # 490.1
但是,元组的内容无法修改。
>>> s[1] = 75
TypeError: object does not support item assignment
你可以基于当前元组创建一个新元组。
s = (s[0], 75, s[2])
元组打包
元组更多的是把相关的项打包到一个实体(entity)中。
s = ('GOOG', 100, 490.1)
然后,该元组很容易作为单个对象传递给程序的其它部分。
元组拆包
要在其它地方使用元组,可以把元组的各部分拆包为变量。
name, shares, price = s
print('Cost', shares * price)
左侧变量的数目必须与元组的结构匹配。
name, shares = s # ERROR
Traceback (most recent call last):
...
ValueError: too many values to unpack
元组与列表
元组看起来像只读列表。但是,元组最常用于由多个部分组成的单项。列表通常是类型相同的项的集合,
record = ('GOOG', 100, 490.1) # A tuple representing a record in a portfolio
symbols = [ 'GOOG', 'AAPL', 'IBM' ] # A List representing three stock symbols
字典
字典是键到值的映射。有时,字典也称为哈希表(hash table)或关联数组(associative array)。键用作访问值的索引。
s = {
'name': 'GOOG',
'shares': 100,
'price': 490.1
}
常见操作
要从字典中获取值,请使用键名。
>>> print(s['name'], s['shares'])
GOOG 100
>>> s['price']
490.10
>>>
要添加或修改值,请使用键名进行分配。
>>> s['shares'] = 75
>>> s['date'] = '6/6/2007'
>>>
要删除值,请使用 del
语句。
>>> del s['date']
>>>
为什么使用字典?
当存在很多不同的值并且可能会修改或操作这些值时,字典很有用。字典使代码更具可读性。
s['price']
# vs
s[2]
练习
在上次的几个练习中,编写了一个取数据文件 Data/portfolio.csv
的程序 。使用 csv
模块,可以轻松地逐行读取文件。
>>> import csv
>>> f = open('Data/portfolio.csv')
>>> rows = csv.reader(f)
>>> next(rows)
['name', 'shares', 'price']
>>> row = next(rows)
>>> row
['AA', '100', '32.20']
>>>
尽管读取文件很容易,但是与读取数据相比,通常使用数据做更多的事情。例如,也许想存储它并对其执行一些计算。不幸的是,原始的数据“行”并不能这样做。例如,即使是简单的数学计算也不行。
>>> row = ['AA', '100', '32.20']
>>> cost = row[1] * row[2]
Traceback (most recent call last):
File "<stdin>", line 1, in <module>
TypeError: can't multiply sequence by non-int of type 'str'
>>>
要执行更多的操作,通常需要以某种方式解释原始数据,并将其转换为更有用的对象类型,以便以后处理。有两种简单的方式可以选择:元组或者字典。
练习 2.1:元组
在交互式提示符下,创建以下代表上一行的元组,但数字列要转换为恰当的数字。
>>> t = (row[0], int(row[1]), float(row[2]))
>>> t
('AA', 100, 32.2)
>>>
使用这种方式,现在可以使用股份数目乘以价格来计算总价,
>>> cost = t[1] * t[2]
>>> cost
3220.0000000000005
>>>
在 Python 中,数学没用了吗?结果为什么是 3220.0000000000005?
这是计算机上浮点硬件的产物,只能在二进制(而不是十进制)中准确表示小数。即使是涉及十进制小数的简单计算,也会引入小的误差。这很正常,如果你之前没有见过,可能会有点惊讶。
虽然在所有使用浮点小数的编程语言中都会发生这种情况,但是打印的时候可以把它隐藏,例如:
>>> print(f'{cost:0.2f}')
3220.00
>>>
元组是只读的。可以通过尝试把股份数目改为 75 来验证这点。
>>> t[1] = 75
Traceback (most recent call last):
File "<stdin>", line 1, in <module>
TypeError: 'tuple' object does not support item assignment
>>>
尽管无法更改元组的内容,但是始终可以创建一个全新的元组来替换旧的元组。
>>> t = (t[0], 75, t[2])
>>> t
('AA', 75, 32.2)
>>>
每当像这样重新分配现有变量名时,旧值就会被丢弃。虽然上面的赋值可能看起来像在修改元组,但实际上是在创建一个新的元组,并且将旧的元组丢弃。
元组通常用于将值打包或拆包到变量中。请尝试以下操作:
>>> name, shares, price = t
>>> name
'AA'
>>> shares
75
>>> price
32.2
>>>
取上面的变量并将其打包回元组中:
>>> t = (name, 2*shares, price)
>>> t
('AA', 150, 32.2)
>>>
练习 2.2:把字典当作数据结构
可以创建字典来替代元组。
>>> d = {
'name' : row[0],
'shares' : int(row[1]),
'price' : float(row[2])
}
>>> d
{'name': 'AA', 'shares': 100, 'price': 32.2 }
>>>
计算持有的总价:
>>> cost = d['shares'] * d['price']
>>> cost
3220.0000000000005
>>>
将此示例与上面涉及元组的相同的计算进行比较,将股份数目修改为 75。
>>> d['shares'] = 75
>>> d
{'name': 'AA', 'shares': 75, 'price': 32.2 }
>>>
与元组不同,字典可以自由修改。添加一些属性:
>>> d['date'] = (6, 11, 2007)
>>> d['account'] = 12345
>>> d
{'name': 'AA', 'shares': 75, 'price':32.2, 'date': (6, 11, 2007), 'account': 12345}
>>>
练习 2.3: 字典的其它操作
如果将一个字典转换为列表,则将获得其所有的键:
>>> list(d)
['name', 'shares', 'price', 'date', 'account']
>>>
类似地,如果使用 for
语句对字典进行迭代,则将获得其所有的键。
>>> for k in d:
print('k =', k)
k = name
k = shares
k = price
k = date
k = account
>>>
尝试使用这个同时执行查找的变体:
>>> for k in d:
print(k, '=', d[k])
name = AA
shares = 75
price = 32.2
date = (6, 11, 2007)
account = 12345
>>>
也可以使用 keys()
方法获得所有的键:
>>> keys = d.keys()
>>> keys
dict_keys(['name', 'shares', 'price', 'date', 'account'])
>>>
在这里,keys()
稍微有点不同,它返回的是一个 dict_keys
对象。
这是对原始字典的覆盖,它始终提供当前字典的键——即使字典改变了。例如,试试一下操作:
>>> del d['account']
>>> keys
dict_keys(['name', 'shares', 'price', 'date'])
>>>
请注意,尽管没有再次调用 d.keys()
,但键'account'
消失了。
一个更优雅地一起使用键和值的方式是使用 items()
方法。这可以获得键值组成的元组 (key, value)
。
>>> items = d.items()
>>> items
dict_items([('name', 'AA'), ('shares', 75), ('price', 32.2), ('date', (6, 11, 2007))])
>>> for k, v in d.items():
print(k, '=', v)
name = AA
shares = 75
price = 32.2
date = (6, 11, 2007)
>>>
如果有类似于 items
的元组,那么可以使用 dict()
函数创建一个字典。请尝试以下操作:
>>> items
dict_items([('name', 'AA'), ('shares', 75), ('price', 32.2), ('date', (6, 11, 2007))])
>>> d = dict(items)
>>> d
{'name': 'AA', 'shares': 75, 'price':32.2, 'date': (6, 11, 2007)}
>>>
目录 | 上一节 (1.7 函数) | 下一节 (2.2 容器)
注:完整翻译见 https://github.com/codists/practical-python-zh
翻译:《实用的Python编程》02_01_Datatypes的更多相关文章
- 翻译:《实用的Python编程》InstructorNotes
实用的 Python 编程--讲师说明 作者:戴维·比兹利(David Beazley) 概述 对于如何使用我的课程"实用的 Python 编程"进行教学的问题,本文档提供一些通用 ...
- 翻译:《实用的Python编程》README
欢迎光临 大约 25 年前,当我第一次学习 Python 时,发现 Python 竟然可以被高效地应用到各种混乱的工作项目上,我立即被震惊了.15 年前,我自己也将这种乐趣教授给别人.教学的结果就是本 ...
- 翻译:《实用的Python编程》05_02_Classes_encapsulation
目录 | 上一节 (5.1 再谈字典) | 下一节 (6 生成器) 5.2 类和封装 创建类时,通常会尝试将类的内部细节进行封装.本节介绍 Python 编程中有关封装的习惯用法(包括私有变量和私有属 ...
- 翻译:《实用的Python编程》04_02_Inheritance
目录 | 上一节 (4.1 类) | 下一节 (4.3 特殊方法) 4.2 继承 继承(inheritance)是编写可扩展程序程序的常用手段.本节对继承的思想(idea)进行探讨. 简介 继承用于特 ...
- 翻译:《实用的Python编程》01_02_Hello_world
目录 | 上一节 (1.1 Python) | 下一节 (1.3 数字) 1.2 第一个程序 本节讨论有关如何创建一个程序.运行解释器和调试的基础知识. 运行 Python Python 程序始终在解 ...
- 翻译:《实用的Python编程》03_03_Error_checking
目录 | 上一节 (3.2 深入函数) | 下一节 (3.4 模块) 3.3 错误检查 虽然前面已经介绍了异常,但本节补充一些有关错误检查和异常处理的其它细节. 程序是如何运行失败的 Python 不 ...
- 翻译:《实用的Python编程》03_04_Modules
目录 | 上一节 (3.3 错误检查) | 下一节 (3.5 主模块) 3.4 模块 本节介绍模块的概念以及如何使用跨多个文件的函数. 模块和导入 任何一个 Python 源文件都是一个模块. # f ...
- 翻译:《实用的Python编程》03_05_Main_module
目录 | 上一节 (3.4 模块) | 下一节 (3.6 设计讨论) 3.5 主模块 本节介绍主程序(主模块)的概念 主函数 在许多编程语言中,存在一个主函数或者主方法的概念. // c / c++ ...
- 翻译:《实用的Python编程》04_01_Class
目录 | 上一节 (3.6 设计讨论) | 下一节 (4.2 继承) 4.1 类 本节介绍 class 语句以及创建新对象的方式. 面向对象编程(OOP) 面向对象编程是一种将代码组织成对象集合的编程 ...
随机推荐
- Session (简介、、相关方法、流程解析、登录验证)
Session简介 Session的由来 Cookie虽然在一定程度上解决了"保持状态"的需求,但是由于Cookie本身最大支持4096字节,以及Cookie本身保存在客户端,可能 ...
- pytest测试框架+jenkins结合pytest+jenkins邮件通知配置
刚刚做完一个项目,由于这是一个方案项目,而不是产品,所以各种准备很不充分,很多公司的能力不能复用,整个团队又都是新员工,而且有部分实习生,匆忙上马,今天对我的自动化框架做一个回溯 自动化测试框架的选择 ...
- CyclicBarrier---可重用的循环栅栏
很多文章只是提了下可重用,具体这个栅栏怎么可重用的,很多没有说明,这里会解开你的疑惑. CyclicBarrier是一个同步工具类,它允许一组线程互相等待,直到达到某个公共屏障点.与CountDown ...
- 操作系统中的描述符和GDT
在操作系统中,全局描述符是什么?GDT又是什么?在进入保护模式之前,准备好GDT和GDT中的描述符是必须的吗?用汇编代码怎么创建描述符?本文解答上面几个问题. 在实模式下,CPU是16位的,意思是,寄 ...
- Java并发包源码学习系列:基于CAS非阻塞并发队列ConcurrentLinkedQueue源码解析
目录 非阻塞并发队列ConcurrentLinkedQueue概述 结构组成 基本不变式 head的不变式与可变式 tail的不变式与可变式 offer操作 源码解析 图解offer操作 JDK1.6 ...
- 一周精彩内容分享(第 1 期):"世纪逼空大战"
这里记录过去一周,我看到的值得分享的东西. 一方面是整理记录一下自己一周的学习,另一方面也是期待自己有更多的输出,有更多的价值. 周刊开源(Github:wmyskxz/weekly),欢迎提交 is ...
- I - I(Highways)
N个点,给你N个点的坐标,现在还有Q条边已经连接好了.问把N个点怎么连接起来的花费的距离最短? The island nation of Flatopia is perfectly flat. Unf ...
- 2019 ICPC 上海区域赛总结
2019上海区域赛现场赛总结 补题情况(以下通过率为牛客提交): 题号 标题 已通过代码 通过率 我的状态 A Mr. Panda and Dominoes 点击查看 5/29 未通过 B Prefi ...
- CF-gym/101810 J、T-Shirts Dilemma
题目链接:点我 题意: 给你一个区间[a,b],让你从里面选一个连续子区间[x,y](子区间可以为[a,b]),把这个区间的所有数或起来x|x+1|x+2|...|y 你要使得区间[x,y]异或起来的 ...
- cf1291c-Mind Control
题意:n个数n个人依次取数,每个人只能取第一个数或最后一个数,你可以从一开始控制k个人取最前边或是最后边的数,你排在第m位,能取到的最大的数是多少.所有人取数都是最优策略(不是每次取最大数). 题解: ...