[译]The Python Tutorial#7. Input and Output
[译]The Python Tutorial#Input and Output
Python中有多种展示程序输出的方式;数据可以以人类可读的方式打印出来,也可以输出到文件中以后使用。本章节将会详细讨论。
7.1 Fancier Output Formatting
目前为止已经介绍过两种输出值的方式:表达式语句和print()
函数。(第三种方式是使用对象的write()
方法;使用sys.stdout
引用标准输出文件。详细信息参考库文件参考手册。)
有时候需要对输出有更多的控制,而不是简单的使用空格分开值。有两种方式格式化输出:第一种方式是手动处理字符串,使用字符串的切片和连接操作,创建任何可以想象到的输出布局。字符串类型提供了一些将字符串填充到指定列宽的有用方法,马上会讨论这点。第二种方式是使用格式化字符串或者str.format()
方法。
string
模块包含Template
类,该类提供向字符串代入值的方法。
当然还有一个问题:如何将值转换为字符串?Python提供了将任何值转换为字符串的方法:将值传递给repr()
或者str()
函数即可。
str()
函数返回值的人类可读的形式,而repr()
生成值的解释器可读形式(如果没有等价语法,将会强制抛出SyntaxError
)。对于没有提供特定适应人类阅读形式的对象,str()
函数会返回与repr()
相同的值。许多值使用str()
和repr()
函数将得到相同的返回值,如数字或者像列表和字典的结构体。特别地,字符串有两种区别明显的表示形式。
以下是一些示例:
>>> s = 'Hello, world.'
>>> str(s)
'Hello, world.'
>>> repr(s)
"'Hello, world.'"
>>> str(1/7)
'0.14285714285714285'
>>> x = 10 * 3.25
>>> y = 200 * 200
>>> s = 'The value of x is ' + repr(x) + ', and y is ' + repr(y) + '...'
>>> print(s)
The value of x is 32.5, and y is 40000...
>>> # The repr() of a string adds string quotes and backslashes:
... hello = 'hello, world\n'
>>> hellos = repr(hello)
>>> print(hellos)
'hello, world\n'
>>> # The argument to repr() may be any Python object:
... repr((x, y, ('spam', 'eggs')))
"(32.5, 40000, ('spam', 'eggs'))"
有两种方式输出一个平方和立方表格:
>>> for x in range(1, 11):
... print(repr(x).rjust(2), repr(x*x).rjust(3), end=' ')
... # Note use of 'end' on previous line
... print(repr(x*x*x).rjust(4))
...
1 1 1
2 4 8
3 9 27
4 16 64
5 25 125
6 36 216
7 49 343
8 64 512
9 81 729
10 100 1000
>>> for x in range(1, 11):
... print('{0:2d} {1:3d} {2:4d}'.format(x, x*x, x*x*x))
...
1 1 1
2 4 8
3 9 27
4 16 64
5 25 125
6 36 216
7 49 343
8 64 512
9 81 729
10 100 1000
(第一个例子中,列之间的那个空格是由print()
自动添加的:该函数在输出时总是在参数之间插入空格)
这个例子演示了string对象的str.rjust()
方法,这个方法使字符串在给定宽度的列中向右对齐,在左边添加空格。str.ljust()
和str.center()
是相似的方法。这些方法并不会改变原来的字符串,只是返回一个新的字符串。如果输入的字符串太长,这些方法并不会截断字符串,而是不改变字符串并返回;虽然这样会使得列布局混乱,但是总比输出不真实的值好。(若实在想截断可以使用切片操作,如:x.ljust(n)[:n]
。)
方法str.zfill()
在数字字符串左侧添加零,可以识别正负号:
>>> '12'.zfill(5)
'00012'
>>> '-3.14'.zfill(7)
'-003.14'
>>> '3.14159265359'.zfill(5)
'3.14159265359'
str.format()
的基础使用方式是:
>>> print('We are the {} who say "{}!"'.format('knights', 'Ni'))
We are the knights who say "Ni!"
传入str.format()
中的对象会替换掉花括号和其中的字符(称作格式化域)。花括号中的数字可以用来匹配传入str.format()
的对象列表相应位置的对象。
>>> print('{0} and {1}'.format('spam', 'eggs'))
spam and eggs
>>> print('{1} and {0}'.format('spam', 'eggs'))
eggs and spam
在str.format()
中可以使用关键字参数,使用参数名引用对应的值:
>>> print('This {food} is {adjective}.'.format(
... food='spam', adjective='absolutely horrible'))
This spam is absolutely horrible.
可以结合位置参数和关键字参数:
>>> print('The story of {0}, {1}, and {other}.'.format('Bill', 'Manfred',
other='Georg'))
The story of Bill, Manfred, and Georg.
!a
(对应ascii()
),!s
(对应str()
)以及!r
(对应repr()
),用于在格式化之前转换值:
>>> contents = 'eels'
>>> print('My hovercraft is full of {}.'.format(contents))
My hovercraft is full of eels.
>>> print('My hovercraft is full of {!r}.'.format(contents))
My hovercraft is full of 'eels'.
在格式化域后可以跟可选的:
以及格式化命令,允许对值的格式化进一步控制。以下示例指定PI
的精度为3位:
>>> import math
>>> print('The value of PI is approximately {0:.3f}.'.format(math.pi))
The value of PI is approximately 3.142.
在:
后跟一个整数可以指定格式化域的最小宽度。在制作表格时这很有用:
>>> table = {'Sjoerd': 4127, 'Jack': 4098, 'Dcab': 7678}
>>> for name, phone in table.items():
... print('{0:10} ==> {1:10d}'.format(name, phone))
...
Jack ==> 4098
Dcab ==> 7678
Sjoerd ==> 4127
如果有一个长的字符串并不想做分离,可以使用名字而不是位置来引用变量。简单的传递一个字典,并且使用中括号来访问键:
>>> table = {'Sjoerd': 4127, 'Jack': 4098, 'Dcab': 8637678}
>>> print('Jack: {0[Jack]:d}; Sjoerd: {0[Sjoerd]:d}; '
... 'Dcab: {0[Dcab]:d}'.format(table))
Jack: 4098; Sjoerd: 4127; Dcab: 863767
也可以使用**
将字典拆包为关键字参数:
>>> table = {'Sjoerd': 4127, 'Jack': 4098, 'Dcab': 8637678}
>>> print('Jack: {Jack:d}; Sjoerd: {Sjoerd:d}; Dcab: {Dcab:d}'.format(**table))
Jack: 4098; Sjoerd: 4127; Dcab: 8637678
built-in函数vars()
返回将当前局部变量作为字典返回,结合vars()
使用时,以上特别有用。
参考Format String Syntax,完全了解str.format()
。
7.1.1 Old string formatting
可以使用%
操作符格式化字符串。这种方式像sprintf()
风格一样解析%
左边的格式化参数,并将右边的参数应用到左边,然后返回格式化后的字符串。示例:
>>> import math
>>> print('The value of PI is approximately %5.3f.' % math.pi)
The value of PI is approximately 3.142.
更多信息参见printf-style String Formatting 章节。
7.2 Reading and Writing Files
open()
函数返回文件对象(file object),通常使用两个参数调用:open(filename, mode)
。
>>> f = open('workfile', 'w')
第一个参数是文件的字符串路径。第二个参数是包含几个字符的字符串,描述文件的使用方式。模式r
用于读;w
只用于写(存在的同名文件将会被删除);a
打开文件追加内容,所有写到文件中的内容都会自动添加到文件末尾;r+
打开文件可读可写。模式参数是可选的,r
是默认模式参数。
通常,文件以文本模式打开,意味着可以从文件中读写字符串,字符串以特定的格式编码。如果没有指定字符编码,那默认值是平台相关的编码(参见open()
)。追加到模式参数的b
指定文件以二进制模式打开:数据以字节对象的形式读写。这种模式用于不包含文本的文件。
文本模式中,读文件时默认将平台特定的行尾结束符(Unix中的\n
,Windows中的\r\n
)转换为\n
。以文本模式写文件时,默认将所有出现的\n
转换为平台特定的行尾结束符。这种暗地修改文件数据对于文本文件没有影响,但是会损坏JPEG
或者EXE
之类的文件的数据。使用二进制模式读写这类文件是要谨慎。
处理文件对象时使用with
是比较好的实践。好处是当操作完成后文件可以恰当关闭,即使有异常发生。使用with
比使用与其等价的try
-finally
语句块也简洁得多:
>>> with open('workfile') as f:
... read_data = f.read()
>>> f.closed
True
如果没有使用with
关键字,必须手动调用f.close()
方法关闭文件,立即释放占用的系统资源。如果没有明确关闭文件,Python的垃圾收集程序最终会销毁对象并关闭文件,但是这之前文件会保持打开状态一段时间。另一个风险是不同的Python解释器实现会在不同的时刻做回收操作。
文件对象关闭后,无论通过with
语句还是使用f.close()
试图使用文件对象都会失败:
>>> f.close()
>>> f.read()
Traceback (most recent call last):
File "<stdin>", line 1, in <module>
ValueError: I/O operation on closed file
7.2.1 Methods of File Objects
这个章节以下的示例中,假设已经创建了一个叫做f
的文件对象。
使用f.read(size)
读取文件内容,该方法读取指定数量数据并作为字符串(文本模式)或者字节对象(二进制模式)返回。size是可选的数字参数。size省略或者为负数时,会读取整个文件内容并且返回,如果文件大小比机器内存要大时,全部读取会产生问题。若指定size,至多size大小的字节被读取并返回。如果读到了文件末尾,f.read()
返回空字符串(''
)。
>>> f.read()
'This is the entire file.\n'
>>> f.read()
''
f.readline()
从文件中读取单行,读取到的字符串末尾会自动加上换行符(\n
),只有当文件不以换行符结尾时,读取到文件的最后一行才不会自动加'\n'。这样使得返回值不会含糊不清,如果f.readline()
返回空字符串时,那么就读到了文件末尾,而空行则返回\n
表示,这是一个只包含单个换行符的字符串。
>>> f.readline()
'This is the first line of the file.\n'
>>> f.readline()
'Second line of the file\n'
>>> f.readline()
''
使用迭代文件对象的方式,从文件中读取行。这种方式内存高效,快速,代码简洁:
>>> for line in f:
... print(line, end='')
...
This is the first line of the file.
Second line of the file
如果需要读取文件所有行到列表中,可以使用list(f)
或者f.readlines()
。
f.write(string)
将内容string写入文件,返回写入的字符串数。
>>> f.write('This is a test\n')
15
其他类型的对象在写入之前对象需要转换,要么转换为字符串(文本模式),要么转换为字节对象(二进制模式):
>>> value = ('the answer', 42)
>>> s = str(value) # convert the tuple to string
>>> f.write(s)
18
在二进制模式中,f.tell()
方法返回一个数字,该数字指示文件对象在文件中的当前位置,是相对于文件开始的字节数目。在文本模式中,该方法返回一个模糊的数字。
使用f.seek(offset, from_what)
改变文件对象的位置。offset(偏移量)加上from_what参数指定的参考点计算出要移动到的位置。from_what值为0时表示文件开头为参考点,1表示当前文件位置为参考点,2表示文件末尾为参考点。from_what可以省略,默认为0,指示文件开头为参考点。
>>> f = open('workfile', 'rb+')
>>> f.write(b'0123456789abcdef')
16
>>> f.seek(5) # Go to the 6th byte in the file
5
>>> f.read(1)
b'5'
>>> f.seek(-3, 2) # Go to the 3rd byte before the end
13
>>> f.read(1)
b'd'
文本文件中(没有使用b
,以文本模式打开),只允许使用相对于文件开头的seek()
方法(使用seek(0, 2)
寻找文件末尾例外),并且有效的offset值(偏移量)只能是f.tell()
的返回值或者0。任何其他的offset值(偏移量)都会发生未定义的行为。
文件对象有一些额外的方法,比如很少使用的isatty()
和truncate()
。查阅库文件手册获取关于文件对象的完整信息。
7.2.2 Saving structured data with json
字符串可以很容易从文件中读取或写入到文件中。由于read()
方法只返回字符串,数字需要额外转换,使用如int()
的函数,输入字符串'123'
返回数字值123。当希望保存更为复杂的数据类型,像嵌套列表或者字典之类的,手动解析和序列化就变得复杂了。
不需要用户不断编写和调试保存复杂数据类型到文件的代码,Python提供了流行的数据交换格式JSON(JavaScript Object Notation)。标准模块json
可以接收Python数据结构,并把它们转换为字符串表示形式,这个过程称为序列化。从字符串形式重新构造数据称为反序列化。在序列化合反序列换之间,字符串形式表示的对象可以存储到文件或者数据中,或者通过网络连接发送到远程目标机器。
注解:JSON格式普遍用于现代应用程序中,用于数据交换。许多程序员已经熟悉了,是一种不错的协作选择
可以使用以下代码查看对象x
的JSON字符串表示形式:
>>> import json
>>> json.dumps([1, 'simple', 'list'])
'[1, "simple", "list"]'
另一种dumps()
方法的变种,dump()
,该方法简单将对象序列化到文本文件。如果f
是已经以写模式打开的文本文件对象,可以使用如下代码:
json.dump(x, f)
可以再次解码对象,如果f
是以读模式打开的文本文件对象:
x = json.load(f)
以上是可以处理列表和字典的简单序列化技术,但是要处理任意类实例需要额外的操作。json
模块的参考内容包含以下解释:
参见:
pickle
- pickle模块与JSON不同,pickle是一种协议,允许任意复杂Python对象序列化。就这一点论,它只能用于 Python, 而不能用于与其他语言编写的应用程序通信。默认情况下它是不安全的:如果数据由熟练的攻击者精心制作, 反序列化来自一个不受信任源的 pickle 数据可以执行任意代码。
[译]The Python Tutorial#7. Input and Output的更多相关文章
- [译]The Python Tutorial#11. Brief Tour of the Standard Library — Part II
[译]The Python Tutorial#Brief Tour of the Standard Library - Part II 第二部分介绍更多满足专业编程需求的高级模块,这些模块在小型脚本中 ...
- [译]The Python Tutorial#6. Modules
[译]The Python Tutorial#Modules 6. Modules 如果你从Python解释器中退出然后重新进入,之前定义的名字(函数和变量)都丢失了.因此,如果你想写长一点的程序,使 ...
- [译]The Python Tutorial#10. Brief Tour of the Standard Library
[译]The Python Tutorial#Brief Tour of the Standard Library 10.1 Operating System Interface os模块为与操作系统 ...
- [译]The Python Tutorial#2. Using the Python Interpreter
[译]The Python Tutorial#Using the Python Interpreter 2.1 Invoking the Interpreter Python解释器通常安装在目标机器的 ...
- [译]The Python Tutorial#8. Errors and Exceptions
[译]The Python Tutorial#Errors and Exceptions 到现在为止都没有过多介绍错误信息,但是已经在一些示例中使用过错误信息.Python至少有两种类型的错误:语法错 ...
- [译]The Python Tutorial#4. More Control Flow Tools
[译]The Python Tutorial#More Control Flow Tools 除了刚才介绍的while语句之外,Python也从其他语言借鉴了其他流程控制语句,并做了相应改变. 4.1 ...
- [译]The Python Tutorial#12. Virtual Environments and Packages
[译]The Python Tutorial#Virtual Environments and Packages 12.1 Introduction Python应用经常使用不属于标准库的包和模块.应 ...
- [译]The Python Tutorial#1. Whetting Your Appetite
[译]The Python Tutorial#Whetting Your Appetite 1. Whetting Your Appetite 如果你需要使用计算机做很多工作,最终会发现很多任务需要自 ...
- [译]The Python Tutorial#5. Data Structures
[译]The Python Tutorial#Data Structures 5.1 Data Structures 本章节详细介绍之前介绍过的一些内容,并且也会介绍一些新的内容. 5.1 More ...
随机推荐
- 使用jQuery实现文本框input定位到文字最后(兼容所有浏览器)
$.fn.setCursorPosition = function(position){ if(this.lengh == 0) return this; return $(this).setSele ...
- SpringMVC04 很杂很重要(注解,乱码处理,通配符,域属性调用,校正参数名称,访问路径,请求、响应携带参数,请求方法)
1.导入架包 <project xmlns="http://maven.apache.org/POM/4.0.0" xmlns:xsi="http://www.w3 ...
- Docker for mac 安装 kong
首先安装一个 PostgreSQL,选的版本是 9.5 $ docker run -d --name kong-database \ -p : \ -e "POSTGRES_USER=kon ...
- xml 文件转化Dictionary
下面是xml文件 <?xml version="1.0" encoding="utf-8" ?><nodes> <国土局> ...
- Spring之Quartz定时任务和Cron表达式详解
1.定时业务逻辑类 public class ExpireJobTask { /** Logger */ private static final Logger logger = LoggerFact ...
- JVM(一):Java内存区域与内存溢出异常
一.运行时数据区 共分为5块: 程序计数器 (线程私有,当前线程所执行的字节码的行号指示器) Java虚拟机栈 (线程私有,证明周期与线程相同,描述的是Java方法执行的内存模型,每个方法 ...
- 使用C#版OpenCV进行圆心求取
OpenCVSharp是OpenCV的.NET wrapper,是一名日本工程师开发的,项目地址为:https://github.com/shimat/opencvsharp. 该源码是 BSD开放协 ...
- LeetCode Remove Duplicates from Sorted List 删除有序链表中的重复结点
/** * Definition for singly-linked list. * struct ListNode { * int val; * ListNode *next; * ListNode ...
- java核心技术 要点笔记3
1.类,超类和子类 2.Object:所有类的超类 3.泛型数组列表 4.对象包装器和自动装箱 5.参数数量可变的方法 6.枚举类 7.反射 8.继承设计的技巧
- Android(java)学习笔记83:各种边距设置
1. 各种边距设置: (1)android:layout_paddingLeft 内边距,对谁用,指的是谁的内部内容边距 (2)android:layout_marginLeft 外边距,对谁用,指的 ...