这里将介绍函数和对象--文件和流,让你在程序调用期间存储数据,并且可以处理来自其他程序的数据。

一. 打开文件

1.1 open函数

open函数用来打开文件,语法如下:open(name,[.mode[.buffer]])

它有唯一一个强制参数,就是文件名,然后返回一个文件对象。参数-模式和缓冲都是可选的。

使用范例:(如果文件不存在,就会报错)

>>> f = open('c:\\text\\test.txt')   #windows下

Traceback (most recent call last):
File "<pyshell#5>", line 1, in <module>
f = open('c:\text\test.txt')
IOError: [Errno 22] invalid mode ('r') or filename: 'c:\text\test.txt'

(1)模式

如果要向文件中写入内容,则必须提供一个模式参数来显式声明。读取文件对象时指定或不指定读模式是一样的效果。

下面是模式常用值:

值                描述
‘r’ 读模式
'w' 写模式
'a' 追加模式
'b' 二进制模式(可添加到其他模式中):改变处理文件的方法,如二进制文件 ‘rb’
'+' 读/写模式(可添加到其他模式中):‘r+’表示读写

(2)缓冲

open函数的第三个参数控制着文件的缓冲。

如果参数是0,I/O就是无缓冲的,所有读写操作都是直接针对硬盘的;

如果参数是1,I/O就是有缓冲的,用内存代替硬盘,让程序更快,只有使用flush或者close时才会更新硬盘上的数据;

如果参数大于1,参数的数字代表缓冲区的大小;

如果参数是-1,代表使用默认的缓冲区大小;

二. 基本文件方法

2.1 读和写:假设test.txt文本中存了“hello,world!”

(1)读:f.read(字符个数),可以指定字符个数,不指定时,会读取之前读取过的全部剩余部分;

>>> f = open('D:\\python\\test.txt')
>>> f.read(3)
'hel'
>>> f.read()
'lo,world!'

注意:在读取文件时,可以省略模式说明,因为‘r’是默认的。

(2)写:f.write(string),新写入的数据会覆盖掉原有的数据,在关闭文件前,后续的write操作内容会被追加到文件已存在部分的后面;

>>> f = open('D:\\python\\test.txt','r+')
>>> f.write(' bangbangjiang')
>>> f.write('hao')
>>> f.read()
' bangbangjianghao'
>>> f.read()

2.2 管道输出

在UNIX的shell中,使用管道可以在一个命令后面续写其他的多个命令。

例如: $ cat somefile.txt | python somesctript.py | sort

第一个命令是把somefile.txt中的内容写到标准输出;

第二个命令运行了一个python脚本,脚本内容应该是从标准输入读,把结果写入到标准输出;

第三个命令是从标准输入读取所有的文本,按字母排序,然后把结果写入标准输出;

管道符合“|”就是将一个命令的标准输出和下一个命令的标准输入连在一起。

2.3 读写行

(1) file.readline():读取单独的一行,从当前位置开始直到一个换行符的出现(不同平台上的换行符查看os.linesep);如果含有参数(非负的整数),它表示读取的字符最大值。

>>> f = open('D:\\python\\test.txt')
>>> for i in range(3):
print str(i) + ':' + f.readline() 0:hello,world! 1:welcome to here! 2:there is nothing! >>> f.close()

注意:上面的例子可以看出,换行符也会被读出!!读出的句子之间都有一个空行。

(2) file.readlines():读取一个文件的所有行并将其作为列表返回;

>>> f = open('D:\\python\\test.txt')
>>> f.readlines()
['hello,world!\n', 'welcome to here!\n', 'there is nothing!']

(3) file.writelines():参数是一个字符串列表,它会把所有的字符串写入文件。注意,程序不会增加新行,需要自己添加。

>>> f = open('D:\\python\\test.txt')
>>> lines = f.readlines()
>>> lines
['I \n', 'am \n', 'a writer!']
>>> f.close()
>>> f = open('D:\\python\\test.txt','w')
>>> lines[1] = 'am not\n'
>>> f.writelines(lines)
>>> f.close() #文本内容如下:
I
am not
a writer!

2.4 关闭文件

通常一个文件对象在退出程序后会自动关闭,但是对于写入过的文件总是应该关闭,因为python可能会缓存写入的数据,如果程序因为某些原因崩溃了,那么数据根本不会被写入文件,为了安全起见,要在使用完文件后关闭。

如果想确保文件被关闭,那么应该使用try/finally语句,并且在finally子句中调用close方法。

f = open('D:\\python\\test.txt','w')
try:
f.write("sss")
finally:
f.close()

事实上,还有一个语句专门是为这种情况设计的:with

with open('D:\\python\\test.txt','w') as f:
f.write("aaaa")

文件在语句结束之后会被自动关闭,即便是由于异常引起的结束也是这样。

三. 对文件内容进行迭代

对文件内容进行迭代以及重复执行一些操作,是最常见的文件操作之一。

假设do_something.py中有一个函数叫do_something(),运行之:

def do_something(string):
print "hello, " , string

3.1 按字节处理

最常见的对文件内容进行迭代的方法是在while循环中使用read方法。

>>> f.open('do_something.py')
>>> while True:
char = f.read(1)
if not char:break
do_something(char) hello,  def do_something(string): hello,      print "hello, " , string hello, 
>>> f.close()

3.2 按行操作

当处理文件时,经常对文件的行进行迭代。

>>> f.open('do_something.py')
>>> while True:
line = f.readline()
if not line:break
do_something(line) hello,  def do_something(string): hello,      print "hello, " , string hello, 
>>> f.close()

3.3 读取所有内容

如果文件不大,可以用read()方法一次读取整个文件,但如果文件比较大,使用readlines方法比较好。

>>> f.open('do_something.py')
>>> for char in f.read():
do_something(char) hello,  def do_something(string): hello,      print "hello, " , string hello, 
>>> f.close()

或者:

>>> f.open('do_something.py')
>>> for line in f.readlines():
do_something(line) hello,  def do_something(string): hello,      print "hello, " , string hello, 
>>> f.close()

3.4 使用fileinput实现懒惰行迭代

在需要对一个非常大的文件进行行迭代时,readlines所占用的内存会非常多。用for循环可以使用一个名为懒惰行迭代的方法,说它懒惰是因为它只是读取实际需要的文件部分。

>>> import fileinput
>>> for line in fileinput.input('D:\\python\\do_something.py'):
do_something(line) hello, def do_something(string): hello, print "hello, " , string hello,

3.5 文件迭代器

从2.2版本的python开始,文件对象是可迭代的!这意味着可以直接在for循环中使用它们,从而对它们进行迭代。

f = open('D:\\python\\do_something.py')
>>> for line in f:
do_something(line) hello, def do_something(string): hello, print "hello, " , string hello, >>> f.close()

注意:sys.stdin是可迭代的,就是其他的文件对象:

>>> import sys
>>> for line in sys.stdin:
do_something(line)

python学习笔记之十:文件和素材的更多相关文章

  1. Python学习笔记(十四)

    Python学习笔记(十四): Json and Pickle模块 shelve模块 1. Json and Pickle模块 之前我们学习过用eval内置方法可以将一个字符串转成python对象,不 ...

  2. Python学习笔记(十)

    Python学习笔记(十): 装饰器的应用 列表生成式 生成器 迭代器 模块:time,random 1. 装饰器的应用-登陆练习 login_status = False # 定义登陆状态 def ...

  3. Python学习笔记之从文件中读取数据

    10-1 Python 学习笔记:在文本编辑器中新建一个文件,写几句话来总结一下你至此学到的Python 知识,其中每一行都以“In Python you can”打头.将这个文件命名为learnin ...

  4. Python学习笔记(十四):模块高级

    以Mark Lutz著的<Python学习手册>为教程,每天花1个小时左右时间学习,争取两周完成. --- 写在前面的话 2013-7-23 21:30 学习笔记 1,包导入是把计算机上的 ...

  5. Python学习笔记(十五):类基础

    以Mark Lutz著的<Python学习手册>为教程,每天花1个小时左右时间学习,争取两周完成. --- 写在前面的话 2013-7-24 23:59 学习笔记 1,Python中的大多 ...

  6. (C/C++学习笔记) 二十. 文件和流

    二十. 文件和流 ● 文件的概念 文件(file) 一. C/C++语言将文件作为字节序列(sequence of characters)来对待,但从编码角度,或说从对字节信息的解释来看,文件分为:文 ...

  7. Python 学习笔记(十二)Python文件和迭代(二)

    迭代 基本含义 迭代是重复反馈过程的活动,其目的通常是为了接近并到达所需的目标或结果.每一次对过程的重复被称为一次“迭代”,而每一次迭代得到的结果会被用来作为下一次迭代的初始值.  在计算科学中,迭代 ...

  8. Python 学习笔记(十二)Python文件和迭代(一)

    文件 文件和文件夹 文件:文本文件.二进制文件 文件夹:(windows) G:\pythonWorkspace\python\study (linux/mac) /home/workspace/py ...

  9. python学习笔记(十六)之文件

    打开文件用open函数 open(file, mode='r', buffering=-1, encoding=None, errors=None, newline=None, closefd=Tru ...

随机推荐

  1. How to initialize a static const map in c++?

    #include <map> using namespace std; struct A{ static map<int,int> create_map() { map< ...

  2. javacsript (十一) 对象

    他的对象的概念和python的字典的格式一样, JavaScript 对象 对象由花括号分隔.在括号内部,对象的属性以名称和值对的形式 (name : value) 来定义.属性由逗号分隔: var ...

  3. byte为什么要与上0xff(转)

    无意间翻看之间的代码,发现了一段难以理解的代码. byte[] bs = digest.digest(origin.getBytes(Charset.forName(charsetName))) ; ...

  4. C语言scanf函数详解

    函数名: scanf  功 能: 运行格式化输入  用 法: int scanf(char *format[,argument,...]); scanf()函数是通用终端格式化输入函数,它从标准输入设 ...

  5. QT插件开发方式(没看懂)

    创建一个QT的库项目,删除自动生成的.h和.cpp文件,添加一个接口定义.h文件和一个接口实现类(一个.h一个.cpp).代码如下: 1.接口文件源码 #ifndef PLUGININTERFACE_ ...

  6. datarow用linq查询

    List<string> f_guids = (from DataRow dr in dt2.Rows select dr["f_GUID"].ToString()). ...

  7. php 上传文件 $_FILES['']['type']的值

    php 上传文件 $_FILES['']['type']的值 一个函数 function upload_file($fname,$ftype,$fsize,$ferror,$ftmp_name,$fp ...

  8. 深刻:截获windows的消息并分析实例(DefWindowProc),以WM_NCHITTEST举例(Windows下每一个鼠标消息都是由 WM_NCHITTEST 消息产生的,这个消息的参数包含了鼠标位置的信息)

    1,回调函数工作机制 回调函数由操作系统自动调用,回调函数的返回值当然也是返回给操作系统了. 2,截获操作系统发出的消息,截获到后,将另外一个消息返回给操作系统,已达到欺骗操作系统的目的. 下面还是以 ...

  9. 玩转Windows服务系列——命令行管理Windows服务

    原文:玩转Windows服务系列——命令行管理Windows服务 说到Windows服务的管理就不得不说通过命令行的方式管理Windows服务,因为无论是系统管理员,还是通过编程的方式调用cmd命令, ...

  10. hdu 2842 Chinese Rings

    点击打开hdu2842 思路: 矩阵快速幂 分析: 1 题目的意思是给定n个环,和一些规则要把所有的环全部拆下最少需要的步数 2 题目规定如果要拆第n个环,那么第n-1个要挂着,n-2环要被拆下.那么 ...