python 文件操作

 

一、python中文件管理

  文件管理是很多应用程序的基本功能和重要组成部分。Python可以使文件管理极其简单,特别是和其它语言相对比。

1.介绍

  几乎以任何语言编写的众多应用程序中,文件管理是很重要的一部分。Python当然也不例外。在这篇文章中,我们将探究如何使用一些模块来操作文件。我们会完成读文件,写文件,增加文件内容的操作,写文件,增加文件内容的操作,还有一些另类的用法。

2.文件读写

  最简单文件操作--读取

1 FileRead = open("test.txt",'r')
2 FileRead.read() #读取文件所有内容,使用print(FileRead.read())函数输出文件内容
3 FileRead.close()
1 FileRead = open("test.txt",'r')
2 for lines in FileRead.readlines():
3 print("lines:",lines.strip('\n'))
4 FileRead.close()
5
6 #输出结果
7 lines: Hello World
8 lines: Welcome To Beijing
Python在读取一个文件时,会记住其在文件中的位置。所有在调用FileRead.readline()的时候会从上次读取的位置开始
1 FileRead = open("test.txt",'r')
2 print(FileRead.readline().strip('\n')) #读取第一行数据
3 print(FileRead.readline().strip('\n')) #读取第二行数据
4 FileRead.close()
使用seek(0)将文件读取的行位置标记到指定的位置
1 FileRead = open("test.txt",'r')
2 print(FileRead.readline().strip('\n')) #读取第一行数据
3 FileRead.seek(0) #将上次读取的位置调回到首行位置
4 print(FileRead.readline().strip('\n')) #读取第一行数据
5 FileRead.close()
使用tell()获取python在文件中的当前位置
1 FileRead = open("test.txt",'r')
2 print(FileRead.readline().strip('\n')) #读取第一行数据
3 print(FileRead.tell()) #获取python所在文件中的当前位置
4 print(FileRead.readline().strip('\n')) #读取第二行数据
5 FileRead.close()

  初级操作--写数据到文件

1 FileRead = open("test.txt",'w') #‘w’--是指文件将被写入数据,已有的数据将会被清空
2 FileRead.write('Hello Everybody!\nWelcome To China!') #被写入文件的数据,使用‘\n’可以实现换行操作
3 FileRead.close() #关闭文件句柄,每次读写文件都应该在最后面将文件关闭
1 FileRead = open("test.txt",'a') #‘a’--是指文件将被写入数据,已有的数据不会被清空,在已有数据后面追加下面要添加的数据
2 FileRead.write('Hello Everybody!\nWelcome To China!') #被写入文件的数据,使用‘\n’可以实现换行操作
3 FileRead.close() #关闭文件句柄,每次读写文件都应该在最后面将文件关闭

  文件的高级操作--‘rb’ 'wb'--使用此模式打开文件是读写二进制文件

二、从现有文件中获取数据

  使用Python中的模块,可以从现有文件中获取信息。使用“os”模块和“stat”模块可以获取文件的基本信息:

 1 #!/usr/local/env python3
2 '''
3 Author:@南非波波
4 Blog:http://www.cnblogs.com/songqingbo/
5 E-mail:qingbo.song@gmail.com
6 '''
7 import os
8 import stat
9 import time
10 FileStats = os.stat('test.txt') #获取文件的基本信息
11 FileInfo = {
12 'Size' : FileStats [ stat.ST_SIZE ], #文件大小
13 'LastModified' : time.ctime(FileStats[ stat.ST_MTIME]),
14 'LastAccessed' : time.ctime(FileStats[stat.ST_ATIME]),
15 'CreationTime' : time.ctime(FileStats[stat.ST_CTIME]),
16 'Mode' : FileStats [ stat.ST_MODE ]
17 }
18 print(FileStats) #os.stat_result(st_mode=33206, st_ino=6473924464448069, st_dev=434835, st_nlink=1, st_uid=0, st_gid=0, st_size=70, st_atime=1451980042, st_mtime=1451981189, st_ctime=1451979747)
19 print(FileInfo) #{'Size': 70, 'Mode': 33206, 'LastAccessed': 'Tue Jan 5 15:47:22 2016', 'LastModified': 'Tue Jan 5 16:06:29 2016', 'CreationTime': 'Tue Jan 5 15:42:27 2016'}

  判断文件是不是目录

 1 #!/usr/local/env python3
2 '''
3 Author:@南非波波
4 Blog:http://www.cnblogs.com/songqingbo/
5 E-mail:qingbo.song@gmail.com
6 '''
7 import os
8 import stat
9 import time
10 def DirIf(FilenName):
11 FileStats = os.stat(FilenName) #获取文件的基本信息
12 FileInfo = {
13 'Size' : FileStats [ stat.ST_SIZE ], #文件大小
14 'LastModified' : time.ctime(FileStats[ stat.ST_MTIME]),
15 'LastAccessed' : time.ctime(FileStats[stat.ST_ATIME]),
16 'CreationTime' : time.ctime(FileStats[stat.ST_CTIME]),
17 'Mode' : FileStats [ stat.ST_MODE ]
18 }
19 if stat.S_ISDIR( FileStats[ stat.ST_MODE ] ): #判断文件是不是目录
20 return True
21 else:
22 return False
对上面封装的函数进行调用的方法:
1
2
3
4
if DirIf('test.txt'== True:
    print("目录")
elif DirIf('test.txt'== False:
    print('非目录')

  判断文件类型

 1 #!/usr/local/env python3
2 '''
3 Author:@南非波波
4 Blog:http://www.cnblogs.com/songqingbo/
5 E-mail:qingbo.song@gmail.com
6 '''
7 import os
8 import stat
9
10 FileStats = os.stat('test.txt')
11 FileMode = FileStats[stat.ST_MODE]
12 if stat.S_ISREG(FileStats[stat.ST_MODE]): #普通文件判断
13 print('Regular file.')
14 elif stat.S_ISDIR(FileStats[stat.ST_MODE]): #目录文件判断
15 print('Directory.')
16 elif stat.S_ISLNK(FileStats[stat.ST_MODE]): #快捷方式(链接)文件
17 print('Shortcut.')
18 elif stat.S_ISSOCK(FileStats[stat.ST_MODE]): #套接字文件
19 print('Socket.')
20 elif stat.S_ISFIFO(FileStats[stat.ST_MODE]): #命名管道文件
21 print('Named pipe.')
22 elif stat.S_ISBLK(FileStats[stat.ST_MODE]): #块设备文件
23 print('Block special device.')
24 elif stat.S_ISCHR(FileStats[stat.ST_MODE]): #特殊字符型文件
25 print('Character special device.')
 1 import os.path
2
3 FileStats = 'test.txt'
4 if os.path.isdir(FileStats): #判断文件是否是目录
5 print('Directory.')
6 elif os.path.isfile(FileStats): #判断文件是否是文件
7 print('File.')
8 elif os.path.islink(FileStats): #判断文件是否是快捷方式(链接)文件
9 print('Shortcut.')
10 elif os.path.ismount(FileStats): #判断文件是否是挂载文件
11 print('Mount point.')

  获取文件中的行数

def Countnum(filename):
files = open(filename)
data = files.read()
files.flush()
files.close()
return data.count('\n')

三、python对目录的操作

  和普通文件一样,关于目录的操作也很容易掌握。首先,列出一个目录的内容:

1 import os
2 for fileName in os.listdir ( '/' ):
3 print(fileName)

  创建目录

1
2
import os
os.mkdir('testDir')

  创建多级目录

1
2
import os
os.makedirs('testDir/test2/test3/test4')  #os.makedirs()

  删除多级空目录

1
2
import os
os.removedirs('testDir/test2/test3/test4')

  删除目录

1
2
import os
os.rmdir('testDir')

四、python对特定类型的文件进行操作

  使用fnmatch模块显示'.txt'和'.exe'文件名

1 import fnmatch
2 import os
3 for FileName in os.listdir('/'):
4 if fnmatch.fnmatch(FileName,'*.txt'):
5 print(open(FileName).read())
6 elif fnmatch.fnmatch(FileName,'*.exe'):
7 print(FileName)

  “fnmatch”模块支持正则表达式:

import fnmatch
import os
import re FilePattern = fnmatch.translate('*.txt')
for FileName in os.listdir('./'):
if re.match(FilePattern,FileName):
print('Text file.')

  使用glob模块查找一种类型的文件比较方便

import glob
for FileName in glob.glob('*.txt'):
print(FileName)
print('Text file.')

  使用数字匹配文件名

import glob
for FileName in glob.glob ( '[0-9].txt' ):
print(Filename)

五、数据编组 

  使用前一节中介绍的模块,可以实现在文件中对字符串的读写。然而,有的时候,你可能需要传递其它类型的数据,如list、tuple、dictionary和其它对象。在Python中,你可以使用Pickling来完成。你可以使用Python标准库中的“pickle”模块完成数据编组。 

  编组一个包含数字和字符的列表:

#!/usr/local/env python3
'''
Author:@南非波波
Blog:http://www.cnblogs.com/songqingbo/
E-mail:qingbo.song@gmail.com
'''
import pickle
FileHandle = open( 'PickleFile.txt','wb')
TestList = ['This',2,'is',1,'a',0,'test.']
pickle.dump(TestList,FileHandle )
FileHandle.close()

  拆分编组:

#!/usr/local/env python3
'''
Author:@南非波波
Blog:http://www.cnblogs.com/songqingbo/
E-mail:qingbo.song@gmail.com
'''
import pickle
FileHandle = open('PickleFile.txt','rb') #注意要加'b'进行二进制读写操作,否则报错
TestList = pickle.load(FileHandle)
print(TestList)
FileHandle.close()

  错误

1
2
TypeError: must be strnot bytes错误:
解答: 写文件处 open(filename, 'w').write 应该写为 open(filename, 'wb').write

  复杂编组:

import pickle

FileHandle = open('PickleFile.txt','wb')
TestList = [ 123, { 'Calories' : 190 }, 'swht', [ 1, 2, 7 ] ]
pickle.dump(TestList,FileHandle)
FileHandle.close()

  拆组:

import pickle

FileHandle = open('PickleFile.txt','rb')
TestList = pickle.load(FileHandle)
print(TestList)
FileHandle.close()

比较:在python2.7版本里还有一个模块,相对于pickle模块而言,处理速度更快。当然在python3已经将其去掉,或者将其性能整合到pickle模块中了。

#!/usr/local/env python2
'''
Author:@南非波波
Blog:http://www.cnblogs.com/songqingbo/
E-mail:qingbo.song@gmail.com
'''
import cPickle FileHandle = open('PickleFile.txt','wb')
TestList = [ 123, { 'Calories' : 190 }, 'swht', [ 1, 2, 7 ] ]
cPickle.dump(TestList,FileHandle)
FileHandle.close()

六、创建虚拟文件

  你用到的许多模块包含需要文件对象作为参数的方法。但是,有时创建并使用一个真实的文件并让人感到有些麻烦。所幸的是,在Python中,你可以使用“StringIO”或者“cStringIO”模块来创建文件并将其保存在内存中,但很不幸的是,这两个模块在python3中都已经被移除。如果你使用的是python2的环境,可以尝试使用一下:

#!/usr/local/env python2
'''
Author:@南非波波
Blog:http://www.cnblogs.com/songqingbo/
E-mail:qingbo.song@gmail.com
'''
import StringIO FileHandle = StringIO.StringIO("Let freedom ring") #创建的文件存在内存中
print(FileHandle.read()) # "Let freedom ring."
FileHandle.close()
#!/usr/local/env python2
'''
Author:@南非波波
Blog:http://www.cnblogs.com/songqingbo/
E-mail:qingbo.song@gmail.com
'''
import cStringIO FileHandle = cStringIO.cStringIO("Let freedom ring") #创建的文件存在内存中
print(FileHandle.read()) # "Let freedom ring."
FileHandle.close()

总结:  

  文件管理,是众多编程语言的程序员在编写应用程序是经常遇到的问题。幸好,和其它语言相比,Python使其出乎意料地容易。Python的标准库中提供了许多相关的模块帮助程序员解决这方面的问题,而它的面向对象的机制也简化了操作。

参考链接:http://mp.weixin.qq.com/s?__biz=MzA4MjEyNTA5Mw==&mid=402454450&idx=2&sn=2f20a3df2a031beb689fe330b227935c&scene=23&srcid=0103i7fhuH1utpUpJSPeg9pW#rd

原文链接:http://blog.csdn.net/wwwjfy/article/details/2575942

os模块学习(转)的更多相关文章

  1. os模块学习小随笔

    os模块为python解释器与操作系统交互的接口 os.popen()   -------Open a pipe to or from command. The return value is an ...

  2. python os模块学习

    一.os模块概述 Python os模块包含普遍的操作系统功能.如果你希望你的程序能够与平台无关的话,这个模块是尤为重要的. 二.常用方法 1.os.name 输出字符串指示正在使用的平台.如果是wi ...

  3. os模块学习+open行数

    os模块的使用https://www.cnblogs.com/juandx/p/4962089.html 注意:新建和关闭文件,可以直接用,无需os模块 python中对文件.文件夹(文件操作函数)的 ...

  4. day5模块学习 -- os模块学习

    python基础之模块之os模块 os模块 os模块的作用: os,语义为操作系统,所以肯定就是操作系统相关的功能了,可以处理文件和目录这些我们日常手动需要做的操作,就比如说:显示当前目录下所有文件/ ...

  5. OS模块学习

    import os,sys s = os.getcwd() #获取当前工作目录,即当前python脚本工作的目录路径 # print(s) # os.chdir('..') #改变当前工作目录 # s ...

  6. pythone函数基础(7)第三方模块学习

    一,time模块学习 import time # print(int(time.time()))#时间戳# res = time.strftime('%Y-%m-%d %H:%M:%S')#取当前格式 ...

  7. day5模块学习 -- time、datetime时间模块

    1.定义 模块:用来从逻辑上组织python(变量,函数,类,逻辑:实现一个功能)代码,本质就是.py结尾的python文件(文件名:test.py,对应的模块名test) 包:用来从逻辑上组织模块的 ...

  8. Python 模块学习:os模块

    一.os模块概述 Python os模块包含普遍的操作系统功能.如果你希望你的程序能够与平台无关的话,这个模块是尤为重要的.(一语中的) 二.常用方法 1.os.name 输出字符串指示正在使用的平台 ...

  9. Python学习总结13:os模块

    os模块包含普遍的操作系统功能,与具体的平台无关.常用于处理文件和目录这些我们日常手动需要做的操作. 1. os模块函数汇总 1) os.name():判断现在正在实用的平台,Windows 返回 ‘ ...

随机推荐

  1. TensorFlow高级API(tf.contrib.learn)及可视化工具TensorBoard的使用

    一.TensorFlow高层次机器学习API (tf.contrib.learn) 1.tf.contrib.learn.datasets.base.load_csv_with_header 加载cs ...

  2. java线程安全— synchronized和volatile

    java线程安全— synchronized和volatile package threadsafe; public class TranditionalThreadSynchronized { pu ...

  3. MFC加速键

    添加的函数:    } // 解释说明    MFC对话框不自动处理加速键,你必须自己编写代码来做这件事情.为了理解弄清楚这是为什么,让我们回首Windows开发的历程,在使用C和原始的Windows ...

  4. IIS10和Tomcat8整合

    在网上找了很久,也试了很多,都没有弄好.后来根据这个博客,做一些小修小改,终于成功了. 我是从里面的IIS与TOMCAT整合那里开始看的.第一步上面要创建一个注册表,我没有创建.我是创建了一个名为&q ...

  5. The New Day

    于博毅 160809107 爱好电脑研究 选大学专业的时候,把计算机类放在了第一专业,当时从小就很喜欢计算机,以前有接触过编程但仅限于看书,并没有动手实践过,选课的时候看了一下专业课程,都是我想学的 ...

  6. BAT批处理(六)

    字符串处理 批处理有着具有非常强大的字符串处理能力,其功能绝不低于C语言里面的字符串函数集.批处理中可实现的字符串处理功能有:截取字符串内容.替换字符串特定字段.合并字符串.扩充字符串等功能.下面对这 ...

  7. Lucene笔记二

    lucene 的排序 package cn.itcast.lucene; import java.io.IOException; import org.apache.lucene.document.D ...

  8. linux 服务器丢包故障排查

    项目开了个P2P服务器,但是运行一段时间就会出现丢包问题,具体表现为:1.udp丢包严重(一分钟收发分别1.5W) 2.ssh(用于运维指令)连接不上该服务器(超时) 3.服务器运行好像没什么异常,u ...

  9. hdu 3339 In Action (最短路径+01背包)

    In Action Time Limit: 2000/1000 MS (Java/Others)    Memory Limit: 32768/32768 K (Java/Others)Total S ...

  10. 51nod 1286 三段子串(树状数组+拓展kmp)

    题意: 给定一个字符串S,找到另外一个字符串T,T既是S的前缀,也是S的后缀,并且在中间某个地方也出现一次,并且这三次出现不重合.求T最长的长度. 例如:S = "abababababa&q ...