f = open('test.txt', 'r') # 'r' 表示只读
s = f.read() # 调用read()方法可以一次读取文件的全部内容,Python把内容读到内存,用一个str对象表示
print(s)
f.close() # 由于文件读写时都有可能产生IOError,一旦出错,后面的f.close()就不会调用。所以,为了保证无论是否出错都能正确地关闭文件,我们可以使用try ... finally来实现: try:
f = open('test.txt','r')
print(f.read())
finally:
if f:
f.close() # 但是每次都这么写实在太繁琐,所以,Python引入了with语句来自动帮我们调用close()方法: with open('test.txt','r') as f:
print(f.read()) # 这和前面的try ... finally是一样的,但是代码更佳简洁,并且不必调用f.close()方法。 # 调用read()会一次性读取文件的全部内容,如果文件有10G,内存就爆了,
# 所以,要保险起见,可以反复调用read(size)方法,每次最多读取size个字节的内容。
# 也可以 用readline()可以每次读取一行内容,调用readlines()一次读取所有内容并按行返回list。 # 如果文件很小,read()一次性读取最方便;
# 如果不能确定文件大小,反复调用read(size)比较保险;
# 如果是配置文件,调用readlines()最方便 f = open('test.txt', 'r')
for line in f.readlines():
print(line.strip()) # file-like Object # 动态语言没有严格的继承体系限制,只要“act like a duck” 那么就是一只鸭子。
# open 函数返回的是 有 read() 方法的对象。除了file外,还可以是内存的字节流,网络流,自定义流等等。file-like Object不要求从特定类继承,只要写个read()方法就行。 # 二进制文件 f = open('laopo.jpg', 'rb') # 用'rb'模式打开二进制文件
# print(f.read()) # 字符编码 # 要读取非UTF-8编码的文本文件,需要给open()函数传入encoding参数,例如,读取GBK编码的文件: # f = open('/Users/michael/gbk.txt', 'r', encoding='gbk') # 遇到有些编码不规范的文件,你可能会遇到UnicodeDecodeError,因为在文本文件中可能夹杂了一些非法编码的字符。遇到这种情况,open()函数还接收一个errors参数,表示如果遇到编码错误后如何处理。最简单的方式是直接忽略: # f = open('/Users/michael/gbk.txt', 'r', encoding='gbk', errors='ignore') # 写文件 # 参数改为 w 或 wb 表示写普通文件或二进制文件
# a 表示在文件末尾追加
# 具体模式定义参见文档:https://docs.python.org/3/library/functions.html#open
f = open('text.txt', 'w')
f.write('Hello, world!') # 小结:在Python中,文件读写是通过open()函数打开的文件对象完成的。使用with语句操作文件IO是个好习惯。 ############################################################ # StingIO
# 就是在内存中创建的临时 file-like Object,常常用作临时缓冲 from io import StringIO
f = StringIO()
f.write('hello')
f.write(' ')
f.write('world!') print(f.getvalue()) # BytesIO # 如果要操作二进制数据,就需要使用BytesIO。 from io import BytesIO
f = BytesIO()
f.write('中文'.encode('utf-8'))
print(f.getvalue()) # StringIO和BytesIO是在内存中操作str和bytes的方法,使得和读写文件具有一致的接口。 ############################################################ # 操作文件和目录 # Python内置的os模块也可以直接调用操作系统提供的接口函数。 import os
print(os.name) # 如果是posix,说明系统是Linux、Unix或Mac OS X,如果是nt,就是Windows系统。 # os模块的某些函数是跟操作系统相关的。 # 环境变量 # print(os.environ) # 要获取某个环境变量的值,可以调用os.environ.get('key') # print(os.environ.get('PATH')) # 操作文件和目录的函数一部分放在os模块中,一部分放在os.path模块中,这一点要注意一下。
# 查看、创建和删除目录可以这么调用: # 查看当前绝对路径
p = os.path.abspath('.')
print(p) # 在某个目录下面创建一个新目录
os.mkdir("E://bb")
os.rmdir("E://bb") '''
把两个路径合成一个时,不要直接拼字符串,而要通过os.path.join()函数,这样可以正确处理不同操作系统的路径分隔符。在Linux/Unix/Mac下,os.path.join()返回这样的字符串: part-1/part-2
而Windows下会返回这样的字符串: part-1\part-2
''' print(os.path.join(r'\Users\michael', 'testdir')) # 同样的道理,要拆分路径时,也不要直接去拆字符串,而要通过os.path.split()函数,这样可以把一个路径拆分为两部分,后一部分总是最后级别的目录或文件名: p = os.path.split(r'C:\Users\michael\testdir\file.txt')
print(p) # os.path.splitext()可以直接让你得到文件扩展名,很多时候非常方便: p = os.path.splitext(r'C:\Users\michael\testdir\file.txt')
print(p) # 这些合并、拆分路径的函数并不要求目录和文件要真实存在,它们只对字符串进行操作。 # 对文件重命名:
# os.rename('test.txt', 'test.py')
# 删掉文件:
# os.remove('test.py') # 如何利用Python的特性来过滤文件。 # 列出当前目录下的所有目录: L = [x for x in os.listdir('.') if os.path.isdir(x)]
print(L) # 列出当前目录下所有的.py后缀的文件 L = [x for x in os.listdir('.') if os.path.isfile(x) and os.path.splitext(x)[1]=='.py']
print(L) # 练习
#实现dir -l
import os def mydir(path):
if os.path.exists(path):
L = [(path+x) for x in os.listdir(path)]
print(L)
else:
print('The path not exists!') #编写一个程序,能在当前目录以及当前目录的所有子目录下查找文件名包含指定字符串的文件,并打印出相对路径。 def findrelapath(path):
if os.path.exists(path):
L = os.listdir(path)
for x in L:
newpath = os.path.join(path,x)
if os.path.isfile(newpath):
print(x)
elif os.path.isdir(newpath):
findrelapath(newpath)
else:
print('The path not exists!') #################################################################################### # 序列化 # 在程序运行的过程中,所有的变量都是在内存中的
# 一旦程序结束,变量所占用的内存就被操作系统全部回收。
# 把变量从内存中变成可存储或传输的过程称之为序列化,在Python中叫pickling,在其他语言中也被称之为serialization,marshalling,flattening等等,都是一个意思
# 序列化之后,就可以把序列化后的内容写入磁盘,或者通过网络传输到别的机器上。
# 反过来,把变量内容从序列化的对象重新读到内存里称之为反序列化,即unpickling。
# Python提供了pickle模块来实现序列化。 import pickle
d = dict(name='bob', age=20, score=88) print(d['name'])
print(d['age']) print(pickle.dumps(d)) # pickle.dumps()方法把任意对象序列化成一个bytes,然后,就可以把这个bytes写入文件。 f = open('dump.txt', 'wb')
pickle.dump(d,f)
f.close() # 看看写入的dump.txt文件,一堆乱七八糟的内容,这些都是Python保存的对象内部信息。
# 当我们要把对象从磁盘读到内存时,可以先把内容读到一个bytes,然后用pickle.loads()方法反序列化出对象,也可以直接用pickle.load()方法从一个file-like Object中直接反序列化出对象。 f = open('dump.txt', 'rb')
e = pickle.load(f)
f.close()
print(e) # 变量的内容又回来了!不过,这个变量和原来的变量是完全不相干的对象,它们只是内容相同而已。
# Pickle的问题和所有其他编程语言特有的序列化问题一样,就是它只能用于Python,并且可能不同版本的Python彼此都不兼容 # JSON # 如果我们要在不同的编程语言之间传递对象,就必须把对象序列化为标准格式,比如XML,但更好的方法是序列化为JSON,因为JSON表示出来就是一个字符串,可以被所有语言读取,也可以方便地存储到磁盘或者通过网络传输。JSON不仅是标准格式,并且比XML更快,而且可以直接在Web页面中读取,非常方便。 # JSON表示的对象就是标准的JavaScript语言的对象,JSON和Python内置的数据类型对应如下: # Python内置的json模块提供了非常完善的Python对象到JSON格式的转换。我们先看看如何把Python对象变成一个JSON: '''
JSON类型 Python类型
{} dict
[] list
"string" str
1234.56 int 或 float
true/false True/False
null None
''' import json
d = dict(name='bob', age=20, score=88)
f = open('json.txt','w')
json.dump(d,f)
f.close() # dumps()方法返回一个str,内容就是标准的JSON。
# .txt 文件中的内容:{"name": "bob", "age": 20, "score": 88} # 要把JSON反序列化为Python对象,用loads()或者对应的load()方法,
# 前者把JSON的字符串反序列化,后者从file-like Object中读取字符串并反序列化: f = open('json.txt','r')
s = f.read()
d = json.loads(s)
print(d)
f.close()

python learning IO.py的更多相关文章

  1. python learning OOP2.py

    class Student(object): pass s = Student() s.name = 'Chang' # 给一个实例动态绑定一个属性 print(s.name) def set_age ...

  2. python learning OOP1.py

    class Student(object): # 构造函数 # 第一个参数永远是 self 表示一个实例本身,但是传参的时候不需要传 # 在Python中,实例的变量名如果以__开头,就变成了一个私有 ...

  3. python learning Exception & Debug.py

    ''' 在程序运行的过程中,如果发生了错误,可以事先约定返回一个错误代码,这样,就可以知道是否有错,以及出错的原因.在操作系统提供的调用中,返回错误码非常常见.比如打开文件的函数open(),成功时返 ...

  4. Python异步IO --- 轻松管理10k+并发连接

    前言   异步操作在计算机软硬件体系中是一个普遍概念,根源在于参与协作的各实体处理速度上有明显差异.软件开发中遇到的多数情况是CPU与IO的速度不匹配,所以异步IO存在于各种编程框架中,客户端比如浏览 ...

  5. Python Learning

    这是自己之前整理的学习Python的资料,分享出来,希望能给别人一点帮助. Learning Plan Python是什么?- 对Python有基本的认识 版本区别 下载 安装 IDE 文件构造 Py ...

  6. python异步IO编程(二)

    python异步IO编程(二) 目录 开门见山 Async IO设计模式 事件循环 asyncio 中的其他顶层函数 开门见山 下面我们用两个简单的例子来让你对异步IO有所了解 import asyn ...

  7. python下编译py成pyc和pyo

     python下编译py成pyc和pyo   其实很简单, 用 python -m py_compile file.py python -m py_compile /root/src/{file1,f ...

  8. python 装 ez_setup.py 出错

    python 装 ez_setup.py出错setuptools,pip,install,UnicodeDecodeError: 'ascii' codec can't decode byte.解决: ...

  9. Python文件IO

    Python文件IO 有如下文本内容,文件路径为D:\temp,文件名称为lyric.txt, line1 Look ! line2 If U had one shot line3 One oppor ...

随机推荐

  1. JavaWeb基础—MVC与三层架构

    一.MVC的概念 MVC模式(Model–view–controller)是软件工程中的一种软件架构模式,把软件系统分为三个基本部分:模型(Model).视图(View)和控制器(Controller ...

  2. 20155325 2017-2018 1 课上测试、课下作业、实验——码云&博客链接汇总 《信息安全系统设计基础》

    第二周-课上 码云 https://gitee.com/bestiisjava2017/XinXiAnQuanXiTongSheJiJiChu20155325thl/tree/master/0927 ...

  3. LOJ #2473. 「九省联考 2018」秘密袭击

    #2473. 「九省联考 2018」秘密袭击 链接 分析: 首先枚举一个权值W,计算这个多少个连通块中,第k大的数是这个权值. $f[i][j]$表示到第i个节点,有j个大于W数的连通块的个数.然后背 ...

  4. Wannafly挑战赛24 B 222333

    小水题???但是时间限制异常鬼畜,跑了2min \(P | (2^m)*(3^n)-1\)的意思就是\(2^m 3^n = 1 (\text{mod }P)\) 设f[i]表示3^k=i的最小的k 然 ...

  5. 微信小程序——手把手教你写一个微信小程序

    前言 微信小程序年前的跳一跳确实是火了一把,然后呢一直没有时间去实践项目,一直想搞但是工作上不需要所以,嗯嗯嗯嗯嗯emmmmm..... 需求 小程序语音识别,全景图片观看,登录授权,获取个人基本信息 ...

  6. rabbitMQ的三种路由模式

    rabbitMQ工作流程: 1.声明交换机 2.声明消息队列 3.绑定交换机和队列 4.生产者往交换机里发送新消息 5.交换机根据所选的模式和routingKey决定消息发往哪条消息队列 6.一个消费 ...

  7. VB.NET 仿Edge风格的TabControl控件

    原本是想写个Chrome内核的浏览器,但是.net语言下比较好用类库的并不多,尝试过CefSharp.Xilium.CefGlue,都发现很多坑,所以这个项目就烂尾了,现在将还有点用的代码发出来给大家 ...

  8. 用人工智能学习,凡亿推出PCB问题解答智能搜索机器人:pcb助手

    对于学习者,你是不是经常遇到这样的问题:在我们狠狠下定决心学习PCB技术的时候,我们常常遇到很多大大小小的问题,遗憾的是身边没有一个能及时给自己解答问题的高手指点,通过论坛.群等方式询问可能半天也得不 ...

  9. gith命令行使用之上传和删除

    git这个工具的功能很强大,而使用git bash的命令行来进行git工具的操作尤为重要.而且我个人认为,用命令行进行git工具的操作比起图形界面的git工具,要更容易理解.图形界面的那个叫Torto ...

  10. 【转】Linux - CentOS 7网络配置

    Linux - CentOS 7网络配置 https://blog.csdn.net/J080624/article/details/78083988   安装完VM后,需要进行网络配置.第一个目标为 ...