一、文件操作的基本流程

计算机操作文件的过程

#1. 打开文件,得到文件句柄并赋值给一个变量
#2. 通过句柄对文件进行操作
#3. 关闭文件

1.文件的打开过程

# f被程序持有,文件被操作系统持有
f = open('file.txt', 'r', encoding='utf-8') # r读文件,文件一定要提前存在 #2. 通过句柄对文件进行操作
data=f.read()
#3. 关闭文件
f.close()

f=open('file.txt','r')的过程分析:
#1、由应用程序向操作系统发起系统调用open(...)
#2、操作系统打开该文件,并返回一个文件句柄给应用程序
#3、应用程序将文件句柄赋值给变量f

2.操作文件方法

# 操作文件
# data = f.read() # 读所有内容
# print(data) # data = f.read(2) # 读指定字节数或字符数
# print(data)
# d1 = f.read(1) # 在当前位置接着再读1个字节或字符
# print(d1) # line = f.readline() # 读取一行
# print(line) # lines = f.readlines() # 按行,将所有行一次一次读出到list中
# print(lines) # 关闭文件
# f.close() # 操作系统对文件的持有权一定要在文件操作完毕后释放w = open(r'file.txt', 'w', encoding='utf-8')
w.write('123\n')
w.flush() # 数据量过大时,可以手动将内存中的数据刷新到硬盘中
w.write('456\n')
w.writelines(['000\n', '111\n', '222\n']) # 是否可读可写
print(w.readable())
print(w.writable()) w.close()
# 文件的遍历:

# 最常用读写
with open('source', 'r', encoding='utf-8') as f1, open('target', 'w', encoding='utf-8') as f2:
for line in f1:
f2.write(line)

#掌握
f.read() #读取所有内容,光标移动到文件末尾
f.readline() #读取一行内容,光标移动到第二行首部
f.readlines() #读取每一行内容,存放于列表中 f.write('1111\n222\n') #针对文本模式的写,需要自己写换行符
f.write('1111\n222\n'.encode('utf-8')) #针对b模式的写,需要自己写换行符
f.writelines(['333\n','444\n']) #文件模式
f.writelines([bytes('333\n',encoding='utf-8'),'444\n'.encode('utf-8')]) #b模式 #了解
f.readable() #文件是否可读
f.writable() #文件是否可读
f.closed #文件是否关闭
f.encoding #如果文件打开模式为b,则没有该属性
f.flush() #立刻将文件内容从内存刷到硬盘
f.name

二、文件的操作模式

主模式:
r: 文件必须存在的读
w: 文件无需存在的写,无创建,有清空再写
a: 文件无需存在的写,无创建,有在文件最后追加写 从模式:
t: 按文本字符操作数据(默认模式)
b: 按文本字节操作数据
+: 可读可写 了解:
x:新建文件写,如果文件已存在,抛异常
#1. 打开文件的模式有(默认为文本模式):
r ,只读模式【默认模式,文件必须存在,不存在则抛出异常】
w,只写模式【不可读;不存在则创建;存在则清空内容】
a, 之追加写模式【不可读;不存在则创建;存在则只追加内容】 #2. 对于非文本文件,我们只能使用b模式,"b"表示以字节的方式操作(而所有文件也都是以字节的形式存储的,使用这种模式无需考虑文本文件的字符编码、图片文件的jgp格式、视频文件的avi格式)
rb
wb
ab
注:以b方式打开时,读取到的内容是字节类型,写入时也需要提供字节类型,不能指定编码 #3. 了解部分
"+" 表示可以同时读写某个文件
r+, 读写【可读,可写】
w+,写读【可读,可写】
a+, 写读【可读,可写】

3.with...open..语法

# with open语法
with open('file.txt', 'x', encoding='utf-8') as f: # 不需要明文书写f.close()
# data = f.read()
# print(data)
print(f.readable())
print(f.writable()) # 追加模式
with open('file.txt', 'a', encoding='utf-8') as f:
f.write('123\n')
print(123)
print(123)
f.write('456\n')
f.flush()
f.write('789\n')

4. 字节方式操作文件

"""
你好
好的
123
"""
# 注:b操作模式下不需要指定encoding,
# 原因,因为b可以对所有类型数据进行操作,包含文本/视频/音频等各种文件
# 而utf-8只是文本文件的编码方式
# 数据在硬盘中本就以二进制进行存储的,所有b默认操作就是对数据从硬盘到内存的拷贝
with open('file.txt', 'rb') as f:
data = f.read()
print(data)
# 但如果数据要展现给用户,文本文件就要涉及解码,其他文件需要通过专业工具打开
print(data.decode('utf-8')) with open('file.txt', 'ab') as f:
f.write(b'\n\xe5\x91\xb5\xe5\x91\xb5') # r+: 从头开始写, a+:从尾开始写, w+:清空写
with open('file.txt', 'rb+') as f:
print(f.readable())
print(f.writable())
# print(f.read())
f.write(b'')

5.游标操作

'''
123
你好
456
'''
with open('file.txt', 'w', encoding='utf-8') as f:
f.write('123\n你好\n456\n') # 大前提: 游标操作一定要在b模式下进行操作,因为游标一定按字节进行偏移
# seek(偏移量, 操作位置)
# 操作位置:0,从头开始 1,从当前位置开始 2,从最后开始
with open('file.txt', 'rt', encoding='utf-8') as f:
d1 = f.read(7)
print(d1)
f.seek(1, 0)
d2 = f.read(1)
print(d2)
# seek()在操作位置为0时,可以兼容t模式,但任然按字节进行偏移 with open('file.txt', 'rb') as f:
d1 = f.read(14)
print(d1)
# f.seek(1, 1) # 在当前位置往后偏移1个字节
# f.seek(-1, 1) # 在当前位置往前偏移1个字节
f.seek(-3, 2) # 将鼠标移至到文件末尾,往前偏移3个字节
d2 = f.read(1)
print(d2)

6.文件的修改

# 文件的修改
"""change.txt
name:Owen|age:16|gender:God
"""
# rb+:在当前位置进行覆盖书写
with open('change.txt', 'rb+') as f:
f.seek(14, 0)
print(f.read(2)) # 16
f.seek(-2, 1)
f.write(b'') # ab+:可以操作游标,但只对读起作用,写任然是最后追加
with open('change.txt', 'ab+') as f:
f.seek(14, 0)
print(f.read(2))
f.seek(-2, 1)
print(f.read(2))
f.write(b'') with open('change.txt', 'rb+') as f:
data = f.read()
newData = data.decode('utf-8').replace('', '')
f.seek(0, 0)
f.write(newData.encode('utf-8'))

7.复制文件

# 复制文件
with open('old.txt', 'r', encoding='utf-8') as f1, open('new.txt', 'w', encoding='utf-8') as f2:
# 文件的循环
for line in f1: # 对可读文件对象直接遍历循环,得到的是一行行内容
print(line)
f2.write(line) import os
with open('001.png', 'rb') as f1, open('002.png', 'wb') as f2:
for line in f1:
f2.write(line)
# 按指定路径将文件删除
os.remove(r'D:\python周末四期\day03\代码\001.png')

练习一

# 练习,利用b模式,编写一个cp工具,要求如下:
  1. 既可以拷贝文本又可以拷贝视频,图片等文件
  2. 用户一旦参数错误,打印命令的正确使用方法,如usage: cp source_file target_file
#  提示:可以用import sys,然后用sys.argv获取脚本后面跟的参数
import sys
if len(sys.argv) != 3:
print('usage: cp source_file target_file')
sys.exit() source_file,target_file=sys.argv[1],sys.argv[2]
with open(source_file,'rb') as read_f,open(target_file,'wb') as write_f:
for line in read_f:
write_f.write(line)

练习一

练习二:

#. 文件a.txt内容:每一行内容分别为商品名字,价钱,个数,求出本次购物花费的总钱数
apple 10 3
tesla 100000 1
mac 3000 2
lenovo 30000 3
chicken 10 3

作业:

# 作业一:
# 读取⽂文件内容,分析出所有的账号及对应的密码
# ⽂文件内容:owen:123456|egon:123qwe|liuxx:000000
# 结果:
{
'owen': '',
'egon': '123qwe',
'liuxx': ''
}
# 分析:将⽂文件内容读出,然后按|拆分出 账号:密码 格式的⼦子字符串串,再按:拆分成 账号及密码,存放到字典中 #作业二:
# 完成登录注册系统(从空文件开始做)
# 需求分析:
'''
1.可以循环登录注册,输入1代表选择登录功能,输入2代表注册功能,输入0代表退出,其他输入代表输入有误,重输
2.用户的账号密码信息存放在usr.txt⽂文件中,保证用户注册成功后,重启系统,用户信息仍然保存
3.登录在账号验证通过才输入密码验证登录,账号验证三次失败自动进入注册功能,登录三次验证失败自动退出系统
4.第一次注册,文件写入 账号:密码 信息,再次注册追加写入 |账号:密码 信息
# 作业一
with open('file3.txt','r',encoding='utf-8') as f:
dic = []
for line in f:
line = line.replace('|',' ')
# print(line)
for i in line.split():
i = i.split(':')
dic.append(i)
# print(dic)
db_user = dict(dic)
print(db_user) # 作业二
#读取文件,获取账号密码
with open('usr.txt','r',encoding='utf-8') as f:
dic = []
for line in f:
line = line.replace('|',' ')
# print(line)
for i in line.split():
i = i.split(':')
dic.append(i)
# print(dic)
db_user = dict(dic) tag = True
while tag:
print("1-->登录 2-->注册 0-->退出")
choice = ['','','']
cmd = input("请选择功能:")
if not cmd or cmd not in choice: continue
if cmd == '': #功能判断
count = 0
while count < 3:
username = input("请输入账号:").strip()
if not username or username not in db_user.keys(): # 判断账号是否存在
# print("账号不存在,是否注册")
continue
password = input("请输入密码:").strip()
if password == db_user[username]: #账号密码匹配,登录成功
print("登录成功")
else:
print("账号密码错误")
count += 1
break
elif cmd == '':
re_name = input("请输入账号:").strip()
# 账号不存在继续输入密码
if re_name not in db_user.keys():
while True:
re_pass1 = input("请输入密码:")
re_pass2 = input("请再次输入密码:")
if re_pass1 == re_pass2: #2次密码正确写入账号密码文件
with open('usr.txt','a',encoding='utf-8') as fl:
fl.write('|'+ re_name + ':' + re_pass2)
print("注册成功")
break
else:
print("2次输入的密码不一致,请重新输入")
else:
print("账号已存在")
elif cmd == '':
break

作业

练习三

# 简单秒传案例
mk = b""
# 计算得到秒传依据
with open('002.png', 'rb') as f:
data = f.read()
# print(data)
length = len(data)
print(length)
# 设置秒传算法:1.截取的部分字节,2.加密字节的算法 # 1.从头开始读10个字节,中间读10个字节,末尾读10个字节
# 2.将所有数据进行拼接
f.seek(0, 0)
d1 = f.read(10)
f.seek(length // 2, 0)
d2 = f.read(10)
f.seek(-10, 2)
d3 = f.read(10)
mk = d1 + d2 + d3 print(mk) # 实现秒传
with open('200.png', 'rb') as f:
new_mk = b''
f.seek(0, 0)
new_mk += f.read(10)
f.seek(length // 2, 0)
new_mk += f.read(10)
f.seek(-10, 2)
new_mk += f.read(10)
if new_mk == mk:
print('秒传')
else:
print('调用上传方法,进行龟速上传') # with open('200.png', 'rb+') as f:
# f.seek(-7, 2)
# f.write(b'12')

python day03_ 文件处理的更多相关文章

  1. Python读写文件

    Python读写文件1.open使用open打开文件后一定要记得调用文件对象的close()方法.比如可以用try/finally语句来确保最后能关闭文件. file_object = open('t ...

  2. python计算文件的md5值

    前言 最近要开发一个基于python的合并文件夹/目录的程序,本来的想法是基于修改时间的比较,即判断文件有没有改变,比较两个文件的修改时间即可.这个想法在windows的pc端下测试没有问题. 但是当 ...

  3. python操作文件案例二则

    前言 python 对于文件及文件夹的操作. 涉及到 遍历文件夹下所有文件 ,文件的读写和操作 等等. 代码一 作用:查找文件夹下(包括子文件夹)下所有文件的名字,找出 名字中含有中文或者空格的文件 ...

  4. Python :open文件操作,配合read()使用!

    python:open/文件操作 open/文件操作f=open('/tmp/hello','w') #open(路径+文件名,读写模式) 如何打开文件 handle=open(file_name,a ...

  5. python学习 文件操作

    一.python打开文件 #=====================python 文件打开方式 open()===================== # open(fileName,type) t ...

  6. Python之文件读写

    本节内容: I/O操作概述 文件读写实现原理与操作步骤 文件打开模式 Python文件操作步骤示例 Python文件读取相关方法 文件读写与字符编码 一.I/O操作概述 I/O在计算机中是指Input ...

  7. python 遍历文件夹 文件

    python 遍历文件夹 文件   import os import os.path rootdir = "d:\data" # 指明被遍历的文件夹 for parent,dirn ...

  8. python检测文件的MD5值

    python检测文件的MD5值MD5(单向散列算法)的全称是Message-Digest Algorithm 5(信息-摘要算法),经MD2.MD3和MD4发展而来.MD5算法的使用不需要支付任何版权 ...

  9. Python编码/文件读取/多线程

    Python编码/文件读取/多线程 个人笔记~~记录才有成长   编码/文件读取/多线程 编码 常用的一般是gbk.utf-8,而在python中字符串一般是用Unicode来操作,这样才能按照单个字 ...

随机推荐

  1. linux setup的安装

    setup作为一个l图形化的界面能够让我们更方便的去操作linux系统,而不需要记各种各样的配置文件的名称. 但是我们安装的最初的setup只有验证配置一个功能,我们还要安装完其他的功能才能使用其他的 ...

  2. 01_新建WebApi后端服务项目

    1.打开微软官网: https://www.asp.net/learn 2.查看文章: https://docs.microsoft.com/en-us/aspnet/web-api/overview ...

  3. send_keys results in Expected 【object Undefined】undefined to be a string解决方法:更新selenium+geckodriver+firefox

    很久之前在win10上配置的测试环境: python 3.6.1+ selenium 3.3.3+ geckodriver 0.15.0以前run case是正常的,今天去run 同样的case时发现 ...

  4. Jquery 正则式验证

    // 验证中文名称 function isChinaName(name) { var pattern = /^[\u4E00-\u9FA5]{1,6}$/; return pattern.test(n ...

  5. Nginx+Memcache+一致性hash算法 实现页面分布式缓存(转)

    网站响应速度优化包括集群架构中很多方面的瓶颈因素,这里所说的将页面静态化.实现分布式高速缓存就是其中的一个很好的解决方案... 1)先来看看Nginx负载均衡 Nginx负载均衡依赖自带的 ngx_h ...

  6. redmine2.5升级到3.4

    第一.安装需要升级的版本 参考文档:https://www.cnblogs.com/panwenbin-logs/p/10174525.html 二.备份源数据 [root@localhost ~]# ...

  7. Java 公平锁与非公平锁学习研究

    最近学习研究了一下Java中关于公平锁与非公平锁的底层实现原理,总结了一下. 首先呢,通过其字面意思,公平与非公平的评判标准就是付出与收获成正比(和社会中的含义差不多一个意思).放到程序中,尤其是 在 ...

  8. 消息队列(Message Queue)简介及其使用

    消息队列(Message Queue)简介及其使用 摘要:利用 MSMQ(Microsoft Message Queue),应用程序开发人员可以通过发送和接收消息方便地与应用程序进行快速可靠的通信.消 ...

  9. Python2--Pytest_html测试报告优化(解决中文输出问题)

    1.报告的输出: pytest.main(["-s","Auto_test.py","--html=Result_test.html"]) ...

  10. Flutter环境搭建

    本文介绍mac上搭建Flutter环境 1.Flutter官方提供中国地区镜像地址:https://github.com/flutter/flutter/wiki/Using-Flutter-in-C ...