python day03_ 文件处理
一、文件操作的基本流程
计算机操作文件的过程
#1. 打开文件,得到文件句柄并赋值给一个变量
#2. 通过句柄对文件进行操作
#3. 关闭文件
1.文件的打开过程
# f被程序持有,文件被操作系统持有
f = open('file.txt', 'r', encoding='utf-8') # r读文件,文件一定要提前存在 #2. 通过句柄对文件进行操作
data=f.read()
#3. 关闭文件
f.close()
f=open('file.txt','r')的过程分析:
#1、由应用程序向操作系统发起系统调用open(...)
#2、操作系统打开该文件,并返回一个文件句柄给应用程序
#3、应用程序将文件句柄赋值给变量f
2.操作文件方法
# 操作文件
# data = f.read() # 读所有内容
# print(data) # data = f.read(2) # 读指定字节数或字符数
# print(data)
# d1 = f.read(1) # 在当前位置接着再读1个字节或字符
# print(d1) # line = f.readline() # 读取一行
# print(line) # lines = f.readlines() # 按行,将所有行一次一次读出到list中
# print(lines) # 关闭文件
# f.close() # 操作系统对文件的持有权一定要在文件操作完毕后释放w = open(r'file.txt', 'w', encoding='utf-8')
w.write('123\n')
w.flush() # 数据量过大时,可以手动将内存中的数据刷新到硬盘中
w.write('456\n')
w.writelines(['000\n', '111\n', '222\n']) # 是否可读可写
print(w.readable())
print(w.writable()) w.close() # 文件的遍历:
# 最常用读写
with open('source', 'r', encoding='utf-8') as f1, open('target', 'w', encoding='utf-8') as f2:
for line in f1:
f2.write(line)
#掌握
f.read() #读取所有内容,光标移动到文件末尾
f.readline() #读取一行内容,光标移动到第二行首部
f.readlines() #读取每一行内容,存放于列表中 f.write('1111\n222\n') #针对文本模式的写,需要自己写换行符
f.write('1111\n222\n'.encode('utf-8')) #针对b模式的写,需要自己写换行符
f.writelines(['333\n','444\n']) #文件模式
f.writelines([bytes('333\n',encoding='utf-8'),'444\n'.encode('utf-8')]) #b模式 #了解
f.readable() #文件是否可读
f.writable() #文件是否可读
f.closed #文件是否关闭
f.encoding #如果文件打开模式为b,则没有该属性
f.flush() #立刻将文件内容从内存刷到硬盘
f.name
二、文件的操作模式
主模式:
r: 文件必须存在的读
w: 文件无需存在的写,无创建,有清空再写
a: 文件无需存在的写,无创建,有在文件最后追加写 从模式:
t: 按文本字符操作数据(默认模式)
b: 按文本字节操作数据
+: 可读可写 了解:
x:新建文件写,如果文件已存在,抛异常
#1. 打开文件的模式有(默认为文本模式):
r ,只读模式【默认模式,文件必须存在,不存在则抛出异常】
w,只写模式【不可读;不存在则创建;存在则清空内容】
a, 之追加写模式【不可读;不存在则创建;存在则只追加内容】 #2. 对于非文本文件,我们只能使用b模式,"b"表示以字节的方式操作(而所有文件也都是以字节的形式存储的,使用这种模式无需考虑文本文件的字符编码、图片文件的jgp格式、视频文件的avi格式)
rb
wb
ab
注:以b方式打开时,读取到的内容是字节类型,写入时也需要提供字节类型,不能指定编码 #3. 了解部分
"+" 表示可以同时读写某个文件
r+, 读写【可读,可写】
w+,写读【可读,可写】
a+, 写读【可读,可写】
3.with...open..语法
# with open语法
with open('file.txt', 'x', encoding='utf-8') as f: # 不需要明文书写f.close()
# data = f.read()
# print(data)
print(f.readable())
print(f.writable()) # 追加模式
with open('file.txt', 'a', encoding='utf-8') as f:
f.write('123\n')
print(123)
print(123)
f.write('456\n')
f.flush()
f.write('789\n')
4. 字节方式操作文件
"""
你好
好的
123
"""
# 注:b操作模式下不需要指定encoding,
# 原因,因为b可以对所有类型数据进行操作,包含文本/视频/音频等各种文件
# 而utf-8只是文本文件的编码方式
# 数据在硬盘中本就以二进制进行存储的,所有b默认操作就是对数据从硬盘到内存的拷贝
with open('file.txt', 'rb') as f:
data = f.read()
print(data)
# 但如果数据要展现给用户,文本文件就要涉及解码,其他文件需要通过专业工具打开
print(data.decode('utf-8')) with open('file.txt', 'ab') as f:
f.write(b'\n\xe5\x91\xb5\xe5\x91\xb5') # r+: 从头开始写, a+:从尾开始写, w+:清空写
with open('file.txt', 'rb+') as f:
print(f.readable())
print(f.writable())
# print(f.read())
f.write(b'')
5.游标操作
'''
123
你好
456
'''
with open('file.txt', 'w', encoding='utf-8') as f:
f.write('123\n你好\n456\n') # 大前提: 游标操作一定要在b模式下进行操作,因为游标一定按字节进行偏移
# seek(偏移量, 操作位置)
# 操作位置:0,从头开始 1,从当前位置开始 2,从最后开始
with open('file.txt', 'rt', encoding='utf-8') as f:
d1 = f.read(7)
print(d1)
f.seek(1, 0)
d2 = f.read(1)
print(d2)
# seek()在操作位置为0时,可以兼容t模式,但任然按字节进行偏移 with open('file.txt', 'rb') as f:
d1 = f.read(14)
print(d1)
# f.seek(1, 1) # 在当前位置往后偏移1个字节
# f.seek(-1, 1) # 在当前位置往前偏移1个字节
f.seek(-3, 2) # 将鼠标移至到文件末尾,往前偏移3个字节
d2 = f.read(1)
print(d2)
6.文件的修改
# 文件的修改
"""change.txt
name:Owen|age:16|gender:God
"""
# rb+:在当前位置进行覆盖书写
with open('change.txt', 'rb+') as f:
f.seek(14, 0)
print(f.read(2)) # 16
f.seek(-2, 1)
f.write(b'') # ab+:可以操作游标,但只对读起作用,写任然是最后追加
with open('change.txt', 'ab+') as f:
f.seek(14, 0)
print(f.read(2))
f.seek(-2, 1)
print(f.read(2))
f.write(b'') with open('change.txt', 'rb+') as f:
data = f.read()
newData = data.decode('utf-8').replace('', '')
f.seek(0, 0)
f.write(newData.encode('utf-8'))
7.复制文件
# 复制文件
with open('old.txt', 'r', encoding='utf-8') as f1, open('new.txt', 'w', encoding='utf-8') as f2:
# 文件的循环
for line in f1: # 对可读文件对象直接遍历循环,得到的是一行行内容
print(line)
f2.write(line) import os
with open('001.png', 'rb') as f1, open('002.png', 'wb') as f2:
for line in f1:
f2.write(line)
# 按指定路径将文件删除
os.remove(r'D:\python周末四期\day03\代码\001.png')
练习一
# 练习,利用b模式,编写一个cp工具,要求如下:
1. 既可以拷贝文本又可以拷贝视频,图片等文件
2. 用户一旦参数错误,打印命令的正确使用方法,如usage: cp source_file target_file
# 提示:可以用import sys,然后用sys.argv获取脚本后面跟的参数
import sys
if len(sys.argv) != 3:
print('usage: cp source_file target_file')
sys.exit() source_file,target_file=sys.argv[1],sys.argv[2]
with open(source_file,'rb') as read_f,open(target_file,'wb') as write_f:
for line in read_f:
write_f.write(line)
练习一
练习二:
#. 文件a.txt内容:每一行内容分别为商品名字,价钱,个数,求出本次购物花费的总钱数
apple 10 3
tesla 100000 1
mac 3000 2
lenovo 30000 3
chicken 10 3
作业:
# 作业一:
# 读取⽂文件内容,分析出所有的账号及对应的密码
# ⽂文件内容:owen:123456|egon:123qwe|liuxx:000000
# 结果:
{
'owen': '',
'egon': '123qwe',
'liuxx': ''
}
# 分析:将⽂文件内容读出,然后按|拆分出 账号:密码 格式的⼦子字符串串,再按:拆分成 账号及密码,存放到字典中 #作业二:
# 完成登录注册系统(从空文件开始做)
# 需求分析:
'''
1.可以循环登录注册,输入1代表选择登录功能,输入2代表注册功能,输入0代表退出,其他输入代表输入有误,重输
2.用户的账号密码信息存放在usr.txt⽂文件中,保证用户注册成功后,重启系统,用户信息仍然保存
3.登录在账号验证通过才输入密码验证登录,账号验证三次失败自动进入注册功能,登录三次验证失败自动退出系统
4.第一次注册,文件写入 账号:密码 信息,再次注册追加写入 |账号:密码 信息
# 作业一
with open('file3.txt','r',encoding='utf-8') as f:
dic = []
for line in f:
line = line.replace('|',' ')
# print(line)
for i in line.split():
i = i.split(':')
dic.append(i)
# print(dic)
db_user = dict(dic)
print(db_user) # 作业二
#读取文件,获取账号密码
with open('usr.txt','r',encoding='utf-8') as f:
dic = []
for line in f:
line = line.replace('|',' ')
# print(line)
for i in line.split():
i = i.split(':')
dic.append(i)
# print(dic)
db_user = dict(dic) tag = True
while tag:
print("1-->登录 2-->注册 0-->退出")
choice = ['','','']
cmd = input("请选择功能:")
if not cmd or cmd not in choice: continue
if cmd == '': #功能判断
count = 0
while count < 3:
username = input("请输入账号:").strip()
if not username or username not in db_user.keys(): # 判断账号是否存在
# print("账号不存在,是否注册")
continue
password = input("请输入密码:").strip()
if password == db_user[username]: #账号密码匹配,登录成功
print("登录成功")
else:
print("账号密码错误")
count += 1
break
elif cmd == '':
re_name = input("请输入账号:").strip()
# 账号不存在继续输入密码
if re_name not in db_user.keys():
while True:
re_pass1 = input("请输入密码:")
re_pass2 = input("请再次输入密码:")
if re_pass1 == re_pass2: #2次密码正确写入账号密码文件
with open('usr.txt','a',encoding='utf-8') as fl:
fl.write('|'+ re_name + ':' + re_pass2)
print("注册成功")
break
else:
print("2次输入的密码不一致,请重新输入")
else:
print("账号已存在")
elif cmd == '':
break
作业
练习三
# 简单秒传案例
mk = b""
# 计算得到秒传依据
with open('002.png', 'rb') as f:
data = f.read()
# print(data)
length = len(data)
print(length)
# 设置秒传算法:1.截取的部分字节,2.加密字节的算法 # 1.从头开始读10个字节,中间读10个字节,末尾读10个字节
# 2.将所有数据进行拼接
f.seek(0, 0)
d1 = f.read(10)
f.seek(length // 2, 0)
d2 = f.read(10)
f.seek(-10, 2)
d3 = f.read(10)
mk = d1 + d2 + d3 print(mk) # 实现秒传
with open('200.png', 'rb') as f:
new_mk = b''
f.seek(0, 0)
new_mk += f.read(10)
f.seek(length // 2, 0)
new_mk += f.read(10)
f.seek(-10, 2)
new_mk += f.read(10)
if new_mk == mk:
print('秒传')
else:
print('调用上传方法,进行龟速上传') # with open('200.png', 'rb+') as f:
# f.seek(-7, 2)
# f.write(b'12')
python day03_ 文件处理的更多相关文章
- Python读写文件
Python读写文件1.open使用open打开文件后一定要记得调用文件对象的close()方法.比如可以用try/finally语句来确保最后能关闭文件. file_object = open('t ...
- python计算文件的md5值
前言 最近要开发一个基于python的合并文件夹/目录的程序,本来的想法是基于修改时间的比较,即判断文件有没有改变,比较两个文件的修改时间即可.这个想法在windows的pc端下测试没有问题. 但是当 ...
- python操作文件案例二则
前言 python 对于文件及文件夹的操作. 涉及到 遍历文件夹下所有文件 ,文件的读写和操作 等等. 代码一 作用:查找文件夹下(包括子文件夹)下所有文件的名字,找出 名字中含有中文或者空格的文件 ...
- Python :open文件操作,配合read()使用!
python:open/文件操作 open/文件操作f=open('/tmp/hello','w') #open(路径+文件名,读写模式) 如何打开文件 handle=open(file_name,a ...
- python学习 文件操作
一.python打开文件 #=====================python 文件打开方式 open()===================== # open(fileName,type) t ...
- Python之文件读写
本节内容: I/O操作概述 文件读写实现原理与操作步骤 文件打开模式 Python文件操作步骤示例 Python文件读取相关方法 文件读写与字符编码 一.I/O操作概述 I/O在计算机中是指Input ...
- python 遍历文件夹 文件
python 遍历文件夹 文件 import os import os.path rootdir = "d:\data" # 指明被遍历的文件夹 for parent,dirn ...
- python检测文件的MD5值
python检测文件的MD5值MD5(单向散列算法)的全称是Message-Digest Algorithm 5(信息-摘要算法),经MD2.MD3和MD4发展而来.MD5算法的使用不需要支付任何版权 ...
- Python编码/文件读取/多线程
Python编码/文件读取/多线程 个人笔记~~记录才有成长 编码/文件读取/多线程 编码 常用的一般是gbk.utf-8,而在python中字符串一般是用Unicode来操作,这样才能按照单个字 ...
随机推荐
- Heroku 教程
中文 https://www.jianshu.com/p/7bc34e56fa39 http://www.bjhee.com/flask-heroku.html 官方 Getting Started ...
- 最大化及等比例测试演化Demo-Grid方法
Demo1-简单测试: <!doctype html> <html> <head> <meta charset="utf-8"> & ...
- Pandas中Loc用法总结
摘自:http://pandas.pydata.org/pandas-docs/stable/generated/pandas.DataFrame.loc.html 具体用法,假设数据源为: > ...
- POJ1083 Moving Tables
POJ1083 Moving Tables Time Limit: 1000MS Memory Limit: 10000K Total Submissions: 35297 Accepted: ...
- Burpsuite Sqlmap Nmap入门总结
burpsuite sqlmap nmap 简介 sqlmap基础 五种独特sql注入技术: 基于布尔类型的盲注 基于时间的盲注 基于报错注入 联合查询注入 堆查询注入 sqlmap入门 1.判断是否 ...
- 全面超越Appium,使用Airtest超快速开发App爬虫
想开发网页爬虫,发现被反爬了?想对 App 抓包,发现数据被加密了?不要担心,使用 Airtest 开发 App 爬虫,只要人眼能看到,你就能抓到,最快只需要2分钟,兼容 Unity3D.Cocos2 ...
- python大法好——Python 正则表达式
Python 正则表达式 正则表达式是一个特殊的字符序列,它能帮助你方便的检查一个字符串是否与某种模式匹配. Python 自1.5版本起增加了re 模块,它提供 Perl 风格的正则表达式模式. r ...
- oss对象云存储
import qiniu import uuidimport config def qn_upload_voice(fileData): '''上传语音到七牛云 @arg: fileData - 编码 ...
- Spring 整合WebSocket, Error during WebSocket handshake: Unexpected response code: 302 还有200的错误
springboot 集成websocket 及其简单,,,但是管理端使用的是Spring,原生配置,发生这个错误,,,302 被重定向了...我起的是本地locallhost,把ip换成 local ...
- Grafana短信报警实现
1.阿里云短信服务API2.Jenkins-plugin:Generic Webhook Trigger Plugin 阿里云 下载阿里云短信服务SDK 创建短信服务ACCESS_KEY_ID Gra ...