python day03_ 文件处理

一、文件操作的基本流程

计算机操作文件的过程

#1. 打开文件，得到文件句柄并赋值给一个变量

#2. 通过句柄对文件进行操作

#3. 关闭文件

1.文件的打开过程

# f被程序持有，文件被操作系统持有

f = open('file.txt', 'r', encoding='utf-8')  # r读文件，文件一定要提前存在

#2. 通过句柄对文件进行操作

data=f.read()

#3. 关闭文件

f.close()

f=open('file.txt','r')的过程分析：
#1、由应用程序向操作系统发起系统调用open(...)
#2、操作系统打开该文件，并返回一个文件句柄给应用程序
#3、应用程序将文件句柄赋值给变量f

2.操作文件方法

# 操作文件

# data = f.read()  # 读所有内容

# print(data)

# data = f.read(2)  # 读指定字节数或字符数

# print(data)

# d1 = f.read(1)  # 在当前位置接着再读1个字节或字符

# print(d1)

# line = f.readline()  # 读取一行

# print(line)

# lines = f.readlines()  # 按行，将所有行一次一次读出到list中

# print(lines)

# 关闭文件

# f.close()  # 操作系统对文件的持有权一定要在文件操作完毕后释放w = open(r'file.txt', 'w', encoding='utf-8')

w.write('123\n')

w.flush()  # 数据量过大时，可以手动将内存中的数据刷新到硬盘中

w.write('456\n')

w.writelines(['000\n', '111\n', '222\n'])

# 是否可读可写

print(w.readable())

print(w.writable())

w.close()

# 文件的遍历：

# 最常用读写
with open('source', 'r', encoding='utf-8') as f1, open('target', 'w', encoding='utf-8') as f2:
for line in f1:
f2.write(line)

#掌握

f.read() #读取所有内容,光标移动到文件末尾

f.readline() #读取一行内容,光标移动到第二行首部

f.readlines() #读取每一行内容,存放于列表中

f.write('1111\n222\n') #针对文本模式的写,需要自己写换行符

f.write('1111\n222\n'.encode('utf-8')) #针对b模式的写,需要自己写换行符

f.writelines(['333\n','444\n']) #文件模式

f.writelines([bytes('333\n',encoding='utf-8'),'444\n'.encode('utf-8')]) #b模式

#了解

f.readable() #文件是否可读

f.writable() #文件是否可读

f.closed #文件是否关闭

f.encoding #如果文件打开模式为b,则没有该属性

f.flush() #立刻将文件内容从内存刷到硬盘

f.name

二、文件的操作模式

主模式：

r:  文件必须存在的读

w:  文件无需存在的写，无创建，有清空再写

a:  文件无需存在的写，无创建，有在文件最后追加写

从模式：

t:  按文本字符操作数据（默认模式）

b:  按文本字节操作数据

+:  可读可写

了解：

x：新建文件写，如果文件已存在，抛异常

#1. 打开文件的模式有(默认为文本模式)：

r ，只读模式【默认模式，文件必须存在，不存在则抛出异常】

w，只写模式【不可读；不存在则创建；存在则清空内容】

a， 之追加写模式【不可读；不存在则创建；存在则只追加内容】

#2. 对于非文本文件，我们只能使用b模式，"b"表示以字节的方式操作（而所有文件也都是以字节的形式存储的，使用这种模式无需考虑文本文件的字符编码、图片文件的jgp格式、视频文件的avi格式）

rb

wb

ab

注：以b方式打开时，读取到的内容是字节类型，写入时也需要提供字节类型，不能指定编码

#3. 了解部分

"+" 表示可以同时读写某个文件

r+， 读写【可读，可写】

w+，写读【可读，可写】

a+， 写读【可读，可写】

3.with...open..语法

# with open语法

with open('file.txt', 'x', encoding='utf-8') as f:  # 不需要明文书写f.close()

    # data = f.read()

    # print(data)

    print(f.readable())

    print(f.writable())

# 追加模式

with open('file.txt', 'a', encoding='utf-8') as f:

    f.write('123\n')

    print(123)

    print(123)

    f.write('456\n')

    f.flush()

    f.write('789\n')

4. 字节方式操作文件

"""

你好

好的

123

"""

# 注：b操作模式下不需要指定encoding，

# 原因，因为b可以对所有类型数据进行操作，包含文本/视频/音频等各种文件

# 而utf-8只是文本文件的编码方式

# 数据在硬盘中本就以二进制进行存储的，所有b默认操作就是对数据从硬盘到内存的拷贝

with open('file.txt', 'rb') as f:

    data = f.read()

    print(data)

    # 但如果数据要展现给用户，文本文件就要涉及解码，其他文件需要通过专业工具打开

    print(data.decode('utf-8'))

with open('file.txt', 'ab') as f:

    f.write(b'\n\xe5\x91\xb5\xe5\x91\xb5')

# r+: 从头开始写， a+：从尾开始写， w+：清空写

with open('file.txt', 'rb+') as f:

    print(f.readable())

    print(f.writable())

    # print(f.read())

    f.write(b'')

5.游标操作

'''

123

你好

456

'''

with open('file.txt', 'w', encoding='utf-8') as f:

    f.write('123\n你好\n456\n')

# 大前提: 游标操作一定要在b模式下进行操作，因为游标一定按字节进行偏移

# seek(偏移量, 操作位置)

#  操作位置：0,从头开始 1,从当前位置开始 2,从最后开始

with open('file.txt', 'rt', encoding='utf-8') as f:

    d1 = f.read(7)

    print(d1)

    f.seek(1, 0)

    d2 = f.read(1)

    print(d2)

# seek()在操作位置为0时，可以兼容t模式，但任然按字节进行偏移

with open('file.txt', 'rb') as f:

    d1 = f.read(14)

    print(d1)

    # f.seek(1, 1)  # 在当前位置往后偏移1个字节

    # f.seek(-1, 1)  # 在当前位置往前偏移1个字节

    f.seek(-3, 2)  # 将鼠标移至到文件末尾，往前偏移3个字节

    d2 = f.read(1)

    print(d2)

6.文件的修改

# 文件的修改

"""change.txt

name:Owen|age:16|gender:God

"""

# rb+:在当前位置进行覆盖书写

with open('change.txt', 'rb+') as f:

    f.seek(14, 0)

    print(f.read(2)) # 16

    f.seek(-2, 1)

    f.write(b'')

# ab+:可以操作游标，但只对读起作用，写任然是最后追加

with open('change.txt', 'ab+') as f:

    f.seek(14, 0)

    print(f.read(2))

    f.seek(-2, 1)

    print(f.read(2))

    f.write(b'')

with open('change.txt', 'rb+') as f:

    data = f.read()

    newData = data.decode('utf-8').replace('', '')

    f.seek(0, 0)

    f.write(newData.encode('utf-8'))

7.复制文件

# 复制文件

with open('old.txt', 'r', encoding='utf-8') as f1, open('new.txt', 'w', encoding='utf-8') as f2:

    # 文件的循环

    for line in f1:  # 对可读文件对象直接遍历循环，得到的是一行行内容

        print(line)

        f2.write(line)

import os

with open('001.png', 'rb') as f1, open('002.png', 'wb') as f2:

    for line in f1:

        f2.write(line)

# 按指定路径将文件删除

os.remove(r'D:\python周末四期\day03\代码\001.png')

练习一

# 练习，利用b模式，编写一个cp工具，要求如下：

　　1. 既可以拷贝文本又可以拷贝视频，图片等文件

　　2. 用户一旦参数错误，打印命令的正确使用方法，如usage: cp source_file target_file

#　　提示：可以用import sys，然后用sys.argv获取脚本后面跟的参数

import sys

if len(sys.argv) != 3:

    print('usage: cp source_file target_file')

    sys.exit()

source_file,target_file=sys.argv[1],sys.argv[2]

with open(source_file,'rb') as read_f,open(target_file,'wb') as write_f:

    for line in read_f:

        write_f.write(line)

练习一

练习二：

#. 文件a.txt内容：每一行内容分别为商品名字，价钱，个数，求出本次购物花费的总钱数

apple 10 3

tesla 100000 1

mac 3000 2

lenovo 30000 3

chicken 10 3

作业：

# 作业一：

# 读取⽂文件内容，分析出所有的账号及对应的密码

# ⽂文件内容：owen:123456|egon:123qwe|liuxx:000000

# 结果：

{

'owen': '',

'egon': '123qwe',

'liuxx': ''

}

# 分析：将⽂文件内容读出，然后按|拆分出 账号:密码 格式的⼦子字符串串，再按:拆分成 账号及密码，存放到字典中

#作业二：

# 完成登录注册系统(从空文件开始做)

# 需求分析：

'''

1.可以循环登录注册，输入1代表选择登录功能，输入2代表注册功能，输入0代表退出，其他输入代表输入有误，重输

2.用户的账号密码信息存放在usr.txt⽂文件中，保证用户注册成功后，重启系统，用户信息仍然保存

3.登录在账号验证通过才输入密码验证登录，账号验证三次失败自动进入注册功能，登录三次验证失败自动退出系统

4.第一次注册，文件写入 账号:密码 信息，再次注册追加写入 |账号:密码 信息

# 作业一

with open('file3.txt','r',encoding='utf-8') as f:

    dic = []

    for line in f:

        line = line.replace('|',' ')

        # print(line)

        for i in line.split():

            i = i.split(':')

            dic.append(i)

            # print(dic)

db_user = dict(dic)

print(db_user)

# 作业二

#读取文件，获取账号密码

with open('usr.txt','r',encoding='utf-8') as f:

    dic = []

    for line in f:

        line = line.replace('|',' ')

        # print(line)

        for i in line.split():

            i = i.split(':')

            dic.append(i)

            # print(dic)

db_user = dict(dic)

tag = True

while tag:

    print("1-->登录   2-->注册  0-->退出")

    choice = ['','','']

    cmd = input("请选择功能：")

    if not cmd or cmd not in choice: continue

    if cmd == '': #功能判断

        count = 0

        while count < 3:

            username = input("请输入账号:").strip()

            if not username or username not in db_user.keys():  # 判断账号是否存在

                # print("账号不存在，是否注册")

                continue

            password = input("请输入密码:").strip()

            if password == db_user[username]: #账号密码匹配，登录成功

                print("登录成功")

            else:

                print("账号密码错误")

                count += 1

        break

    elif cmd == '':

        re_name = input("请输入账号：").strip()

        # 账号不存在继续输入密码

        if re_name not in db_user.keys():

            while True:

                re_pass1 = input("请输入密码：")

                re_pass2 = input("请再次输入密码：")

                if re_pass1 == re_pass2:  #2次密码正确写入账号密码文件

                    with open('usr.txt','a',encoding='utf-8') as fl:

                        fl.write('|'+ re_name + ':' + re_pass2)

                    print("注册成功")

                    break

                else:

                    print("2次输入的密码不一致，请重新输入")

        else:

            print("账号已存在")

    elif cmd == '':

        break

作业

练习三

# 简单秒传案例

mk = b""

# 计算得到秒传依据

with open('002.png', 'rb') as f:

    data = f.read()

    # print(data)

    length = len(data)

    print(length)

    # 设置秒传算法：1.截取的部分字节，2.加密字节的算法

    # 1.从头开始读10个字节，中间读10个字节，末尾读10个字节

    # 2.将所有数据进行拼接

    f.seek(0, 0)

    d1 = f.read(10)

    f.seek(length // 2, 0)

    d2 = f.read(10)

    f.seek(-10, 2)

    d3 = f.read(10)

    mk = d1 + d2 + d3

print(mk)

# 实现秒传

with open('200.png', 'rb') as f:

    new_mk = b''

    f.seek(0, 0)

    new_mk += f.read(10)

    f.seek(length // 2, 0)

    new_mk += f.read(10)

    f.seek(-10, 2)

    new_mk += f.read(10)

    if new_mk == mk:

        print('秒传')

    else:

        print('调用上传方法，进行龟速上传')

# with open('200.png', 'rb+') as f:

#     f.seek(-7, 2)

#     f.write(b'12')

python day03_ 文件处理的更多相关文章

Python读写文件
Python读写文件1.open使用open打开文件后一定要记得调用文件对象的close()方法.比如可以用try/finally语句来确保最后能关闭文件. file_object = open('t ...
python计算文件的md5值
前言最近要开发一个基于python的合并文件夹/目录的程序,本来的想法是基于修改时间的比较,即判断文件有没有改变,比较两个文件的修改时间即可.这个想法在windows的pc端下测试没有问题. 但是当 ...
python操作文件案例二则
前言 python 对于文件及文件夹的操作. 涉及到遍历文件夹下所有文件 ,文件的读写和操作等等. 代码一作用:查找文件夹下(包括子文件夹)下所有文件的名字,找出名字中含有中文或者空格的文件 ...
Python :open文件操作,配合read()使用！
python:open/文件操作 open/文件操作f=open('/tmp/hello','w') #open(路径+文件名,读写模式) 如何打开文件 handle=open(file_name,a ...
python学习文件操作
一.python打开文件 #=====================python 文件打开方式 open()===================== # open(fileName,type) t ...
Python之文件读写
本节内容: I/O操作概述文件读写实现原理与操作步骤文件打开模式 Python文件操作步骤示例 Python文件读取相关方法文件读写与字符编码一.I/O操作概述 I/O在计算机中是指Input ...
python 遍历文件夹文件
python 遍历文件夹文件 import os import os.path rootdir = "d:\data" # 指明被遍历的文件夹 for parent,dirn ...
python检测文件的MD5值
python检测文件的MD5值MD5(单向散列算法)的全称是Message-Digest Algorithm 5(信息-摘要算法),经MD2.MD3和MD4发展而来.MD5算法的使用不需要支付任何版权 ...
Python编码/文件读取/多线程
Python编码/文件读取/多线程个人笔记~~记录才有成长编码/文件读取/多线程编码常用的一般是gbk.utf-8,而在python中字符串一般是用Unicode来操作,这样才能按照单个字 ...

随机推荐

Heroku 教程
中文 https://www.jianshu.com/p/7bc34e56fa39 http://www.bjhee.com/flask-heroku.html 官方 Getting Started ...
最大化及等比例测试演化Demo-Grid方法
Demo1-简单测试: <!doctype html> <html> <head> <meta charset="utf-8"> & ...
Pandas中Loc用法总结
摘自:http://pandas.pydata.org/pandas-docs/stable/generated/pandas.DataFrame.loc.html 具体用法,假设数据源为: > ...
POJ1083 Moving Tables
POJ1083 Moving Tables Time Limit: 1000MS Memory Limit: 10000K Total Submissions: 35297 Accepted: ...
Burpsuite Sqlmap Nmap入门总结
burpsuite sqlmap nmap 简介 sqlmap基础五种独特sql注入技术: 基于布尔类型的盲注基于时间的盲注基于报错注入联合查询注入堆查询注入 sqlmap入门 1.判断是否 ...
全面超越Appium，使用Airtest超快速开发App爬虫
想开发网页爬虫,发现被反爬了?想对 App 抓包,发现数据被加密了?不要担心,使用 Airtest 开发 App 爬虫,只要人眼能看到,你就能抓到,最快只需要2分钟,兼容 Unity3D.Cocos2 ...
python大法好——Python 正则表达式
Python 正则表达式正则表达式是一个特殊的字符序列,它能帮助你方便的检查一个字符串是否与某种模式匹配. Python 自1.5版本起增加了re 模块,它提供 Perl 风格的正则表达式模式. r ...
oss对象云存储
import qiniu import uuidimport config def qn_upload_voice(fileData): '''上传语音到七牛云 @arg: fileData - 编码 ...
Spring 整合WebSocket, Error during WebSocket handshake: Unexpected response code: 302 还有200的错误
springboot 集成websocket 及其简单,,,但是管理端使用的是Spring,原生配置,发生这个错误,,,302 被重定向了...我起的是本地locallhost,把ip换成 local ...
Grafana短信报警实现
1.阿里云短信服务API2.Jenkins-plugin:Generic Webhook Trigger Plugin 阿里云下载阿里云短信服务SDK 创建短信服务ACCESS_KEY_ID Gra ...

python day03_ 文件处理

一、文件操作的基本流程

python day03_ 文件处理的更多相关文章

随机推荐

热门专题