文件操作分为读、写、修改,我们先从读开始

f = open(file = 'D:/工作日常/ABCD.txt',mode = 'r',encoding = 'utf-8') #file 是文件路径 mode = 'r' 是只读模式,encoding是文件使用的编码
f = open(file ='D:/工作日常/ABCD.txt',mode = 'rb') #读出来是二进制格式,只是给机器看,用于网络传输
data = f.read()
f.close

 智能监测编码

原理:gbk两个字节表示一个字符,utf-8三个字节表示一个字符。所以,一段拥有十个字节的编码不可能是utf-8。

import chardet #需要从第三方工具箱单独安装

f = open('log', mode='rb')
data = f.read()
f.close() result = chardet.detect(open('log', mode = 'rb').read())
print(result)

写模式操作文件

f = open('Mary.text', 'r', encoding = 'gbk')

for line in f: #一次取一行
print(line) #print本身自带换行,所以输出结果在每两行之间会多一行空行 f.close()

写文件  w:创建,会清空之前文件的所有内容

f = open(file='D:\电视剧.txt',mode='w',encoding='gbk')  #创建一个新文件,写入
f.write('倾城之恋')
f.close()
f = open('电视剧2.txt','wb')  #在pycharm的目录下,创建一个新文件,写入
f.write('倾城之恋'.encode('gbk')) #写入之后,需要用’gbk‘编码才能打开
f.close()
f = open('电视剧2.txt','wb')
f.write('蓝色生死恋'.encode('gbk')) #清空原来的重新输入
f.close()

追加模式操作文件  a

f = open('电视剧.txt','a',encoding='gbk')  #在原文件内容后进行添加
f.write('\t蓝色生死恋')
f.close()

 混合操作文件

f = open('电视剧.txt','r+',encoding='gbk')    #读写模式,相当于以读的方式打开,支持追加内容
data = f.read() #可以读内容
print(data) #print("content",data)
f.write(' 何以笙箫默') #可以写 f.write("\n new line") 此时光标移动到了最后,无可读内容
print(f.read()) #print("new content",f.read()) 故,print为空
f.close()
f = open('电视剧.txt','w+',encoding='gbk')  #写读模式,相当于以创建的方式打开文件
data = f.read() #可以读内容
print(data) #print("content",data)
f.write(' 何以笙箫默') #可以写 f.write("\n new line") 文件里只有新写的内容,原内容已被清空
print(f.read()) #print("new content",f.read())
f.close()AAAF

文件操作的其他方法

def fileno(self,*args,**kwargs):  # real signature unknown
#返回文件句柄在内核中的索引值,以后做I0多路复用(网络编程)时可以用到
def flush(self,*args,**kwargs): # real signature unknown
#把文件从内存buffer里强制刷新到硬盘
f = open('电视剧.txt','w')
f.write('花间提壶方大厨')
f.flush() #避免了因临时断电而产生已打印出的文字消失的情况

def readable(self,*args,**kwargs):  # real signature unknown
#判断是否可读 linux里一切皆文件,即使是网卡驱动也是文件,但网卡驱动不可读,一般用不到。'w'也不可读
def readline(self,*args,**kwargs): # real signature unknown
#只读一行,遇到 \r or \n 为止
def seek(self,*args,**kwargs): # real signature unknown
#把操作的光标移到指定位置
#*注意seek的长度是按字节算的,字符编码存每个字符所占的字节长度不一样
#如“路飞学城”用gbk存是2个字节一个字,用utf-8是3个字节一个字,
#因此,以gbk打开时,seek(4)就会把光标切换到第四个字节之后的位置,但如果是utf-8,seek(4)会导致,拿到了“飞”这个字的一部分字节,打印的话会报错,
   #因为处理剩下的文本时发现用这个会出错
f.seek(0)  #返回文件开头
def seekable(self,*args,**kwargs):  # real signature unknown
#判断文件是否可进行seek操作 linux上一切皆文件,终端也是文件,但是不能进行seek操作
def tell(self,*args,**kwargs): # real signature unknown
#返回当前文件操作光标的位置
def truncate(self,*args,**kwargs): # real signature unknown
#按指定长度截断文件
#*指定长度的话,就从文件开头开始截断指定长度,不指定长度的话,就从当前位置到文件尾部的内容全部去掉
f.truncate(n)  #从文件开头开始截取长度为n的部分
def writable(self,*args,**kwargs):  # real signature unknown
#判断文件是否可写

tell和seek找的是字节,read找的是字符

文件修改操作

f = open("电视剧.txt", 'r+', encoding = 'gbk')  #只能覆盖,不能后移
f.seek(6)
f.write("[路飞学城 luffycity]") #因为英文字符占位和中文不一样,可能会出现乱码
f.close()

多数电脑修改文件都是把文件从硬盘提到内存,这样面临的问题就是,内存如果不够大,文件就无法完全修改,同时,如果突然断电,会失去所有修改信息。

还有一种占硬盘的修改方式是,在硬盘里创建一个新文件,从原文件里提取出一条一条的信息,检测是否需要修改,如果需要就修改后放到新文件里,不需要就直接放到新文件里。

import os

f_name = '电视剧.txt'
f_new_name = '%s.new'%f_name old_str = '蓝色'
new_str = '蓝色生死恋' f = open(f_name,'r',encoding='gbk')
f_new = open(f_new_name,'w',encoding='gbk') for line in f:
if old_str in line:
line = line.replace(old_str,new_str) f_new.write(line) f.close()
f_new.close() os.rename(f_new_name,f_name)

Python全栈之路----文件处理的更多相关文章

  1. Python全栈之路----目录

    Module1 Python基本语法 Python全栈之路----编程基本情况介绍 Python全栈之路----常用数据类型--集合 Module2 数据类型.字符编码.文件操作 Python全栈之路 ...

  2. Python全栈之路目录结构

    基础 1.Python全栈之路-----基础篇 2.Python全栈之路---运算符与基本的数据结构 3.Python全栈之路3--set集合--三元运算--深浅拷贝--初识函数 4.Python全栈 ...

  3. Python全栈之路----常用模块----hashlib加密模块

    加密算法介绍 HASH       Python全栈之路----hash函数 Hash,一般翻译做“散列”,也有直接音译为”哈希”的,就是把任意长度的输入(又叫做预映射,pre-image),通过散列 ...

  4. python 全栈之路

    目录 Python 全栈之路 一. Python 1. Python基础知识部分 2. Python -函数 3. Python - 模块 4. Python - 面对对象 5. Python - 文 ...

  5. Python全栈之路----函数----返回值

    函数外部的代码想要获取函数的执行结果,就可以在函数里用return语句,把结果返回. def stu_register(name,age,course='PY',country='CN'): prin ...

  6. Python全栈之路----常用模块学习----模块的种类和导入方法

    什么是模块? 在计算机程序的开发过程中,随着程序代码越写越多,在一个文件里代码就会越来越长,越来越不容易维护. 为了编写可维护的代码,我们把很多函数分组,分别放到不同的文件里,这样,每个文件包含的代码 ...

  7. python全栈测试之路-py3基础:基础的常用语法知识

    python基础链接 python3速查参考- python基础 2 -> if语句应用 + while循环应用 https://www.cnblogs.com/wuzhiming/p/7795 ...

  8. Python全栈之路4--内置函数--文件操作

    上节重点回顾: 判断对象是否属于某个类,例如: 列表中有个数字,但是循环列表判断长度,用len会报错;因为int不支持len,所以要先判断属于某个类,然后再进行if判断. # isinstance(对 ...

  9. Python全栈之路----常用模块----软件开发目录规范

    目录基本内容 log  #日志目录 conf  #配置目录 core/luffycity  #程序核心代码目录  #luffycity 是项目名,建议用小写 libs/modules  #内置模块 d ...

随机推荐

  1. listview控件的使用

    listview控件是用于实现向上下两个方向翻动的界面(类似于QQ音乐查找歌手时的哪个界面),但是listview只是提供了一个空架子并没有什么实质的东西,那么这些东西要从哪里获得呢,那就要用到适配器 ...

  2. Ubuntu 18.04拨号上网及校园网开启IPV6

    Ubuntu 18.04下有两种方法实现拨号上网,第一种是通过图形界面添加,需要开启自动连接,并且要关闭以太网的自动连接.(不推荐这种连接方式)这里介绍第二种,通过pppoeconf命令进行拨号. 关 ...

  3. vue--一些预设属性

    Babel=> 转换工具,将ES6转换成ES5的转换工具.有些浏览器不支持ES6语法: router=> 路由管理器: vueX=> 一个仓库,存储状态信息: CSS pre-pro ...

  4. scp免密操作

    scp免密操作 2.1服务器(本机)从目标服务器上传/下载文件或者文件夹 2.2生成秘钥 本机执行:ssh-keygen -t rsa 遇到提示,直接回车就OK,秘钥生成在用户的根目录的.ssh目录下 ...

  5. [原]编译flightGear

    参考:flightgear编译博客201705 flightGear是三维飞行仿真软件,这个款软件是开源的,我们尝试用其源码完整编译一遍这个工程,并使用它. 它用到里以下扩展库: 空气动力学库:JSB ...

  6. .net正则IP加端口,并返回IP加端口

    public string GetIp(string url) { var reg = new Regex(@"\d{2,3}([.]\d{1,3}){3}:\d{2,5}"); ...

  7. arrow function、function.apply

    An arrow function expression has a shorter syntax than a function expression and does not have its o ...

  8. 页面检测网络外网连接- 网页基础模块(JavaScript)

    方法一 html 添加图片标签 加载外站图片 <img id="connect-test" style="display:none;" onload=&q ...

  9. jvm回收器回收过程一:CMS和 G1的初认知(持续更新中)

    CMS:介绍: 1.CMS(Concurrent Mark-Sweep)是以牺牲吞吐量为代价来获得最短回收停顿时间的垃圾回收器.对于要求服务器响应速度的应用上,这种垃圾回收器非常适合. 在启动JVM参 ...

  10. 单点登录系统实现基于SpringBoot

    今天的干货有点湿,里面夹杂着我的泪水.可能也只有代码才能让我暂时的平静.通过本章内容你将学到单点登录系统和传统登录系统的区别,单点登录系统设计思路,Spring4 Java配置方式整合HttpClie ...