python_文件 处理
一、字符编码
- 内存固定使用unicode编码
- 数据最先产生于内存中,是unicode格式,要想传输需要转成bytes格式
# unicode -------> enconde( u t f - 8 ) -------> bytes
拿到bytes,就可以往文件内存放或者基于网络传输
# bytes --------> enconde( u t f - 8 ) -------> unicode
- python 3 中字符串被识别为 unicode
python 3 中的字符串encode得到bytes
python 2 中的字符串就是 bytes
python 2 在字符串前加 ‘u’ ,就是unicode
二、文件处理
流程:打开文件===>得到文件句柄并赋值给变量 ====> 通过句柄操作文件==>关闭文件
读文件:
f = open( ‘aaaa.py ’ , ‘ r ’ ,encoding = ‘utf-8’ ) print( f.readline() ,end= ‘’)#读取一行 print( f.readlines() , end=’’ )#读取全部,不换行 print( f.readable() )#可读文件 print( f.writable() )#不可写文件 f.close()#结束之后必须关闭,否则占用内存
写文件:
f = open( ‘new_2’, ‘w’,encoding=’utf-8’ ) print( f.readable() )#不可读 print( f.writable() )#可写 f.write( ‘888888\n’ )#追加单行 f.write( ‘999999\n’ )#追加 f.writelines( [ ‘787878\n’ , ‘878787\n’] )#追加多行 f.close()#关闭文件
追加:
f=open('new_2','a',encoding='utf-8') print(f.readable()) #不可读 print(f.writable()) #可写 f.write('888888\n') #追加单行 f.write('999999\n') f.writelines(['787878\n','878787\n']) #追加多行 f.close() #rb f=open('aaaa.py','rb') #以字节打开 print(f.read().decode('utf-8'))
拷贝图片:
f=open('1.jpg','rb') #以rb的方式打开1.JPG data=f.read() #data获取读取到f的内容 print(data) f2=open('3.jpg','wb') #以写的方式打开 f2.write(data) #把data的内容写到f2 f2.close() f.close() #ab,以二进制的形式追加 f=open('new_3.txt','ab') f.write('aaaaa\n'.encode('utf-8'))
*上下文管理:
with open('aaaa.py','r',encoding='utf-8') as read_f,\ open('aaaa_new.py','w',encoding='utf-8') as write_f: data=read_f.read() write_f.write(data)
循环取文件每一行内容:
with open('a.txt','r',encoding='utf-8') as f: while True: line=f.readline() if not line:break print(line,end='') lines=f.readlines() #只适用于小文件 print(lines) data=f.read() print(type(data)) for line in f: #推荐使用 print(line,end='')
文件的修改:
方式一:只适用于小文件
import os with open('a.txt','r',encoding='utf-8') as read_f,\ open('a.txt.swap','w',encoding='utf-8') as write_f: data=read_f.read() write_f.write(data.replace('alex_SB','alex_BSB')) os.remove('a.txt') os.rename('a.txt.swap','a.txt')
#方式二:
import os with open('a.txt','r',encoding='utf-8') as read_f,\ open('a.txt.swap','w',encoding='utf-8') as write_f: for line in read_f: write_f.write(line.replace('alex_BSB','BB_alex_SB')) os.remove('a.txt') os.rename('a.txt.swap','a.txt')
文件函数操作介绍
函数 |
说明 |
file.read ( [ size ] ) |
读取文件全部内容 |
file.readline ( [ size ] ) |
一行一行的读取 |
file.readlines ( [ size ] ) |
读取到的每一行内容作为list中的元素 |
file.write ( str ) |
将字符串写入文件 |
file.writelines ( sequence or stringe) |
写多行到文件,参数可以是一个可迭代的object/list/tuple... |
file.close() |
关闭已经打开的文件 |
file.fileno ( self ) |
文件描述符 |
file.flush ( self ) |
刷新缓冲区的内容到硬盘 |
file.isatty ( self ) |
判断文件是否是 tty 设备,如果是 tty设备则返回True |
file.readable ( self ) |
判断是否可读 ,如果可读返回True,否则返回False |
file.readline ( self , limit=-1 ) |
每次仅读取一行数据 |
file.readlines ( self , hint=-1 ) |
把每一行内容当做列表(list)的一个元素 |
file.tell(self) |
获取指针位置 |
file.seek(self,offset, whence=io.SEEK_SET) |
指定文件中指针的位置 |
file.seekable(self) |
指针是否可操作 |
file.writable(self) |
是否可写 |
file.writlines(self,lines) |
写入文件的字符串序列,序列可以是任何迭代的对象字符串 |
file.read(self,n=None) |
读取指定字节数据,后面不加参数默认读取全部 |
file.write(self,s) |
往文件中写内容 |
python_文件 处理的更多相关文章
- python_文件
1. 打开文件 (1) open(name[, mode[, buffering]]) 功能:打开文件或者新建一个文件 参数说明: mode: "r" : 读模式(默认) &q ...
- Python_文件与文件夹操作
''' os模块除了提供使用操作系统功能和访问文件系统的简便方法之外,还提供了大量文件与文件夹操作的方法. os.path模块提供了大量用于路径判断.切分.连接以及文件夹遍历的方法. shutil模块 ...
- Python_文件处理
1.Python 文件处理 打开文件---->读取内容---->获得内容 读取文件方式: r 只读文件 w 只写模式 a 追加模式 r+b 读写模式 w+b 写读模式 a+b ...
- python_文件操作
说明:如有转载,请标明出处!! 一.文件操作 1.文件常用操作方法 open() f=open('文件名','r',encoding='utf-8') #三个参数,第一个文件详细路径,需要写明文件格式 ...
- 零基础学习python_文件(28-30课)
本人小白一枚,随着现在对测试要求越来越高,动不动就要去会一门编程语言,没办法只能学习学习Python,今天看到几个月前还是菜鸟的人突然就已经能使用Python写简单系统了,没办法,虽然之前也简单学习过 ...
- python_文件操作代码实例
"""提示:代码中的内容均被注释,请参考,切勿照搬""" 1 #文件的打开和关闭 ''' 文件对象 = open('文件名','使用方式') ...
- python_文件的打开和关闭
文件对象 = open('文件名','使用方式')rt:读取一个txt文件wt: 只写打开一个txt文件,(如果没有该文件则新建该文件)会覆盖原有内容at:打开一个txt文件,并从文件指针位置追加写内 ...
- python_文件io
# -*- coding:UTF-8 -*-#从键盘读入raw_input([prompt]) #函数从标准输入读取一个行,并返回一个字符串(去掉结尾的换行符)#input([prompt]) 函数和 ...
- Python_文件相关操作
1.open(filePath,type)方法:打开文件 filePath:文件路径 type:操作文件的方式(r:读取,w:覆盖写入,a:追加写入) 2.strip()方法:去除读取到的每行内容后的 ...
随机推荐
- cakephp静态资源404
location ~ /\.(css|js|woff|ttf|gif|jpg|jpeg|png|bmp|swf) { rewrite ^/$/(.*)$ /$/app/webroot/$ last; ...
- 获取iframe自适应后的宽高
1.同域 一:引入jquery <script type="text/javascript" src="../jquery.min.js">< ...
- 4.传统的MVC
通过document view设计,我们把应用程序的状态(clicktimes)从一个简单的类设计中抽取出来.下一个目标是抽取转化主要的事件(这个例子里面是鼠标点击之后释放)为应用程序逻辑从而改变应用 ...
- HtmlAgilityPack HTML操作类库的使用
HtmlAgilityPack是.NET下的一个开源的HTML解析类库.支持用XPath来解析HTML.命名空间:HtmlAgilityPack. 1.读取网络中html网页内容,获取网页中元素bod ...
- wordcount程序实现与测试
GitHub地址 https://github.com/jiaxuansun/wordcount PSP表格 PSP PSP阶段 预估耗时(分钟) 实际耗时(分钟) Planning 计划 10 5 ...
- ZOJ 2301 Color the Ball (离散化+线段树)
题意:有从 1 开始递增依次编号的很多球,开始他们都是黑色的,现在依次给出 n 个操作(ai,bi,ci),每个操作都是把编号 ai 到 bi 区间内 的-所有球涂成 ci 表示的颜色(黑 or 白) ...
- vtk-py z-Buffer可见算法
C++版例子: https://lorensen.github.io/VTKExamples/site/Cxx/PolyData/SelectVisiblePoints/ 优点: Simple to ...
- EM最大期望算法
[简介] em算法,指的是最大期望算法(Expectation Maximization Algorithm,又译期望最大化算法),是一种迭代算法,在统计学中被用于寻找,依赖于不可观察的隐性变量的概率 ...
- jvm与tomcat启动优化配置
JVM 优化 Java 的内存模型分为: Young,年轻代(易被 GC).Young 区被划分为三部分,Eden 区和两个大小严格相同的 Survivor 区,其中 Survivor 区间中,某一时 ...
- javascript的最重要的特性之一:闭包的解决方案
初始代码: for (var j = 0; j < lnglats.length; j++) { AMap.event.addListener(markers[j], 'mouseover', ...