python如何进行文本操作

1.能调用方法的一定是对象,比如数值、字符串、列表、元组、字典,甚至文件也是对象,Python中一切皆为对象。

  1. str1 = 'hello'
  2. str2 = 'world'
  3. str3 = ' '.join([str1,str2])
  4. print(str3)

2.三种基本的文件操作模式:r(only-read)、w(only-write)、a(append)

对文件进行操作的流程:

第一,建立文件对象。

第二,调用文件方法进行操作。

第三,不要忘了关闭文件。(文件不关闭的情况下,内容会放在缓存,虽然Python会在最后自动把内容读到磁盘,但为了以防万一,要养成关闭文件的习惯)

文件file1

  1. 一张褪色的照片,
  2. 好像带给我一点点怀念。
  3. 巷尾老爷爷卖的热汤面,
  4. 味道弥漫过旧旧的后院;
  5. 流浪猫睡熟在摇晃秋千,
  6. 夕阳照了一遍他咪着眼;
  7. 那张同桌寄的明信片,
  8. 安静的躺在课桌的里面。

  

 

(1)r模式

在只读模式下写入内容会报错。

  1. f = open('file1','r')
  2. f_read = f.read() #read是逐字符地读取,read可以指定参数,设定需要读取多少字符,无论一个英文字母还是一个汉字都是一个字符。
  3. print(f_read)
  4. f.close()
  1. f = open('file1','r')
  2. f_read = f.readline() #readline只能读取第一行代码,原理是读取到第一个换行符就停止。
  3. print(f_read)
  4. f.close()
  1. f = open('file1','r')
  2. f_read = f.readlines() #readlines会把内容以列表的形式输出。
  3. print(f_read)
  4. f.close()
  1. f = open('file1','r')
  2. for line in f.readlines() #使用for循环可以把内容按字符串输出。
  3. print(line) #输出一行内容输出一个空行,一行内容一行空格... 因为文件中每行内容后面都有一个换行符,而且print()语句本身就可以换行,如果不想输出空行,就需要使用下面的语句:print(line.strip())
  4. f.close()

 

(2)w模

在进行操作前,文件中所有内容会被清空。比如在file1中写入'hello world',程序执行后file1中就只剩下一句'hello world'

  1. f = open('file1','w',encoding='utf8') #由于Python3的默认编码方式是Unicode,所以在写入文件的时候需要调用utf8,以utf8的方式保存,这时pycharm(默认编码方式是utf8)才能正确读取,当读取文件时,文件是utf8格式,pycharm也是utf8,就不需要调用了。
  2. f_w = f.write('hello world')
  3. print(f_w) #有意思的是,这里并不打印'hello world',只打印写入多少字符
  4. f.close()

  

(3)a模式

与w模式不同的是,a模式不会把原来内容清空,而是光标移到内容最后位置,继续写入新内容。比如在最后追加'hello world'

  1. f = open('file1','a')
  2. f_a = f.write('hello world')
  3. print(f_a) #还是会打印写入的字符数
  4. f.close()

打印文件,在'流浪猫睡熟在摇晃秋千'后面加上'helloworld'输出

在r模式时,我们说过用for循环和readlines()输出文件内容,这种输出内容的原理是:打开文件,把全部内容读入内存,然后再打印输入,当文件很大时,这种读取方式就不靠谱了,甚至会使机器崩溃。我们需要及时关闭文件,如下:

  1. f = open('file','r')
  2. data=f.readlines() #注意及时关闭文件
  3. f.close()
  4.  
  5. num = 0
  6. for i in data:
  7. num += 1
  8. if num == 5:
  9. i = ''.join([i.strip(),'hello world']) #不要使用“+”进行拼接
  10. print(i.strip())
  11. f.close()

  

对于大数据文件,要使用下面的方法:

  1. num = 0
  2. f.close() #不要过早关闭文件,否则程序不能识别操作句柄f.
  3. f = open('file','r')
  4. for i in f: #for内部把f变为一个迭代器,用一行取一行。
  5. num += 1
  6. if num == 5:
  7. i = ''.join([i.strip(),'hello world'])
  8. print(i.strip())
  9. f.close()

  

3.tell和seek

tell:查询文件中光标位置

seek:光标定位

  1. f = open('file','r')
  2. print(f.tell()) #光标默认在起始位置
  3. f.seek(10) #把光标定位到第10个字符之后
  4. print(f.tell()) #输出10
  5. f.close()
  6. ----------------------
  7. f = open('file','w')
  8. print(f.tell()) #先清空内容,光标回到0位置
  9. f.seek(10)
  10. print(f.tell())
  11. f.close()
  12. ----------------------
  13. f = open('file','a')
  14. print(f.tell()) #光标默认在最后位置
  15. f.write'你好 世界'
  16. print(f.tell()) #光标向后9个字符,仍在最后位置
  17. f.close()

  

4.flush 同步将数据从缓存转移到磁盘

示例,实现进度条功能

  1. import sys,time #导入sys和time模块
  2. for i in range(40):
  3. sys.stdout.write('*')
  4. sys.stdout.flush() #flush的作用相当于照相,拍一张冲洗一张
  5. time.sleep(0.2)
  6. 下面代码也能够实现相同的功能
  7. import time
  8. for i in range(40):
  9. print('*',end='',flush=True) #print中的flush参数
  10. time.sleep(0.2)

  

5.truncate 截断

不能是r模式下执行,

w模式下,已经清空所有数据,使用truncate没有任何意义,

a模式下,截断指定位置后的内容。

  1. f = open('file','a')
  2. f.truncate(6) #只显示6个字节的内容(6个英文字符或三个汉字),后面的内容被清空。

  

6.光标位置总结

一个汉字两个字节,涉及光标位置的方法有4个:readtellseektruncate

  1. #--------------------------光标总结head-----------------------------------
  2. f = open('file','r')
  3. print(f.read(6)) #6个字符
  4. print(f.tell()) #位置12字节,一个汉字两个字节
  5. f.close()
  6.  
  7. f = open('file','r')
  8. f.seek(6) #6个字节
  9. print(f.tell())
  10. f.close()
  11.  
  12. f = open('file','a')
  13. print(f.tell()) #光标默认在最后位置
  14. f.write('你好 世界')
  15. print(f.tell()) #光标向后9个字节,一个汉字两个字节,仍在最后位置 182-->191
  16. f.close()
  17.  
  18. f = open('file','a',encoding='utf-8')
  19. print(f.truncate(6)) #由于需要光标定位位置,所以也是字节。只显示6个字节的内容(6个英文字母或三个汉字,一个汉字两个字节),后面的内容被清空。
  20. f.close()
  21. #-----------------------------光标总结end---------------------------------

  

7.另外3种模式:r+、w+、a+

r+:读写模式,光标默认在起始位置,当需要写入的时候,光标自动移到最后

w+:写读模式,先清空原内容,再写入,也能够读取

a+:追加读模式,光标默认在最后位置,直接写入,也能够读取。

  1. f = open('file','a')
  2. print(f.tell()) #末尾207位置
  3. f.close()
  4.  
  5. f = open('file','r+')
  6. print(f.tell()) #0位置
  7. print(f.readline()) #读取第一行
  8. f.write('羊小羚') #光标移到末尾207位置并写入
  9. print(f.tell()) #213位置
  10. f.seek(0) #光标移到0位置
  11. print(f.readline()) #读取第一行
  12. f.close()

  

 

8.修改文件内容

思路:由于数据存储机制的关系,我们只能把文件1中的内容读取出来,经过修改后,放到文件2中。

  1. f2 = open('file2','w',encoding='utf8') #写入的时候必须加utf8
  2. f1 = open('file','r')
  3. num = 0
  4. for line in f1: #迭代器
  5. num += 1
  6. if num == 5:
  7. line = ''.join([line.strip(),'羊小羚\n']) #里面就是对字符串进行操作了
  8. f2.write(line)
  9. f1.close()
  10. f2.close()

  

9.with语句

可以同时对多个文件同时操作,当with代码块执行完毕时,会自动关闭文件释放内存资源,不用特意加f.close() ,我们通过下面的示例体会with的用法和好处。

with语句重写8中的代码

  1. num = 0
  2. with open('file','r') as f1,open('file2','w',encoding='utf8') as f2:
  3. for line in f1:
  4. num += 1
  5. if num == 5:
  6. line = ''.join([line.strip(),'羊小羚'])
  7. f2.write(line)

  

转自:www.jb51.net/article/91416.htm

python中的文本操作的更多相关文章

  1. python中的赋值操作和复制操作

    之前一直写C#,变量之间赋值相当于拷贝,修改拷贝变量不会改变原来的值.但是在python中发现赋值操作本质是和C++中的引用类似,即指向同一块内存空间.下面通过一个例子说明: p=[0,1,2,3,4 ...

  2. python中的赋值操作

    参考:https://www.cnblogs.com/andywenzhi/p/7453374.html?tdsourcetag=s_pcqq_aiomsg(写的蛮好) python中的赋值操作“=” ...

  3. python中的日志操作和发送邮件

    1.python中的日志操作 安装log模块:pip install nnlog 参数:my_log = nnlog.Logger('server_log.log',level='debug',bac ...

  4. python中OS模块操作文件和目录

    在python中执行和操作目录和文件的操作是通过内置的python OS模块封装的函数实现的. 首先导入模块,并查看操作系统的类型: >>> import os os.name # ...

  5. Python中的字符串操作总结(Python3.6.1版本)

    Python中的字符串操作(Python3.6.1版本) (1)切片操作: str1="hello world!" str1[1:3] <=> 'el'(左闭右开:即是 ...

  6. Python中的json操作

    Python中的json操作 标签(空格分隔): python 编码 json 字符串前缀问题 字符串前缀可以有r,u r:表示原始(raw)字符串,比如'\n'不会被转义.常用于正则. u:表示un ...

  7. Python中的切片操作

    python中的切片操作功能十分强大,通常我们利用切片来进行提取信息,进行相关的操作,下面就是一些切片的列子. 列如我们从range函数1-100中取7的倍数,函数及结果如下所示: >>& ...

  8. python中的句柄操作

    python中的句柄操作 制作人:全心全意 通过窗口标题获取句柄 import win32gui hld = win32gui.FindWindow(None,u"Adobe Acrobat ...

  9. python中序列的操作

    Python中的序列操作 可变对象:列表.字典.集合 不可变对象:数值.字符串.元组.forzenset 1.序列的通用操作 (1)测试元素是否存在 x in S和x not in S,返回True或 ...

随机推荐

  1. 20162325 金立清 S2 W5 C14

    20162325 2017-2018-2 <程序设计与数据结构>第5周学习总结 关键内容摘要 集合是收集并组织其他对象的对象 集合中的元素一般由加入集合的次序或元素之间某些固有的关系而组织 ...

  2. Git的基本使用方法和安装&心得体会(使用git命令行)

    这是补发的,使用命令行操作的. (1)选择本地repository的路径 找到后点鼠标右键,选择git bash here. (2) clone到本地 在命令行输入 git clone ADDRESS ...

  3. Week2-作业1 《构建之法》1、2、16章观后感

    这几天阅读了<构建之法>中的几章,受益匪浅,刷新了很多我对软件工程的认知.这本书让我很惊喜,阅读起来不像其他书一样枯燥,有很多人物的设计,以及对话的形式,非常有趣. 第一章.概述 读完第一 ...

  4. 深入理解JAVA集合系列四:ArrayList源码解读

    在开始本章内容之前,这里先简单介绍下List的相关内容. List的简单介绍 有序的collection,用户可以对列表中每个元素的插入位置进行精确的控制.用户可以根据元素的整数索引(在列表中的位置) ...

  5. 蜗牛慢慢爬 LeetCode 5.Longest Palindromic Substring [Difficulty: Medium]

    题目 Given a string s, find the longest palindromic substring in s. You may assume that the maximum le ...

  6. [转帖]CPU 的缓存

    缓存这个词想必大家都听过,其实缓存的意义很广泛:电脑整机最大的缓存可以体现为内存条.显卡上的显存就是显卡芯片所需要用到的缓存.硬盘上也有相对应的缓存.CPU有着最快的缓存(L1.L2.L3缓存等),缓 ...

  7. linux ls文件颜色和底色设置

    转帖 :linux ls文件颜色和底色设置 白色:表示普通文件蓝色:表示目录绿色:表示可执行文件红色:表示压缩文件浅蓝色:链接文件红色闪烁:表示链接的文件有问题黄色:表示设备文件灰色:表示其他文件 这 ...

  8. Redis和Memcache的区别总结-京东阿里面试

    集群: redis 和memcached都支持集群 数据类型 Redis支持的数据类型要丰富得多,Redis不仅仅支持简单的k/v类型的数据,同时还提供String,List,Set,Hash,Sor ...

  9. 【uoj#37/bzoj3812】[清华集训2014]主旋律 状压dp+容斥原理

    题目描述 求一张有向图的强连通生成子图的数目对 $10^9+7$ 取模的结果. 题解 状压dp+容斥原理 设 $f[i]$ 表示点集 $i$ 强连通生成子图的数目,容易想到使用总方案数 $2^{sum ...

  10. BZOJ5305 HAOI2018苹果树(概率期望+动态规划)

    每种父亲编号小于儿子编号的有标号二叉树的出现概率是相同的,问题相当于求所有n个点的此种树的所有结点两两距离之和. 设f[n]为答案,g[n]为所有此种树所有结点的深度之和,h[n]为此种树的个数. 枚 ...