python3-基础4

字符编码

字符编码：就是把人类的字符翻译成计算机能识别的数字

字符编码表：就是一张字符与数字对应关系表 ascii gbk utf-8 unicode

unicode ------> encode(utf-8) ------> bytes 转换（内存中的编码转换成硬盘的编码，编码）

bytes ------> decode('utf-8') ------> unicode 转换（解码）

原则：字符以什么格式编译的，就要以什么格式解码

python3 中的字符串分为两种

x='lalala' 存成 unicode
y=x.encode('utf-8') 存成 bytes

文件处理

打开文件

f = open('a.txt' , 'r' , encoding = 'utf-8') #windos下用 GBK编码，Linux下用utf-8编码

#在r模式下，如果文件不存在，不会创建新文件

res = f.read() #读取a.txr，光标移动到文件末尾

print(res)

print('第二次' ， f.read()) # 光标已经移动到末尾，所以无法再读出文件

print(f.readline() , end='') #逐行读取，以空格结尾

print(f.readlines()) #读取文件所有行，组成一个列表

f.close() # 切记关闭已打开的文件

傻瓜式操作打开--关闭文件用 with --- as

with open('a.txt' , 'r' , encoding = 'utf-8') as f: # 用 with open 打开文件，将结果传给 f，也可以打开多个文件 open b as f1 , open c as f2 :

pass

写模式

f=open('a.txt' , 'w' , encoding = 'utf-8' )

f.write('11111111\n')

f.write('2222\n')

f.write('3333\n444444\n')

f.writelines(['a\n' , 'b\n' ,'c\n']) #

f.close()

 1 #将文件整个读取到内存后，再执行后续操作

 2 with open('old.txt', 'r', encoding='utf-8') as read_f :

 3     msg = read_f.read()

 4     msg = msg.replace('alex', lalala')   #内容替换  Alex 换成  lalala

 5     print(msg)

 6

 7 with open('old.txt', 'r', encoding='utf-8') as read_f \

 8 open('.old.txt.swap', 'w', encoding='utf-8') as write_f :

 9     msg = read_f.read()

10     msg = msg.replace('alex', lalala')         #内容替换 Alex 换成 lalala

11     print(msg)

12     write_f.write(msg)

13

14 os.remove('old.txt')

15 os.rename('.old.txt.swap', 'old.txt')

16

17 #如果文件过大，需要逐行读取

18 import os

19 with open('old.txt', 'r', encoding='utf-8') as read_f \

20 open('.old.txt.swap', 'w', encoding='utf-8') as write_f :

21     for line in read_f:   #逐行读取

22         print(line)

23         if 'lalala' in line:   #判断是否有 lalala

24              line = line.replace('lalala', 'alex') #将 lalala 替换为  Alex

25              write_f.write(line)   #将修改后的内行写入到新的文件里去

26         else:

27              write_f.write(line)   #没有修改的行，也要写入到新的文件里去

28 os.remove('old.txt')

29 os.rename('.old.txt.swap', 'old.txt')

30

几种模式

# r 文本模式的读（不能写，只能读），若文件不存在，不会创建新文件

f = open('a.txt', 'r', encoding = 'utf-8')

print(f.read())

f.clos() #向操作系统请求关闭打开的文件，f为一个变量，

# w 文本模式的写（不能读，只能写），若文件不存在，则创建，若文件存在，则清空

f = open('a.txt', 'w', encoding = 'utf-8')

print(f.writable()) #判断是否为写模式返回结果 True 或 False

print(f.write())

f.write('哈哈哈哈\n')

f.writelines(['1111\n','222\n'])

# a 文本模式的追加写入（不能读，只能写） , 文件存在，则光标跳到文件末尾，若文件不存在，则创建

f = open('a.txt','a',encoding='utf-8')

print(f.tell()) #可以返回光标所在位置

f.write('3333\n')
f.write('44444\n')

# r+，w+，a+ 可读可写模式

#rb 模式直接从硬盘中读取 bytes

f = open('a.txt','rb')

print(f.read()) #出现硬盘保存的文件，人类无法识别

# wb模式 , 若文件存在，会清空
# f=open('a.txt','wb')
# f.write('你好啊'.encode('utf-8')) #如果不加encode 类型，会报错

# ab模式同 wb模式

# with 模式 -- 自动关闭打开的文件

with open('file.txt','w',encoding='utf-8') as f:
f.write('1111\n')

拷贝不同格式的文件

f=open('test.jpg','rb')
print(f.read())

with open('test.jpg','rb') as read_f,open('test1.jpg','wb') as write_f:
# write_f.write(read_f.read())
for line in read_f:
write_f.write(line)

 1 #拷贝小程序，名称为 copy.py    -----  python3 copy.py source.file target.file

 2 import sys

 3 #print(sys.argv())  #查看有什么参数

 4

 5 #python3 copy.py source.file target.file    #需要三个参数：文件本身、源文件、目标文件

 6 if len(sys.argv) < 3:   #若参数小于3  则退出

 7     print('Usage:python3 copy.py source.file target.file')

 8     sys.exit()

 9

10

11 #此方法可能导致在不同的平台，文件路径中有不同的符号，导致路径出错

12 # with open(sys.argv[1], 'rb') as read_f, open(sys.argv[2] , 'wb') as write_f :

13 #     for lin in read_f:

14 #         write_f.write(line)

15

16 #r'C:\Users\Administrator\test.jpg'   #加r 表示原生字符串，保障路径不会有问题

17

18 #用下面的方法，保障所有平台可用

19 with open(r'%s' %sys.argv[1],'rb') as read_f,\

20         open(r'%s' %sys.argv[2],'wb') as write_f:

21

22     for line in read_f:

23         write_f.write(line)

文件其他操作

f=open('a.txt','r',encoding='utf-8') #读取文本
print(f.read(3)) #可以读取三个字符，中文算一个，英文也算一个

f=open('a.txt','rb') #以字节方式读取
print(f.read(3).decode('utf-8')) #读了三个字节，一个中文占用3个字节，decode解码后显示一个汉字

print(f.read(6).decode('utf-8')) #读取两个汉字

一: read(3)：

　　1. 文件打开方式为文本模式时，代表读取3个字符

　　2. 文件打开方式为b模式时，代表读取3个字节

二: 其余的文件内光标移动都是以字节为单位如seek，tell，truncate

注意：

　　1. seek有三种移动方式0，1，2，其中1和2必须在b模式下进行，但无论哪种模式，都是以bytes为单位移动的

　　2. truncate是截断文件，所以文件的打开方式必须可写，但是不能用w或w+等方式打开，因为那样直接清空文件了，所以truncate要在r+或a或a+等模式下测试效果

f=open('a.txt','rb') #字节模式下
print(f.read(3)) #读取三个字节（一个中文）
print(f.tell())　　 #查看光标的位置　　
f.seek(3)　　 #以文件开头作为参照物，相当于 f.seek(3, 0 )，光标移动到第三个字节的位置

f.seek(3,1) #以文件当前的光标位置作为参照物，光标移动到当前光标往后数3个字节的位置

f.seek(3,2) #以文件结尾作为参照物，光标移动到倒数第三个字节的位置

print(f.tell())　　 #查看光标的位置
print(f.read().decode('utf-8')) #解码，显示文本信息

 1 # python3 tail.py -f access.log

 2 #检测某个文件的更新，比如 access.log

 3

 4 import time

 5 import sys    #调用argw，是个列表，里面的参数为   脚本名称 ， -f参数 , 文件名称

 6

 7 with open(r'%s' % sys.argv[2], 'rb') as f:    #打开文件，该文件必须存在，下标为2的参数为文件名称

 8     f.seek(0, 2)  #光标移动到文件最末尾

 9

10     while True:

11         line = f.readline()   #整行读取

12         if line:

13             print(line.decode('utf-8'),end='')   ##将文本解码，以空格为结尾

14         else:

15             time.sleep(0.2)   #等待0.2秒再次执行

16

17

18 #自动添加文件内容

19 # with open('acess.log','a') as f:

20 #     f.write('1111\n')

21

截断文件，属于写模式

with open('a.txt','r+',encoding='utf-8') as f:
f.truncate(2) #以文件开头为参照物，截取前两个字节，之后的文件清空，如果是中文，必须截取3的倍数的字符，否则会乱码

python3-基础4的更多相关文章

python3基础视频教程
随着目前Python行业的薪资水平越来越高,很多人想加入该行业拿高薪.有没有想通过视频教程入门的同学们?这份Python教程全集等你来学习啦! python3基础视频教程:http://pan.bai ...
Python3基础-特别函数（map filter partial reduces sorted）实例学习
1. 装饰器关于Python装饰器的讲解,网上一搜有很多资料,有些资料讲的很详细.因此,我不再详述,我会给出一些连接,帮助理解. 探究functools模块wraps装饰器的用途案例1 impor ...
2. Python3 基础入门
Python3 基础入门编码在python3中,默认情况下以UTF-8编码.所有字符串都是 unicode 字符串,当然也可以指定不同编码.体验过2.x版本的编码问题,才知道什么叫难受. # -* ...
python002 Python3 基础语法
python002 Python3 基础语法编码默认情况下,Python 3 源码文件以 UTF-8 编码,所有字符串都是 unicode 字符串. 当然你也可以为源码文件指定不同的编码: # -* ...
Python3基础（十二）学习总结·附PDF
Python是一门强大的解释型.面向对象的高级程序设计语言,它优雅.简单.可移植.易扩展,可用于桌面应用.系统编程.数据库编程.网络编程.web开发.图像处理.人工智能.数学应用.文本处理等等. 在学 ...
Python3基础（八）模块
在程序中定义函数可以实现代码重用.但当你的代码逐渐变得庞大时,你可能想要把它分割成几个文件,以便能够更简单地维护.同时,你希望在一个文件中写的代码能够被其他文件所重用,这时我们应该使用模块(modul ...
【python3基础】python3 神坑笔记
目录 os 篇 os.listdir(path) 运算符篇 is vs. == 实例 1:判断两个整数相等实例 2:argparse 传参实例 3:np.where 命令行参数篇 Referenc ...
Python3基础语法和数据类型
Python3基础语法编码默认情况下,Python3源文件以UTF-8编码,所有字符串都是unicode字符串.当然你也可以为原码文件制定不同的编码: # -*- coding: 编码 -*- 标 ...
Python3基础-目录
Python3基础-目录(Tips:长期更新Python3目录) 第一章初识Python3 1.1 Python3基础-前言 1.2 Python3基础-规范第二章 Python3内置函数&a ...
Python3基础1
Python介绍及特点发展史 Python 2 or 3? 安装Python3 Hello World程序变量用户输入模块初识 .pyc是个什么? 数据类型初识数据运算表达式if ...e ...

随机推荐

js 音乐播放器
在写之前先说下我遇到得两个问题,第一个问题是,在音乐标签,我希望得是切换数据做到得,但是出了问题,暂时为解决,第二个问题,页面切换时音乐继续播放由卡顿情况,未处理好. 好了,那我们开始做这个音乐播放器 ...
前端测试时，常用SQL
与后台联调页面,经常会验证数据正确性,这时候就需要会点SQL语句,以下是常用的SQL: 单表查询 select * from table 条件查询 select * from table where ...
python文本处理，format方法--转子网上 crifan
原文出处:https://www.crifan.com/python_string_format_fill_with_chars_and_set_alignment/ [问题] 想要获得这样的效果: ...
剑指Offer 64. 滑动窗口的最大值（其他）
题目描述给定一个数组和滑动窗口的大小,找出所有滑动窗口里数值的最大值.例如,如果输入数组{2,3,4,2,6,2,5,1}及滑动窗口的大小3,那么一共存在6个滑动窗口,他们的最大值分别为{4,4,6 ...
vuex核心
最详细的Vuex教程什么是Vuex? vuex是一个专门为vue.js设计的集中式状态管理架构.状态?我把它理解为在data中的属性需要共享给其他vue组件使用的部分,就叫做状态.简单的说就是dat ...
关于jetbrains系列产品2018.1.5以后的使用(crack)方法
产品请一律官网下载:https://www.jetbrains.com/ 我这里以JetBrains GoLand 2018.2.1为例说明下非付费的使用方法(若资金允许,请点击https://www ...
DG_Check检测
DG_Check检测 1) all 查询备库角色(确认主备关系)set linesize 140 col dbid for 9999999999 col name for a10 col databa ...
JavaScript语言里判断一个整数，属于哪个范围：大于0；小于0；等于0
<!DOCTYPE html> <html> <head> <meta charset="UTF-8"> <title> ...
npm 遇到的坑
在脚手架方式搭建react项目时,输入命令:npm install -g create-react-app,出现错误: UNABLE_TO_VERIFY_LEAF_SIGNATUREUNABLE_TO ...
Azure monitor Portal 、Azure monitor API监控指标、性能监视器常用指标

python3-基础4

python3-基础4的更多相关文章

随机推荐

热门专题