Python运维开发基础07-文件基础【转】

一，文件的基础操作

对文件操作的流程

[x] :打开文件，得到文件句柄并赋值给一个变量
[x] :通过句柄对文件进行操作
[x] :关闭文件

创建初始操作模板文件

[root@localhost scripts]# seq 12 >> test

[root@localhost scripts]# ls

test  test.py

[root@localhost scripts]# cat test

1

2

3

4

5

6

7

8

9

10

11

12

1.1 文件的按行读取（readline）

#文件的基本操作过程演示：

#!/usr/bin/env python3

# -*- coding:utf-8 -*-

# author:Mr.chen

f = open("test")    #相对路径打开文件

first_line = f.readline()   #读取文件的一行，并赋值

print (first_line)  #打印第一行

for num in range(4) :   #循环迭代4次

    print (f.readline())    #在读一行继续打印（重复4次）

f.close()   #关闭文件

#输出结果

[root@localhost scripts]# python3 test.py

1

2

3

4

5

特别提示：
只要文件没有执行f.close()进行关闭，那么继续f.readline()的话都是读取下一行
如果执行了f.close(),在重新进行f = open（）的话，就会重新开始读行

#操作演示

#!/usr/bin/env python3

# -*- coding:utf-8 -*-

# author:Mr.chen

f = open("test")

print (f.readline())

print (f.readline())

f.close()

f = open("test")

print (f.readline())

print (f.readline())

f.close()             

#输出结果

[root@localhost scripts]# python3 test.py

1

2

1

2

1.2 文件的按行读取和一次性读取（readline，read）

#代码演示：

#!/usr/bin/env python3

# -*- coding:utf-8 -*-

# author:Mr.chen

f = open("test")

print (f.readline())    #打印一行

print ("*"*50)          #分隔标志

print (f.read())        #打印剩余所有行

f.close()

#输出结果：

[root@localhost scripts]# python3 test.py

1

**************************************************

2

3

4

5

6

7

8

9

10

11

12

1.3 文件的指针

一个文件被打开，如果从头到尾都被读了一遍，默认就不能再读了

#代码演示：

f = open("test")

print (f.read())

print ("-"*50)

print (f.read())    #没有产生作用

f.close()      

#输出结果

[root@localhost scripts]# python3 test.py

1

2

3

4

5

6

7

8

9

10

11

12

--------------------------------------------------

这是为什么呢？因为文件的读取其实是有一个叫做指针的东西存在的，当你读了一行，指针就会出现在下一行上，最终直到文件的末尾.由于末尾没有下一行了，因此就不能再读了。如果我们想继续从头再读，那就需要调整文件指针的位置。

1.4 文件的编码

当我们在Linux读取文件的时候，不会有任何编码问题，因为Linux默认就是utf-8的格式。假如我们在windows上读取含有中文的文件内容，就会出现乱码。

在Linux上就没有这个问题，因为Linux默认就是用utf-8去转码。

二，文件的基础打开模式

2.1 文件的读模式（r）

# 读模式（r）

f = open("test","r")    #r，就表示以只读的方式打开文件，这种方式不可写入数据

print (f.read())

f.close()    

#输出结果

1

2

3

4

5

6

7

8

9

10

11

12

如果不写r，默认就是r模式

2.2文件的写模式w（不能读，会清空源文件内容，文件不存在会创建）

# 写模式（w）

f = open("yunjisuan","w",encoding="utf-8")

for i in range(10) :

    f.write("我写了{}行数据\n".format(i))

f.close()

#输出结果

[root@localhost scripts]# cat yunjisuan

我写了0行数据

我写了1行数据

我写了2行数据

我写了3行数据

我写了4行数据

我写了5行数据

我写了6行数据

我写了7行数据

我写了8行数据

我写了9行数据

特别提示：
如果写入的文件并不存在，则默认会创建这个文件
假如写入的文件存在，在写入的时候，会先清空源文件所有内容

2.3 文件的追加模式a（不可读；不存在则创建文件；存在则只追加内容）

# 追加模式（a）

f = open("yunjisuan","a",encoding="utf-8")

f.write("-"*50)

f.write("\n")

for i in range(10) :

    f.write("我写了{}行数据\n".format(i))

f.close()

#输出结果

[root@localhost scripts]# cat yunjisuan

我写了0行数据

我写了1行数据

我写了2行数据

我写了3行数据

我写了4行数据

我写了5行数据

我写了6行数据

我写了7行数据

我写了8行数据

我写了9行数据

--------------------------------------------------

我写了0行数据

我写了1行数据

我写了2行数据

我写了3行数据

我写了4行数据

我写了5行数据

我写了6行数据

我写了7行数据

我写了8行数据

我写了9行数据

三，文件读取操作（r）的运用技巧

3.1 按行读取文件的内容

#读取文件的前5行

f = open("yunjisuan","r",encoding="utf-8")

for i in range(5) :

    print (f.readline()) 

#读取文件的前8行，但是第5行不输出

f = open("yunjisuan","r",encoding="utf-8")

for i in range(8) :

    data = f.readline()

    if i != 4 :

        print (data)

特别提示：
读取文件前8行，但是第5行不输出，不能写成如下形式。请同学们思考这是为什么？

#错误的实现访问

f = open("yunjisuan","r",encoding="utf-8")

for i in range(8) :

    if i != 4 :

        print (f.readline())

3.2 按行迭代输出一个文件的所有内容

#按行输出一个文件的所有内容

f = open("test","r",encoding="utf-8")

for line in f :

    print (line)  

#按行输出文件所有内容，第5行不输出

f = open("test","r",encoding="utf-8")

num = 1

for line in f :

    if num != 5 :

        print (line)

    num += 1

3.3 优化文件的读取输出

为何输出时，有那么多的空行？
因为print本身就会在输出内容的后边加上\n的换行符，而从文件读取一行的行尾也是有一个\n的。因此在输出时，就变成了两次还行。所以我们需要去掉文件内容中附带\n.

#代码演示

f = open("test","r",encoding="utf-8")

for line in f :

    print (line) 

#输出结果

[root@localhost scripts]# python3 test.py

1

                #都是空行

2

                #因为在输出时有两个\n

3

4

5

#去掉多余的换行符再输出

f = open("test","r",encoding="utf-8")

for line in f :

    print (line.strip()) 

#输出结果

[root@localhost scripts]# python3 test.py

1

2

3

4

5

3.4 f是个什么东西？

#代码演示：

>>> f = open("test","r",encoding="utf-8")

>>> print (r)

>>> print (f)

<_io.TextIOWrapper name='test' mode='r' encoding='utf-8'>

由上述操作可知，f只是一个内存对象。这个内存对象是指向文件的，也就是说，它是一行一行从文件中拿数据的。因此，可以用在读取大文件上。

3.5 read，readline，readlines区别

#代码演示：

f = open("test","r",encoding="utf-8")

print (f.readline()）   #输出readline的值

f.close()

f = open("test","r",encoding="utf-8")

print (type(f.readline()))  #输出readline的类型

f.close()

f = open("test","r",encoding="utf-8")

print (f.readlines())   #输出readlines的值

f.close()

f = open("test","r",encoding="utf-8")

print (type(f.readlines())) #输出readlines的类型

f.close()

f = open("test","r",encoding="utf-8")

print (f.read())        #输出read的值

f.close()

f = open("test","r",encoding="utf-8")

print (type(f.read()))  #输出read的类型

f.close()

输出结果

[root@localhost scripts]# python3 test.py

1   #readline()是按行读取输出

<class 'str'>   #输出为字符串格式

['1\n', '2\n', '3\n', '4\n', '5\n'] #readlines()将所有值输出

<class 'list'>  #输出为列表格式

1

2

3

4           #read（）也是将所有值输出

5

<class 'str'>   #输出为字符串格式

由上述实验可知，由于readlines（）和read（）都是一次性将所有值输出，因此均不适合大文件的读取。而readline（）是按行读取输出，适合读取大型文件。

3.6 为何迭代文件所有内容只能用f这个对象而不是readline（）

#代码演示：

f = open("test","r",encoding="utf-8")

for line in f.readline():

    print (line)

f.close()

print ("-"*50)

f = open("test","r",encoding="utf-8")

for line in f:

    print (line)

f.close()

#输出结果

[root@localhost scripts]# python3 test.py

1       #迭代readline仍旧只输出了一行

--------------------------------------------------

1       #代码f则输出了文件所有内容

2

3

4

5

由测试可知，readline（）执行一次才能读取一行数据然后输出一行数据。因此，我们可以通过频繁执行readline（）来获取文件内容，但是我们无法去直接迭代它。而f是一个指向内存的地址，其实它还是一个我们以后会学的迭代器这么个东西。在这里我们不要深究。记住就好。

3.7 去掉计数器迭代一个文件所有内容，并且第4行不输出

#代码演示：

f = open("test","r",encoding="utf-8")

for index,line in enumerate(f):

    if index+1 != 4:

        print (index+1,line)

f.close()

#输出结果

[root@localhost scripts]# python3 test.py

1 1

2 2

3 3

5 5

3.8 文件的指针（tell，seek）

创建文件模板

[root@localhost scripts]# cat test

I am a students!

who are you ?

I am a students!

who are you ?

I am a students!

who are you ?

I am a students!

who are you ?

代码操作

f = open("test","r",encoding="utf-8")

print (f.tell())    #查看指针位置

f.readline()    #按行读取

print (f.tell())

f.readline()

print (f.tell())

f.close()

#输出结果

[root@localhost scripts]# python3 test.py

0

17  #指针是按字符计算的，一个字符计算1

31

#代码演示：

f = open("test","r",encoding="utf-8")

print (f.tell())

f.read(4)

print(f.tell())

f.close()

#输出结果

[root@localhost scripts]# python3 test.py

0

4

指针回调

#代码演示：

f = open("test","r",encoding="utf-8")

print (f.tell())

print (f.readline())

print(f.tell())

f.seek(0)   #将指针回调到0位置

print (f.tell())

print (f.readline())

f.close()

#输出演示：

[root@localhost scripts]# python3 test.py

0

I am a students!

17

0

I am a students!

四，文件写入操作（w）的运用技巧

4.1 文件的缓冲原理（buffer）

我们知道当我们写入文件内容的时候，如果目标文件不存在默认会创建一个空文件，如果目标文件存在内容，那么默认会清空目标文件。然后才会写入我们想要写入的数据，但是它是如何写入数据的呢？一行一行写入？还是一次性写入呢？

#代码演示：

f = open("yun","w",encoding="utf-8")

f.write("我好吗？\n")

f.write("我好吗？\n")

f.write("我好吗？\n")

decide = input("稍等一下：")    #我们执行完写入代码利用用户输入代码卡住这里，看看f.write()写入操作到底写入文件了没有

f.close()

当我们执行上述代码后，卡在用户输入界面，我们去看那个文件是否被写入了内容，查看的结果是空的，文件里什么都没有。

[root@localhost scripts]# cat yun

#空空如也

这是为什么呢？这是因为，当我们将数据写入文件的时候，如果一行一行进行数据写入，那么需要不断的进行I/O操作，而控制我们写入速度的是线程，而操作线程的又是CPU，所以我们的写入速度是非常快的。而磁盘的I/O速度，是非常慢的。如果我们一行一行进行数据写入，那么就会让我们线程一直等在这里，这会非常的没有效率。

因此，文件会默认先将数据写入到内存的（buffer）里，然后在一次性写入到文件中。

在代码里就是当文件被关闭时，默认数据从（buffer）一次性写入到文件中。

#当执行了代码f.close()之后...

[root@localhost scripts]# cat yun

我好吗？

我好吗？

我好吗？

那么写入到缓冲buffer的这个动作，我们可以看的到吗？作为开发，我们当然能看到。

#代码演示

f = open("yun","w",encoding="utf-8")

f.write("我好吗？\n")

f.write("我好吗？\n")

f.write("我好吗？\n")

print(f.buffer)     #打印buffer的内存地址

decide = input("稍等一下：")

f.close()

#输出结果

<_io.BufferedWriter name='yun'> #只是一个指向文件名的内存地址，这个就是buffer。数据是存在内存中的。

4.2 文件的写入刷新（flush）

当我们写入数据时候，我们已经知道了实际是写入到内存的缓冲区buffer的。当最后遇到f.close()时，数据才会被一次性写入到文件。

但是，假如我们就需要随时刷新数据进入文件呢？我们怎么办？

#代码演示：

f = open("yun","w",encoding="utf-8")

f.write("我好吗？\n")

f.write("我好吗？\n")

f.flush()   #即时刷新buffer中的数据到文件

f.write("我好吗？\n")

decide = input("稍等一下：")

f.close()

#输出结果

[root@localhost scripts]# cat yun

我好吗？

我好吗？

由上述实验，我们可知当我们想要即时将buffer里的数据刷新到文件里，那么我们只需要执行f.flush即可。

4.3 通过flush刷新规则实现文件的安装进度条显示

平时我们用的print输出其实默认在输出一个换行符的。如此Linux才会换行显示

#代码演示：

print (1)

print (2)

print (3) 

#输出结果

1

2

3

可是我们知道进度条都是一行显示的因此我们不能用print，我们需要用一种叫做标准输出的东西，在sys模块里。

#代码演示：

#!/usr/bin/env python3

# -*- coding:utf-8 -*-

# author:Mr.chen

import sys

sys.stdout.write("")   #默认不输出换行符

sys.stdout.write("")

sys.stdout.write("")  

#输出结果

123

特别提示：
sys.stdout.write()标准输出只能输出str格式的字符串
应用这个输出我们就可以实现进度条了。

#代码演示：

import sys,time                                                      

for i in range(20):

    sys.stdout.write("#")

    time.sleep(0.1)

#输出结果

####################

虽然我们已经设置了，每次输出间隔0.1秒，但是我们发现20个#仍旧是一次性输出的。这是因为，标准输出也是等到你整个进程都结束了才输出#号，因此我们修改一下

#代码演示：

#!/usr/bin/env python3

# -*- coding:utf-8 -*-

# author:Mr.chen

import sys,time

for i in range(20):

    sys.stdout.write("#")

    sys.stdout.flush()      #刷新每次的写入到屏幕

    time.sleep(0.1)

如上修改过的代码就可以实现Linux安装进度条显示了。

五文件追加操作（a）的运用技巧

5.1 文件的追加截断（truncate）

截取文件的一部分内容，然后写回源文件

文件初始模版：

[root@localhost scripts]# cat yun

123456789012345678901234567890  #一共30个字符

执行代码：

#代码演示

f = open("yun","a",encoding="utf-8")

f.truncate(20)  

#执行结果

[root@localhost scripts]# cat yun

12345678901234567890    #只剩下了20个字符

六，作业

1，继续完成阶段性作业

转自

Python运维开发基础07-文件基础 - 陈思齐 - 博客园
https://www.cnblogs.com/chensiqiqi/p/9163055.html

Python运维开发基础07-文件基础【转】的更多相关文章

python运维开发(二十一)----文件上传和验证码+session
内容目录: 文件上传验证码+session 文件和图片的上传功能 HTML Form表单提交,实例展示 views 代码 HTML ajax提交原生ajax提交,XMLHttpRequest方式上 ...
Python运维开发基础01-语法基础【转】
开篇导语整个Python运维开发教学采用的是最新的3.5.2版,当遇到2.x和3.x版本的不同点时,会采取演示的方式,让同学们了解. 教学预计分为四大部分,Python开发基础,Python开发进阶 ...
Python运维开发基础01-语法基础
标签(空格分隔): Mr.chen之Python3.0执教笔记(QQ:215379068) --仅供北大青鸟内部学习交流使用开发不是看出来的,开发一定是练出来的: 想学好开发,没有捷径可走,只有不断 ...
Python运维开发基础09-函数基础【转】
上节作业回顾 #!/usr/bin/env python3 # -*- coding:utf-8 -*- # author:Mr.chen # 实现简单的shell命令sed的替换功能 import ...
Python运维开发基础08-文件基础【转】
一,文件的其他打开模式 "+"表示可以同时读写某个文件: r+,可读写文件(可读:可写:可追加) w+,写读(不常用) a+,同a(不常用 "U"表示在读取时, ...
Python运维开发基础06-语法基础【转】
上节作业回顾 (讲解+温习120分钟) #!/usr/bin/env python3 # -*- coding:utf-8 -*- # author:Mr.chen # 添加商家入口和用户入口并实现物 ...
Python运维开发基础03-语法基础【转】
上节作业回顾(讲解+温习60分钟) #!/usr/bin/env python3 # -*- coding:utf-8 -*- # author:Mr.chen #只用变量和字符串+循环实现“用户登陆 ...
Python运维开发基础02-语法基础【转】
上节作业回顾(讲解+温习60分钟) #!/bin/bash #user login User="yunjisuan" Passwd="666666" User2 ...
Python运维开发基础10-函数基础【转】
一,函数的非固定参数 1.1 默认参数在定义形参的时候,提前给形参赋一个固定的值. #代码演示: def test(x,y=2): #形参里有一个默认参数 print (x) print (y) t ...

随机推荐

9、字符串转数字用int、因为input里面接受的全部是字符串
#!/user/bin/python# -*- coding:utf-8 -*-num = int(input('请输入数字:'))if num == 1: print(666)elif num == ...
UDP中的sendto 与recvfrom
sendto 头文件: #include <sys/types.h> #include <sys/socket.h> 定义函数: int sendto(int s, con ...
关于react上线系列问题及解决方案
近使用react做了一个音乐播放器小项目,在线下开发完成后,测试一切都没有问题,于是打算打包上线.首先注册了一个新浪云账号,然后创建了一个SAE应用实例,再然后就照着新浪云给出的远程仓库进行push. ...
js监听键盘事件
用JS监听键盘按下事件(keydown event) 1.监听全局键盘按下事件,例如监听全局回车事件 1 $(document).keydown(function(event){ 2 if(eve ...
Vue.Draggable/SortableJS 的排序功能，在VUE中的使用
此插件git: https://github.com/SortableJS/Vue.Draggable 基于Sortable.js http://www.cnblogs.com/xiangsj/p/6 ...
1、PHP入门二维数组与循环
<?php $two=array(array(2,3),1=>array(1,2,3),2=>array(4,5,6)); echo $two[1][0];//输出1 echo $t ...
【bzoj 3524】[Poi2014]Couriers
Description 给一个长度为n的序列a.1≤a[i]≤n.m组询问,每次询问一个区间[l,r],是否存在一个数在[l,r]中出现的次数大于(r-l+1)/2.如果存在,输出这个数,否则输出0. ...
（6）设计一个TimeMap
一.描述设计一个TimeMap,基于key value的支持两类操作set(string key, string value, int timestamp),get(string key, int ...
python中#!/usr/bin/env python与#!/usr/bin/python
通常在脚本语言的第一行会看到#!/usr/bin/env python 与 #!/usr/bin/python其中之一,这两句话的目的都是指出你的python文件用什么可执行程序去运行它. #!/us ...
oracle 重建索引以及导出所有的索引脚本(可以解决还原数据库文件时先还原数据，在重新用脚本创建索引)
导出数据库备份文件 1. 备份服务器数据,采用并行方式,加快备份速度(文件日期根据具体操作日期修改) expdp jhpt/XXXX directory=databackup dumpfile=dpf ...

Python运维开发基础07-文件基础【转】

一，文件的基础操作

1.1 文件的按行读取（readline）

1.2 文件的按行读取和一次性读取（readline，read）

1.3 文件的指针

1.4 文件的编码

二，文件的基础打开模式

2.1 文件的读模式（r）

2.2文件的写模式w（不能读，会清空源文件内容，文件不存在会创建）

2.3 文件的追加模式a（不可读；不存在则创建文件；存在则只追加内容）

三，文件读取操作（r）的运用技巧

3.1 按行读取文件的内容

3.2 按行迭代输出一个文件的所有内容

3.3 优化文件的读取输出

3.4 f是个什么东西？

3.5 read，readline，readlines区别

3.6 为何迭代文件所有内容只能用f这个对象而不是readline（）

3.7 去掉计数器迭代一个文件所有内容，并且第4行不输出

3.8 文件的指针（tell，seek）

四，文件写入操作（w）的运用技巧

4.1 文件的缓冲原理（buffer）

4.2 文件的写入刷新（flush）

4.3 通过flush刷新规则实现文件的安装进度条显示

五 文件追加操作（a）的运用技巧

5.1 文件的追加截断（truncate）

六，作业

Python运维开发基础07-文件基础【转】的更多相关文章

随机推荐

热门专题

五文件追加操作（a）的运用技巧