Python操作Zip文件

需要使用到zipfile模块

读取Zip文件

随便一个zip文件,我这里用了bb.zip,就是一个文件夹bb,里面有个文件aa.txt。

  1. import zipfile
  2. # 默认模式r,读
  3. azip = zipfile.ZipFile('bb.zip') # ['bb/', 'bb/aa.txt']
  4. # 返回所有文件夹和文件
  5. print(azip.namelist())
  6. # # 返回该zip的文件名
  7. print(azip.filename)
  8. # 压缩文件里bb文件夹下的aa.txt
  9. azip_info = azip.getinfo('bb/aa.txt')
  10. # 原来文件大小
  11. print(azip_info.file_size)
  12. # 压缩后大小
  13. print(azip_info.compress_size)
  14. # 这样可以求得压缩率,保留小数点后两位
  15. print('压缩率为{:.2f}'.format(azip_info.file_size/azip_info.compress_size))

可以看到打开方式并不是想象中的open,而是ZipFile。用namelist()可以返回里面所有的文件夹和文件路径。getinfo可以获得某路径下文件的信息,如上。

还能直接读取压缩包里文件的内容,下面两种方法得到的结果是一样的。需要注意的是,读取出来的数据好像是字节形式的,解码成utf-8就好

  1. # 可以直接读取里面的内容, 不过貌似是字节形式.需要解码回utf-8.参数也可以传ZiInfo, 如b
  2. a = azip.read('bb/cc.txt').decode('utf-8')
  3. print(a)
  4. # 打开文件再读取,好像比上面麻烦
  5. b = azip.open(azip_info)
  6. print(b.read().decode('utf-8'))
  7. azip.close()

用完资源后记得主动close。

解压Zip

最为关键的功能,一句搞定。默认解压在当前工作目录,可以指定解压目录。

  1. azip.extractall()

新建Zip文件

不仅能读还能写。新建压缩包的时候,可以选择压缩算法,比如DEFLATED和LZMA

  1. # 新建压缩包,放文件进去,若压缩包已经存在,将覆盖。可选择用a模式,追加
  2. azip = zipfile.ZipFile('bb.zip', 'w')
  3. # 必须保证路径存在,将bb件夹(及其下aa.txt)添加到压缩包,压缩算法LZMA
  4. azip.write('D:/bb/aa.txt', compress_type=zipfile.ZIP_LZMA)
  5. # 写入一个新文件到压缩包中,data是该文件的具体内容,可以是str或者是byte。
  6. # 这里是新建一个bb文件夹,其下再新建一个cc.txt,将hello world写入到文本中
  7. azip.writestr('bb/cc.txt', data='Hello World', compress_type=zipfile.ZIP_DEFLATED)
  8. # 关闭资源
  9. azip.close()

上面有两个方法比较类似,注意区分。

  • write指的是将已经存在的文件复制到压缩包,包括路径中的所有文件夹河其下的文件。
  • writestr是直接在压缩包里新建文件夹和文件,data参数是往该文件中写入的内容。

最终压缩包里会被添加bb文件夹,其下有aa.txtcc.txt

将整个文件夹添加到压缩包中

如果我们这样写,想象着能添加bb文件夹下所有内容到压缩包中,那就不对了。这样添加,只会把bb文件夹复制过去,也仅仅如此,里面的文件不会添加到压缩包。最后得到的只是一个空文件夹。

  1. azip.write(r'D:/bb', compress_type=zipfile.ZIP_LZMA)

那怎么办呢?只好递归查找添加了,os.walk刚好可以帮助我们。

  1. for current_path, subfolders, filesname in os.walk(r'D:\bb'):
  2. print(current_path, subfolders, filesname)
  3. # filesname是一个列表,我们需要里面的每个文件名和当前路径组合
  4. for file in filesname:
  5. # 将当前路径与当前路径下的文件名组合,就是当前文件的绝对路径
  6. azip.write(os.path.join(current_path, file))
  7. # 关闭资源
  8. azip.close()

正确选用变量,元组中第一个是当前路径,而第三个是当前路径下的文件,两者一组合刚好就是文件的绝对路径。

这样就可以实现添加整个文件夹添加到压缩包了。而且是这些路径下所有的文件夹和其下的文件全部添加。也就是说,保留了原文件夹的结构层次。

shutil添加压缩包和解压缩

shuitl模块有个函数,可以方便地添加整个整个文件夹到压缩包。

  1. # 第一个参数是归档文件名称,第二个参数是指定的格式,不仅是支持zip,第三个参数是要压缩文件/文件夹的路径
  2. shutil.make_archive('archive_name', 'zip', r'F:\IDE Setting')
  3. # shutil.get_archive_formats() 可以查看支持的格式

当然也可以解压缩,可指定解压目录,否则默认解压到当前工作目录

  1. shutil.unpack_archive(r'D:\bb.zip')
  2. # shutil.get_unpack_formats() 可以查看支持的格式

by @sunhaiyu

2017.6.26

Python操作Zip文件的更多相关文章

  1. python操作txt文件中数据教程[3]-python读取文件夹中所有txt文件并将数据转为csv文件

    python操作txt文件中数据教程[3]-python读取文件夹中所有txt文件并将数据转为csv文件 觉得有用的话,欢迎一起讨论相互学习~Follow Me 参考文献 python操作txt文件中 ...

  2. Java使用基本JDK操作ZIP文件以及zip文件的加密、解密等功能

    Java使用基本JDK操作ZIP文件 http://blog.csdn.net/zhyh1986/article/details/7723649 Java解压和压缩带密码的zip文件 http://b ...

  3. python操作txt文件中数据教程[4]-python去掉txt文件行尾换行

    python操作txt文件中数据教程[4]-python去掉txt文件行尾换行 觉得有用的话,欢迎一起讨论相互学习~Follow Me 参考文章 python操作txt文件中数据教程[1]-使用pyt ...

  4. python操作txt文件中数据教程[2]-python提取txt文件

    python操作txt文件中数据教程[2]-python提取txt文件中的行列元素 觉得有用的话,欢迎一起讨论相互学习~Follow Me 原始txt文件 程序实现后结果-将txt中元素提取并保存在c ...

  5. python操作txt文件中数据教程[1]-使用python读写txt文件

    python操作txt文件中数据教程[1]-使用python读写txt文件 觉得有用的话,欢迎一起讨论相互学习~Follow Me 原始txt文件 程序实现后结果 程序实现 filename = '. ...

  6. 数学建模之Python操作csv文件

    1.用Python通过csv文件里面的某一列,形成键值,然后统计键在其他列出现的次数. import pandas as pd import numpy as np import csv import ...

  7. python读写zip文件

    zipfile.ZipFile(fileName[, mode[, compression[, allowZip64]]]) fileName是没有什么疑问的了. mode和一般的文件操作一样,'r' ...

  8. c#使用DotNetZip封装类操作zip文件(创建/读取/更新)实例

    DotnetZip是一个开源类库,支持.NET的任何语言,可很方便的创建,读取,和更新zip文件.而且还可以使用在.NETCompact Framework中.  下载地址在这里:http://dot ...

  9. 使用commons-compress操作zip文件(压缩和解压缩)

    http://www.cnblogs.com/luxh/archive/2012/06/28/2568758.html Apache Commons Compress是一个压缩.解压缩文件的类库. 可 ...

随机推荐

  1. js中年份、月份下拉框

    <select id="year" style="width: 100px;"></select> <select id=&quo ...

  2. 腾讯AlloyTeam正式发布pasition - 制作酷炫Path过渡动画

    pasition Pasition - Path Transition with little JS code, render to anywhere - 超小尺寸的Path过渡动画类库 Github ...

  3. CSS动画属性性能详细介绍

    CSS动画属性会触发整个页面的重排relayout.重绘repaint.重组recomposite Paint通常是其中最花费性能的,尽可能避免使用触发paint的CSS动画属性,这也是为什么我们推荐 ...

  4. [iOS]从零开始开发一个即时通讯APP

    前言 这是我的毕业设计.刚开始确定这个课题的时候是因为以前有稍微研究过一些XMPP协议,在这个基础上做起来应该不难.然后开始选技术的时候还有半年,我想为什么不从更底层做起呢!那就不用XMPP,当时接触 ...

  5. 如何利用php+android+新浪sae服务器做一个app下载应用

    功能简介:提供一个app下载的平台,类似于appstore,上面有很多app可供下载 实现基本思路:利用android,在手机桌面建立一个图标,点击该图标不是打开app应用,而是跳转到一个web页面, ...

  6. android studio创建一个最简单的跳转activity

    实现目的:由mainActivity跳转到otherActivity 1.写好两个layout文件,activity_main.xml和otherxml.xml activity_main.xml & ...

  7. iOS 本地视频和网络视频流播放

    需求:最近公司需要做一个楼宇对讲的功能:门口机(连接WIFI)拨号对室内机(对应的WIFI)的设备进行呼叫,室内机收到呼叫之后将对收到的数据进行UDP广播的转发,手机(连接对应的WIFI)收到视频流之 ...

  8. JS中关于clientWidth offsetWidth scrollWidth 的区别及意义

    网页可见区域宽: document.body.clientWidth;网页可见区域高: document.body.clientHeight;网页可见区域宽: document.body.offset ...

  9. Java集合框架梳理(含经典面试题)

    Java Collections Framework是Java提供的对集合进行定义,操作,和管理的包含一组接口,类的体系结构. 1. 整体框架 Java容器类库一共有两种主要类型:Collection ...

  10. Java基础语法<一> 数据类型&运算符

    1 数据类型   1.1 整型 类型 存储需求 取值范围 int 4字节 -21 4748 3648 – 21 4748 3647 232 short 2字节 -32768-32767 216 lon ...