一、压缩

需求描述

现在有一个目录，需要将此目录打包成tar.gz文件。因为有一个Django项目，需要用到此功能！

tar.gz

目录结构如下：

./

├── folder

│   ├── .doc

│   └── .txt

└── packing.py

packing.py 是python程序，需要将folder目录打包成tar.gz文件

packing.py 内容如下：

#!/usr/bin/env python3

# coding: utf-

import os, tarfile

def make_targz(output_filename, source_dir):

    """

    一次性打包目录为tar.gz

    :param output_filename: 压缩文件名

    :param source_dir: 需要打包的目录

    :return: bool

    """

    try:

        with tarfile.open(output_filename, "w:gz") as tar:

            tar.add(source_dir, arcname=os.path.basename(source_dir))

        return True

    except Exception as e:

        print(e)

        return False

make_targz('aa.tar.gz','folder')

注意：

空子目录会被打包，如果只打包不压缩，将"w:gz"参数改为"w:"或"w"即可。

执行程序，会在当前目录下生成aa.tar.gz文件

二、解压

def untar(fname, dirs):

    """

    解压tar.gz文件

    :param fname: 压缩文件名

    :param dirs: 解压后的存放路径

    :return: bool

    """

    try:

        t = tarfile.open(fname)

        t.extractall(path = dirs)

        return True

    except Exception as e:

        print(e)

        return False

untar('aa.tar.gz','./')

完整代码如下：

#!/usr/bin/env python3

# coding: utf-

import os, tarfile

def make_targz(output_filename, source_dir):

    """

    一次性打包目录为tar.gz

    :param output_filename: 压缩文件名

    :param source_dir: 需要打包的目录

    :return: bool

    """

    try:

        with tarfile.open(output_filename, "w:gz") as tar:

            tar.add(source_dir, arcname=os.path.basename(source_dir))

        return True

    except Exception as e:

        print(e)

        return False

def untar(fname, dirs):

    """

    解压tar.gz文件

    :param fname: 压缩文件名

    :param dirs: 解压后的存放路径

    :return: bool

    """

    try:

        t = tarfile.open(fname)

        t.extractall(path = dirs)

        return True

    except Exception as e:

        print(e)

        return False

# make_targz('aa.tar.gz','folder')

untar('aa.tar.gz','./')

执行程序，就会将aa.tar.gz解压到当前文件夹下

三、压缩原理

把文件的二进制代码压缩，把相邻的0,1代码减少，比如有000000,可以把它变成6个0 的写法60，来减少该文件的空间。

由于计算机处理的信息是以二进制数的形式表示的，因此压缩软件就是把二进制信息中相同的字符串以特殊字符标记来达到压缩的目的。为了有助于理解文件压缩，请在脑海里想象一幅蓝天白云的图片。对于成千上万单调重复的蓝色像点而言，与其一个一个定义“蓝、蓝、蓝……”长长的一串颜色，还不如告诉电脑：“从这个位置开始存储1117个蓝色像点”来得简洁，而且还能大大节约存储空间。这是一个非常简单的图像压缩的例子。其实，所有的计算机文件归根结底都是以“1”和“0”的形式存储的，和蓝色像点一样，只要通过合理的数学计算公式，文件的体积都能够被大大压缩以达到“数据无损稠密”的效果。总的来说，压缩可以分为有损和无损压缩两种。如果丢失个别的数据不会造成太大的影响，这时忽略它们是个好主意，这就是有损压缩。有损压缩广泛应用于动画、声音和图像文件中，典型的代表就是影碟文件格式mpeg、音乐文件格式mp3和图像文件格式jpg。但是更多情况下压缩数据必须准确无误，人们便设计出了无损压缩格式，比如常见的zip、rar等。压缩软件（compression software）自然就是利用压缩原理压缩数据的工具，压缩后所生成的文件称为压缩包（archive），体积只有原来的几分之一甚至更小。当然，压缩包已经是另一种文件格式了，如果想使用其中的数据，首先得用压缩软件把数据还原，这个过程称作解压缩。常见的压缩软件有winzip、winrar等。

本文参考链接：

https://www.cnblogs.com/liangqihui/p/9219333.html

https://www.cnblogs.com/kaituorensheng/p/4493145.html

python tar.gz格式压缩、解压的更多相关文章

[Linux] 解压tar.gz文件，解压部分文件
遇到数据库无法查找问题原因,只能找日志,查找日志的时候发现老的日志都被压缩了,只能尝试解压了数据量比较大,只能在生产解压了,再进行查找文件名为*.tar.gz,自己博客以前记录过解压方法: h ...
tar.gz，直接解压可用？还是需要编译安装？
在linux搭建环境,下载的tar.gz安装包,有的直接解压就可以用,有的需要编译安装后才可用怎么知道该怎么操作呢? 其实,tar -zxvf解压后,进入目录看README.md就知道答案了另外, ...
.tar.gz 和.tgz 解压
wget {url} 下载 eg: wget http://mirrors.tuna.tsinghua.edu.cn/apache/tomcat/tomcat-8/v8.5.24/bin/apac ...
python对文件的压缩解压
python自带的zipfile的模块支持对文件的压缩和解压操作 zipfilp.ZipFile 表示创建一个zip对象 zipfile.ZipFile(file[, mode[, compressi ...
[Linux] 016 压缩解压命令
1. 压缩解压命令:gzip 命令名称:gzip 命令所在路径:/bin/gzip 执行权限:所有用户语法:gzip [文件] 功能描述:压缩文件压缩后文件的格式:.gz 补充: 解压 .rar ...
Linux常用命令6 压缩解压命令
.zip是Linux和Windows共有的压缩格式 1.压缩解压命令:gzip 命令英文原意:GNU zip 命令所在路径:/bin/gzip 执行权限:所有用户语法: gzip [文件] ...
php解压 tar.gz 格式文件
1.运用php自带压缩与归档扩展(phar) $phar = new PharData('song.tar.gz'); //路径要解压的文件是否覆盖 $phar->extractTo('c: ...
linux下tar压缩/解压的使用(tar) 压缩/解压
压缩: tar -zcvf 压缩后文件名.tar.gz 被压缩文件解压: tar -zxvf 被解压文件具体的可以在linux环境下用 tar --help 查看详细说明格式:ta ...
linux中tar及压缩解压命令用法
把常用的tar解压命令总结下,当作备忘: tar 命令可以为Linux的文件和目录创建档案.利用 tar,可以为某一特定文件创建档案(备份文件),也可以在档案中改变文件,或者向档案中加入新的文件.t ...

随机推荐

【设计模式】——工厂方法FactoryMethod
前言:[模式总览]——————————by xingoo 模式意图工厂方法在MVC中应用的很广泛. 工厂方法意在分离产品与创建的两个层次,使用户在一个工厂池中可以选择自己想要使用的产品,而忽略其创建 ...
Add Again UVA - 11076（排列之和）
题意: 输入n个数字,求这些数字所有全排列的和 (1<= n <= 12) 对于任意一个数字,其在每一位出现的次数是相同的即所有数字的每一位相加的和是相同的. 因此可以等效为它们 ...
CRM 常用SQL 脚本
1. 查询角色.用户 SELECT DISTINCT DomainName, u.FullName , u.FirstName, u.InternalEM ...
stm32 修改工作频率
@2018-5-11 10:04:22 修改外部晶振大小 stm32f4xx系列是在文件<stm32f4xx.h>中的宏定义 #define HSE_VALUE (uint32_t)800 ...
Problem A: 选举解题报告
Problem A: 选举题意给出一个投票过程.有$n$个选民和$m$个候选人,每个选民$i$有个不重且有序的可投集合$\{a_i\}$. 对于第一轮投票,选民$i$会投给\( ...
【bzoj4537】 Hnoi2016—最小公倍数
http://www.lydsy.com/JudgeOnline/problem.php?id=4537 (题目链接) 题意给出一个${n}$个点${m}$条边的无向图,每条边有两个权值${a,b} ...
asp.net性能优化之使用Redis缓存（入门）
1:使用Redis缓存的优化思路 redis的使用场景很多,仅说下本人所用的一个场景: 1.1对于大量的数据读取,为了缓解数据库的压力将一些不经常变化的而又读取频繁的数据存入redis缓存大致思路如 ...
kubespray 一键安装k8s集群
1. clone代码 git clone https://github.com/kubernetes-incubator/kubespray.git 2. 添加inventory/inventory ...
JS中的继承链
我们首先定义一个构造函数Person,然后定义一个对象p,JS代码如下: function Person(name) { this.name = name; } var p = new Person( ...
你真的理解js的赋值语句么
之前谢亮兄和我一起讨论的一个问题: var a = {}; a.x = a = 3; a 的值是什么. 其实当执行赋值语句的时候,js 的 = 左侧不是原始变量地址,而是一个新值.怎么理解这句话呢? ...

python tar.gz格式压缩、解压