tar命令基本、进阶使用指北

摘要

打包与压缩是我们在计算机系统日常使用中必备的一个工具,就如我们在使用Windows系统,也需要类似WinRAR的压缩软件来将许多数据、文件打包成一个文件,并压缩其占用空间。我们在Linux下也需要这样的工具,Linux下有类似gzip、bzip2之类的压缩工具,不过,这两个命令对目录的压缩指的是将目录内的所有文件“分别”进行压缩。

那Linux下有没有类似WinRAR一样强大的打包工具呢?那就是大名鼎鼎的tar了。tar可以将多个目录或文件打包成一个大文件,同时还可以通过gzip/bzip2的支持,将该文件同时进行压缩。更有趣的是,由于tar的使用太广泛了,以致于目前WinRAR也支持tar.gz文件名的解压缩。本文我将介绍tar命令的语法构成、参数说明、具体使用以及进阶操作。

一、语法构成与参数说明

1. tar语法构成

tar的参数非常多,这里只讲几个常用参数,更多参数可通过man tar查询。

[root@centos7-master ~]# tar [-j|-z] [cv] [-f 新建的文件名] filename... <==打包与压缩
[root@centos7-master ~]# tar [-j|-z] [tv] [-f 新建的文件名] <==查看文件名
[root@centos7-master ~]# tar [-j|-z] [xv] [-f 新建的文件名] [-C 指定目录] <==解压缩

2. tar参数说明

-j:通过bzip2的支持进行压缩/解压缩,此时文件名最好为*.tar.bz2,这种压缩方式效果比gzip压缩效果更好(压缩后的文件更小)
-z:通过gzip的支持进行压缩/解压缩,此时文件名最好为*.tar.gz -c:新建打包文件,可搭配 -v 来查看过程中被打包的文件名(filename)
-t:查看打包文件的内容含有哪些文件名,重点在查看文件名。
-x:解打包或解压缩的功能,可以搭配 -C(大写)在特定目录解开。 特别留意:-c、-t、-x 不可同时出现在一串命令行中。 -v:在压缩/解压缩的过程中,将正在处理的文件名显示出来 -f filename:-f 后面要接被处理的文件名,建议 -f 单独写一个参数 -C 指定目录:这个参数用在解压缩时,若要在特定目录解压缩,可以使用这个参数 -p:保留备份数据原本权限与属性,常用于备份(-c)重要的配置文件
-P:保留绝对路径,即允许备份数据中包含有根目录/
-exclude=FILE: 在压缩过程中,排除FILE,不要将FILE打包

3. tarfile与tarball的区别

我们知道tar是一个打包&压缩命令,它支持仅打包而不压缩,也支持即打包又压缩。

如果仅打包,就是tar -cv -f file.tar而已,这个文件我们称为tarfile

如果即打包又压缩,就是tar -jcv -f file.tar.bz2而已,这个文件我们称为tarball

二、tar的具体使用

tar最常用的三个命令形式如下:

打包:tar -cv -f filename.tar filename
压缩:tar -jcv -f filename.tar.bz2 filename
tar -zcv -f filename.tar.gz filename
查询:tar -jtv -f filename.tar.bz2
解压缩:tar -jxv -f filename.tar.bz2 -C 指定解压缩目录

这里说明一下,-f filename是紧接在一起的,但很多文章会写成-jcvf filename,这样也是对的。但由于参数的顺序理论上可调整,有些同学会写成-jvfc filename,其实也可以运行,但是会导致产生的文件名变为x,因为f后面紧跟的是c,系统会将f后面的内容识别为文件名。

所以建议还是把-f filename与其他参数独立开来写,可以避免不必要的问题出现。

但经过在Centos7上的实验,若参数f不写在最后(filename前面),会无法执行,说明Centos7对tar命令做了优化处理,具体如下:

[root@centos7-master ~]# tar -jvfc test_tar.tar.bz2 ./test_tar
tar: You must specify one of the `-Acdtrux' or `--test-label' options
Try `tar --help' or `tar --usage' for more information.

三、tar进阶

1. -p 参数:保留文件的权限与属性信息,且去掉根目录进行打包&压缩

使用tar -p保留备份数据的原本权限与属性。下面以备份etc目录为例:

[root@centos7-master ~]# tar -jpcv -f /root/etc.tar.bz2 /etc
tar: Removing leading `/' from member names <==注意这个警告消息
# -p参数会保留原文本文件的权限与属性

我们查阅一下刚刚备份的etc目录长什么样。

[root@centos7-master ~]# tar -jtv -f /root/etc.tar.bz2
...前面省略...
-rw-r--r-- root/root 2000 2019-08-06 21:44 etc/ntp.conf
drwxr-xr-x root/root 0 2020-05-01 20:25 etc/smartmontools/
-rw-r--r-- root/root 6774 2020-04-01 12:32 etc/smartmontools/smartd.conf
drwxr-xr-x root/root 0 2020-04-01 12:32 etc/smartmontools/smartd_warning.d/
-rwxr-xr-x root/root 5586 2020-04-01 12:32 etc/smartmontools/smartd_warning.sh

我们发现一个有趣的事情,那就是每个文件名都没了根目录。这也是上面我们在打包etc目录时遇到的那个警告消息tar: Removing leading `/' from member names(删除了文件名开头的`/')所告知的情况。

那为什么要去掉根目录呢?

主要是为了安全。我们知道,使用tar备份的数据可能会需要解压缩回来使用,tar -jtvf命令所查看到的文件名就是解压缩后的实际文件名。

设想一下,如果没有去掉根目录,解压缩后的文件名就会是绝对路径,即解压缩后的数据一定会被放置到/etc/xxx去。如此一来,系统原本的/etc/下面的数据就会被备份数据所覆盖掉了,这是一件很可怕的事情。

但如果我们在压缩的时候使用-p参数,即可去掉根目录,假设我们将备份数据在/tmp中解开,那么解压缩后文件所在的路径就会是/tmp/etc/xxx。这样系统本身的/etc/就不会被覆盖了~

2. -P参数:保留根目录进行打包&压缩

如果你确实有需要备份根目录到tar文件中,那可以使用-P(大写)参数。

[root@centos7-master ~]# tar -jpPcv -f /root/etc.and.root.tar.bz2 /etc
...省略中间过程...
[root@centos7-master ~]# tar -jtf /root/etc.and.root.tar.bz2
...省略前面的输出...
/etc/smartmontools/
/etc/smartmontools/smartd.conf
/etc/smartmontools/smartd_warning.d/
/etc/smartmontools/smartd_warning.sh

可以看到,使用-P参数后,文件名内的根目录就会存在。

3.仅解压单一文件的方法

(1) 找到我们想要的文件名,如shadow文件

[root@centos7-master ~]# tar -jtv -f /root/etc.tar.bz2 | grep 'shadow'
---------- root/root 422 2020-05-01 20:34 etc/gshadow
---------- root/root 409 2020-05-01 20:25 etc/gshadow-
---------- root/root 786 2020-05-01 20:34 etc/shadow <==这是我们要的
---------- root/root 762 2020-05-01 20:25 etc/shadow-

(2) 将该文件解开,语法与实际方法如下:

[root@centos7-master ~]# tar -jxv -f 打包的文件.tar.bz2 待解开文件名
[root@centos7-master ~]# tar -jxv -f /root/etc.tar.bz2 etc/shadow

4. --exclede=FILE: 打包某目录,但不包含某些文件的方法

这里我们打包/etc/ /root 这几个目录,但排除/root/etc*开发的文件,排除我们本次打包新生成的文件/root/system.tar.bz2(不要打包自己),以此为例。

[root@centos7-master ~]# tar -jcv -f /root/system.tar.bz2 --exclude=/root/etc* \
> --exclude=/root/system.tar.bz2 /etc /root

5. --newer-mtime=time 仅备份比time时刻还要新的文件

(1) 先由find找出比/etc/passwd还要新的文件

[root@centos7-master ~]# find /etc -newer /etc/passwd
...过程省略...
# 此时会显示出比/etc/passwd这个文件的mtime还要新的文件名 [root@centos7-master ~]# ll /etc/passwd
-rw-r--r-- 1 root root 1107 May 1 20:34 /etc/passwd

(2) 使用tar进行打包,日期为上面看到的2020/05/01

[root@centos7-master ~]# tar -jcv -f /root/etc.newer.then.passwd.tar.bz2 \
> --newer-mtime="2020/05/01" /etc/*
...中间省略...
/etc/X11/
/etc/X11/applnk/ <==这些是成功备份的文件
/etc/X11/fontpath.d/
...中间省略...
tar: /etc/yum.repos.d/CentOS-Vault.repo: file is unchanged; not dumped
tar: /etc/yum.repos.d/CentOS-fasttrack.repo: file is unchanged; not dumped #这些是没有被备份的文件

(3) 显示出文件

[root@centos7-master ~]# tar -jtv -f /root/etc.newer.then.passwd.tar.bz2 | \
> grep -v '/$'
#grep -v 表示排除掉符合后面所跟条件的文件

6. 使用tar将文件打包到某些特殊设备中

磁带机(tape)由于是一次性读取/写入设备,因此我们不能够使用类似cp等命令来复制。如果想要将/home/etc/root 备份到磁带机(/dev/st0)时,可以用以下命令:

[root@centos7-master ~]# tar -cv -f /dev/st0 /home /root /etc

7. 特殊应用:利用管道命令与数据流

tar有一种特殊的使用方式,那就是通过标准输入输出的数据流重定向(standard input/standard output),以及管道命令(pipe)的方式,将待处理的文件一边打包一边解压缩到目标目录去。

# 将/etc整个目录一边打包一边在/tmp中解开
[root@centos7-master ~]# cd /tmp
[root@centos7-master ~]# tar -cvf - /etc | tar -xvf -
# 要注意到,前面的压缩命令中,输入文件变成 - ;后面的解压缩命令中,输出命令也变成 - ;且中间有 | 作为管道
# 对于 - 的理解,可以将 - 想象成在内存中的一个设备(缓冲区—)
# 这种方式类似于cp -r /etc /tmp 但无需中间文件存在,可以将其看作是另一种方式进行复制的行为

参考文献

[1] 鸟哥(著).王世江(改编).鸟哥的Linux私房菜基础学习篇[M].北京:人民邮电出版社,2010.254-258

[2] Sam哥哥.Linux grep -v 命令排除输出[DB/OL].https://blog.csdn.net/linsongbin1/article/details/90515091,2019-05-24/2020-05-03

tar命令基本、进阶使用指北的更多相关文章

  1. Mac 软件包管理器Homebrew使用指北

    Homebrew Homebrew由开发者 Max Howell 开发,并基于 BSD 开源,是一个非常方便的软件包包管理器工具. Homebrew 官网 Homebrew 的几个核心概念 在正式介绍 ...

  2. c#封装DBHelper类 c# 图片加水印 (摘)C#生成随机数的三种方法 使用LINQ、Lambda 表达式 、委托快速比较两个集合,找出需要新增、修改、删除的对象 c# 制作正方形图片 JavaScript 事件循环及异步原理(完全指北)

    c#封装DBHelper类   public enum EffentNextType { /// <summary> /// 对其他语句无任何影响 /// </summary> ...

  3. Markdown 标记语言指北 - 源码

    这是上一篇博客的源代码. 这是班刊约稿的一篇文章. 全文约6000字, 预计需要 60 分钟读完. # Markdown 标记语言指北 #### TOC 1. [什么是 Markdown?](#%E4 ...

  4. 每天一个linux命令(28):tar命令

    通过SSH访问服务器,难免会要用到压缩,解压缩,打包,解包等,这时候tar命令就是是必不可少的一个功能强大的工具.linux中最流行的tar是麻雀虽小,五脏俱全,功能强大. tar命令可以为linux ...

  5. 菜鸟学Linux命令:tar命令 压缩与解压缩

    tar命令可以为linux的文件和目录创建档案.利用tar,可以为某一特定文件创建档案(备份文件),也可以在档案中改变文件,或者向档案中加入新的文件. tar最初被用来在磁带上创建档案,现在,用户可以 ...

  6. tar命令参数笔记

    是指的linux下的tar命令,该命令的用法相当多,以下的内容来自tar的info手册 --numeric-owner This option will notify 'tar' thar it sh ...

  7. 每天一个linux命令(21):tar命令

    通过SSH访问服务器,难免会要用到压缩,解压缩,打包,解包等,这时候tar命令就是是必不可少的一个功能强大的工具.linux中最流行的tar是麻雀虽小,五脏俱全,功能强大. tar 命令可以为linu ...

  8. ssh tar 命令把远程文件拉回来或推过去

    ssh tar 命令把远程文件拉回来或推过去 2010-09-11 21:55:35 分类: LINUX     登录22后tar 压缩/var/log目录输出到标准输入通过管道传到本地22_log. ...

  9. tar命令--解压缩

    tar命令是linux中的一个解压缩的命令.使用tar命令之前首先要搞清楚两个概念:打包和压缩.打包是指将一大堆文件或目录变成一个总的文件:压缩则是将一个大的文件通过一些压缩算法变成一个小文件. 为什 ...

随机推荐

  1. Windows恢复分区管控命令reagentc

    reagentc命令可以实现Windows恢复分区的开关,创建.删除,状态查看. 可以只管确定当前系统恢复分区所在位置,便于删除多余的恢复分区.

  2. javascript入门 之 ztree(五 自定义字体)

    <!--<!DOCTYPE html>--> <!--<HTML>--> <!--<HEAD>--> <!--<TI ...

  3. Java的运行时数据存储机制

    原文地址:http://yanwushu.sinaapp.com/java_data_storage/ Java程序在运行时需要为一系列的值或者对象分配内存,这些值都存在什么地方?用什么样的数据结构存 ...

  4. 关于《Python自动化测试实战》

    作者有话说 笔者写这本书的初心是想通过自身经验分享一些在自动化测试领域中的实用技术,能够帮助那些正在从事自动化测试相关工作或者准备转型自动化测试的测试人员.任何一门技术涵盖的知识点都是非常广泛的,可能 ...

  5. Pytorch自定义创建BP神经网络

    class BPNet(nn.Module): def __init__(self, in_dim, n_hidden_1, n_hidden_2,\ n_hidden_3, n_hidden_4, ...

  6. [总结]Floyd算法及其应用

    目录 一.Floyd算法 二.Floyd算法的应用 1. 传递闭包 例1:P2881 [USACO07MAR]排名的牛Ranking the Cows 例2:P2419 [USACO08JAN]牛大赛 ...

  7. SVG 案例:动态去创建分支节点,当鼠标经过某个节点时,分支线会高亮

    css: <style> #div1{ width:780px; height:400px; background:#fff; margin:20px auto; overflow:hid ...

  8. python高级特性之封包与解包

    前言 文的文字及图片来源于网络,仅供学习.交流使用,不具有任何商业用途,版权归原作者所有,如有问题请及时联系我们以作处理. 作者:kwsy PS:如有需要Python学习资料的小伙伴可以加点击下方链接 ...

  9. 这价格看得我偷偷摸了泪——用python爬取北京二手房数据

    如果想了解更多关于python的应用,可以私信我,或者加群,里面到资料都是免费的 http://t.cn/A6Zvjdun 近期,有个朋友联系我,想统计一下北京二手房的相关的数据,而自己用Excel统 ...

  10. vue2.x学习笔记(十八)

    接着前面的内容:https://www.cnblogs.com/yanggb/p/12629705.html. 处理边界情况 这里记录的都是和处理边界情况有关的功能,即一些需要对vue的规则做一些小调 ...