原创:扣钉日记(微信公众号ID:codelogs),欢迎分享,转载请保留出处。

简介

如果你是后端程序员,我想你一定见过*.tar.gz*.zip*.jar后缀的文件吧,这些都是压缩文件,那这些文件都是怎么生成的,又有哪些关键区别呢?本文将带你一起了解这些文件和配套的操作命令,以及其经常使用的场景。

tar与gzip

Linux上最常见的压缩文件就是*.tar.gz了,各种开源软件常以这种格式发布源码或程序,所以作为一名后端开发,还是很有必要了解一下的。

首先,可以发现这个文件后缀名有两段,即.tar.gz,取这个名称也是有原因的,因为它的制作过程就分为两个部分,如下:

  1. 使用tar将目录打包成单个.tar文件
  1. # 将applogs目录打包为applogs.tar文件
  2. # 其中-c代表打包、-f指定打包文件名
  3. $ tar -cf applogs.tar applogs/
  4. # 可以发现,打包文件大小与目录占用大小差不多,因为tar仅仅是把目录中文件拼成单个文件,默认并不压缩
  5. $ du -sh applogs/ applogs.tar
  6. 177M applogs/
  7. 175M applogs.tar
  1. 使用gzip将.tar文件压缩为.gz文件
  1. # 使用gzip压缩,会生成applogs.tar.gz文件
  2. $ gzip -k applogs.tar
  3. # 可以发现压缩后文件体积明显变小
  4. $ du -sh applogs.tar applogs.tar.gz
  5. 175M applogs.tar
  6. 8.8M applogs.tar.gz

这就是*.tar.gz文件的制作过程,其实这两步使用tar命令可以简化为一步,如下:

  1. # 打包并压缩,其中-z代表打包后再使用gzip压缩
  2. $ tar -czf applogs.tar.gz applogs/
  3. # 解压到当前目录
  4. $ tar -xzf applogs.tar.gz -C ./

压缩日志文件

另外,由于日志文件内容一般都有很高重复率,这导致Linux上经常会将后端系统产生的历史日志文件压缩后存储起来,这样可以大幅减低磁盘空间占用。

基于这种情况,Linux上又诞生了一批查看压缩日志文件的命令,如zcat、zgrep、zless等,如下:

  1. # 自动解压文件,并将其中文件内容输出
  2. $ zcat applogs.tar.gz
  3. # 自动解压文件,并在其中搜索,用法和grep类似
  4. $ zgrep -a 'error' applogs.tar.gz

这比傻乎乎地先解压文件,再在文件中搜索要高效多了。

tar与其它压缩算法

另外,除了gzip外,tar其实也可以搭配其它压缩算法,像bzip2、xz等等,如下:

  1. -j, --bzip2 filter the archive through bzip2
  2. -J, --xz filter the archive through xz
  3. --lzip filter the archive through lzip
  4. --lzma filter the archive through xz
  5. --lzop filter the archive through lzop
  6. -z, --gzip, --gunzip, --ungzip filter the archive through gzip
  7. --zstd filter the archive through zstd
  8. -Z, --compress, --uncompress filter the archive through compress

zip与jar

zip同样是一种常见的压缩文件格式,后缀是*.zip,与上面tar、gzip不同的是,zip将打包与压缩两个过程融合在一起了,在Linux下对应的操作命令是zipunzip,如下:

  1. # 创建zip压缩文件
  2. $ zip -r applogs.zip applogs/
  3. # 查看zip压缩文件中有哪些文件
  4. $ unzip -l applogs.zip
  5. Archive: applogs.zip
  6. Length Date Time Name
  7. --------- ---------- ----- ----
  8. 0 2022-09-17 12:58 applogs/
  9. 99166 2022-09-16 18:20 applogs/demo.2022-09-16.0.log
  10. 13177092 2022-09-17 13:37 applogs/demo.2022-09-17.0.log
  11. 948 2022-08-09 15:08 applogs/demo.log
  12. ...
  13. --------- -------
  14. 203039002 140 files
  15. # 解压zip文件,-d指定解压目录
  16. $ unzip applogs.zip -d ./

与gzip类似的是,zip也配套了一批方便特定场景使用的命令工具,如zipinfo、zipgrep等,如下:

  1. # zipinfo查看zip文件包含哪些文件
  2. $ zipinfo applogs.zip
  3. Archive: applogs.zip
  4. Zip file size: 9573195 bytes, number of entries: 140
  5. drwxrwxrwx 3.0 unx 0 bx stor 22-Sep-17 12:58 applogs/
  6. -rwxrwxrwx 3.0 unx 99166 tx defN 22-Sep-16 18:20 applogs/demo.2022-09-16.0.log
  7. -rwxrwxrwx 3.0 unx 13177092 tx defN 22-Sep-17 13:37 applogs/demo.2022-09-17.0.log
  8. -rwxrwxrwx 3.0 unx 948 tx defN 22-Aug-09 15:08 applogs/demo.log
  9. ...
  10. 140 files, 203039002 bytes uncompressed, 9546235 bytes compressed: 95.3%
  11. # zipgrep自动解压文件,并在其中搜索,用法和grep类似
  12. $ zipgrep 'error' applogs.zip

查看jar文件

目前,绝大多数java项目都是基于spingboot的,众所周知,spingboot会将项目打包成单个jar文件来部署,但其实jar文件本质上就是zip格式,它相比zip文件只是多了一个META-INF/MANIFEST.MF文件而已,如下:

  1. $ unzip -p app.jar META-INF/MANIFEST.MF
  2. Manifest-Version: 1.0
  3. Spring-Boot-Classpath-Index: BOOT-INF/classpath.idx
  4. Implementation-Version: 0.0.1-SNAPSHOT
  5. Spring-Boot-Layers-Index: BOOT-INF/layers.idx
  6. Start-Class: com.example.demo.DemoApplication
  7. Spring-Boot-Classes: BOOT-INF/classes/
  8. Spring-Boot-Lib: BOOT-INF/lib/
  9. Build-Jdk-Spec: 1.8
  10. Spring-Boot-Version: 2.4.0
  11. Created-By: Maven Jar Plugin 3.2.0
  12. Main-Class: org.springframework.boot.loader.JarLauncher

如上所示,MANIFEST.MF文件指定了jar包的Main-Class,这样当执行java -jar app.jar时,java就知道去哪个类找main方法了,而spingboot打包的jar,无非就是将启动类换成了自己的而已。

而很多时候,我们需要确认下jar文件里面的内容,比如我想看一下app.jar里被spingboot内嵌的tomcat的线程池配置大小,可如下查看:

  1. $ zipgrep 'max-thread' app.jar
  2. BOOT-INF/classes/application.yml: max-threads: 500

这可比jdk自带的jar命令方便多了,如果你是java开发同学,这个命令应该成为你开发工具箱中的一员。

总结

ok,压缩文件与命令介绍得差不多了,简单总结一下:

  1. tar、gzip:用于打包或解压*.tar.gz文件的命令,虽然它们是两个命令,但几乎都是一起使用的。
  2. zip、unzip:用于打包或解压*.zip文件的命令,值得注意的是,它们同样可处理*.jar文件,且在搜索场景中,使用zipgrep更方便。

less命令其实可以直接打开这些压缩文件,它甚至可以打开png、pdf等广义上的压缩文件!

另外,Linux平台上其实还有一些其它的压缩命令,如bzip2、xz、7z、rar等,就不一一介绍了,感兴趣可查看Linux man文档。

往期内容

密码学入门

接口偶尔超时,竟又是JVM停顿的锅!

耗时几个月,终于找到了JVM停顿十几秒的原因

mysql的timestamp会存在时区问题?

真正理解可重复读事务隔离级别

字符编码解惑

tar、gzip、zip、jar是什么,怎么查看?的更多相关文章

  1. tar/gzip/zip文件打包、压缩命令

    一.tar打包备份工具 1.命令功能 tar 将多个文件或目录打包在一起,可用通过调用gzip或zip实现压缩.解压的命令:tar不仅可以多多个文件进行打包,还可以对多个文件打包后进行压缩. 2.语法 ...

  2. [转帖]Linux操作系统中,*.zip、*.tar、*.tar.gz、*.tar.bz2、*.tar.xz、*.jar、*.7z等格式的压缩与解压

    Linux操作系统中,*.zip.*.tar.*.tar.gz.*.tar.bz2.*.tar.xz.*.jar.*.7z等格式的压缩与解压 https://blog.csdn.net/gatieme ...

  3. Linux下解压命令大全 解压缩 tar bz2 zip tar.gz gz

    .tar解包:tar xvf FileName.tar打包:tar cvf FileName.tar DirName(注:tar是打包,不是压缩!)---------------.gz解压1:gunz ...

  4. atitit.压缩算法 ZLib ,gzip ,zip 最佳实践 java .net php

    atitit.压缩算法 ZLib ,gzip ,zip   最佳实践  java .net php 1. 压缩算法的归类::: 纯算法,带归档算法 1 2. zlib(适合字符串压缩) 1 3. gz ...

  5. AIX上解压缩.tar.Z, .tar.gz, .zip及.tgz

    在AIX上最常见的压缩文件就是.tar檔了,而除了tar文件以外,有时会遇到数据是用其它的压缩文件格式,所以偶顺手整理了一些常见的压缩文件格式,在AIX要怎么解压缩 : ·    .tar.Z fil ...

  6. golang tar gzip 压缩,解压(含目录文件)

    tar是用于文件归档,gzip用于压缩.仅仅用tar的话,达不到压缩的目的.我们常见的tar.gz就是用gzip压缩生成的tar归档文件. go实现tar压缩与解压与zip类似,区别在于tar需要使用 ...

  7. gz、tar、zip、bz2压缩和解压缩命令

    gzip 压缩后的格式为:*.gz 这种压缩方式不能保存原文件:且不能压缩目录 命令举例:#压缩[root@localhost tmp]# gzip buodo[root@localhost tmp] ...

  8. Android总结之Gzip/Zip压缩

    前言: 做过Android网络开发的都知道,在网络传输中我们一般都会开启GZIP压缩,但是出于刨根问底的天性仅仅知道如何开启就不能满足俺的好奇心的,所以想着写个demo测试一下比较常用的两个数据压缩方 ...

  9. Linux操作系统中,*.zip、*.tar、*.tar.gz、*.tar.bz2、*.tar.xz、*.jar、*.7z等格式的压缩与解压

    zip格式 压缩: zip -r [目标文件名].zip [原文件/目录名] 解压: unzip [原文件名].zip 注:-r参数代表递归 tar格式(该格式仅仅打包,不压缩) 打包:tar -cv ...

  10. Linux操作系统中,.zip、.tar、.tar.gz、.tar.bz2、.tar.xz、.jar、.7z等格式的压缩与解压

    zip格式 压缩: zip -r [目标文件名].zip [原文件/目录名] 解压: unzip [原文件名].zip 注:-r参数代表递归 tar格式(该格式仅仅打包,不压缩) 打包:tar -cv ...

随机推荐

  1. Task.Run(), Task.Factory.StartNew() 和 New Task() 的行为不一致分析

    重现 在 .Net5 平台下,创建一个控制台程序,注意控制台程序的Main()方法如下: static async Task Main(string[] args) 方法的主体非常简单,使用Task. ...

  2. 基于NCF的多模块协同实例

    简介 这次给大家带来的内容是基于NCF的多模块协同实例 主要讲解的内容是NCF的模块Xncf之间相互调用,相互协作的能力 这里可以把Xncf比作乐高玩具,一个Xncf就是你拥有的乐高玩具的类型,比如你 ...

  3. 深入浅出理解SVM支持向量机算法

      支持向量机是Vapnik等人于1995年首先提出的,它是基于VC维理论和结构风险最小化原则的学习机器.它在解决小样本.非线性和高维模式识别问题中表现出许多特有的优势,并在一定程度上克服了" ...

  4. JAVA中简单的for循环竟有这么多坑,你踩过吗

    JAVA中简单的for循环竟有这么多坑,你踩过吗 实际的业务项目开发中,大家应该对从给定的list中剔除不满足条件的元素这个操作不陌生吧? 很多同学可以立刻想出很多种实现的方式,但你想到的这些实现方式 ...

  5. 使用supervisor设置应用开机自启

    安装supervisor: sudo apt install supervisor -y 创建配置文件: sudo vim /etc/supervisor/conf.d/frpc.conf frpc. ...

  6. IDEA 开发工具-插件{[转载]

    00 idea 开发工具使用技巧 01 idea插件推荐-- 02 IDEA插件 03 IDEA值得推荐的20款优秀的插件 04 IDEA插件精选」安利一个IDEA骚操作:一键生成方法的序列图

  7. Solution -「COCI 2016-2017」 Mag 结论证明

    结论:最多包含一个 \(2\),并且不在链的两端点. 证明:我们问题分成两个 \(\texttt{pass}\). \(\texttt{pass 1}\):\(\forall u,s.t.x_{u}\ ...

  8. 使用codeblocks创建新项目

    很多同学在学习C或C++版的数据结构的时候,自己写项目是一个不错的锻炼方法,而用codeblocks写项目的时候我们就会遇到很多问题了,比如说: 1.如何建立新项目. 2.如何建立头文件和主函数文件. ...

  9. redis学习之数据类型

    <?php //连接本地的 Redis 服务 $redis = new Redis(); $redis->connect('127.0.0.1', 6379); echo "Co ...

  10. GreatSQL特性介绍及前景展望 | 数据技术嘉年华2021分享PPT发布

    欢迎来到 GreatSQL社区分享的MySQL技术文章,如有疑问或想学习的内容,可以在下方评论区留言,看到后会进行解答 GreatSQL社区原创内容未经授权不得随意使用,转载请联系小编并注明来源. 全 ...