详谈linux中压缩
1.压 缩 的 用 途 和 技 术
1.1 为什么需要压缩:
①你是否有过文件档案太大,导致无法以正常的email方式发送出去(很多email都有容量大约25MB每封信的限制啊!)?
②你是否有过要备份某些重要资料,偏偏这些资料量太大了,耗掉了你很多的磁盘空间呢?
。。。。。。
这个时候,那个好用的『档案压缩』技术可就派的上用场了!
1.2 压缩原理:
我们都知道1 byte = 8 bits ,而计算机是怎么来实现记忆存储文件数据?
假设一个byte可以看成右边模样 ----------> □□□□□□□□
由于 1 byte = 8 bits ,所以每个byte 当中会有 8 个空格,而每个空格可以是 0, 1 ,这里只做一个简单的介绍!
假设来记录“1”这个数字,考虑电脑所谓的二进位喔,如此一来, 1 会在最右边占据 1 个bit ,而其他的7 个bits 将会自动的被填上0 !仔细看看,其实在这样的例子中,那 7 个bits 应该是『空的』才对!不过,为了要满足目前我们的作业系统资料的存取,所以就会将该资料转为 byte 的型态来记录了!而一些聪明的电脑工程师就利用一些复杂的计算方式, 将这些没有使用到的空间『丢』出来,以让档案占用的空间变小!这就是压缩的技术!
简单的说,你可以将他想成,其实档案里面有相当多的『空间』存在,并不是完全填满的,而『压缩』的技术就是将这些『空间』填满,以让整个档案占用的容量下降!不过,这些『压缩过的档案』并无法直接被我们的作业系统所使用的,因此,若要使用这些被压缩过的档案资料,则必须将他『还原』回来未压缩前的模样,那就是所谓的『解压缩』!而至于压缩后与压缩的档案所占用的磁盘空间大小,就可以被称为是『压缩比』
2.Linux 系统常见的压缩指令
2.1指令介绍:
在Linux的环境中,压缩档案的副档名大多是:『*.tar, *.tar.gz, *.tgz, *.gz, *.Z, *.bz2, *.xz』
Linux上常见的压缩指令就是gzip, bzip2以及最新的xz 至于compress已经退流行了,为了支援windows常见的zip,其实Linux也早就有zip指令了
不过,这些指令通常仅能针对一个档案来压缩与解压缩,如此一来,每次压缩与解压缩都要一大堆档案,岂不烦人?此时,那个所谓的『打包软体, tar』就显的很重要!打包的作用就是将你指定的多个文件打包成一个文件的意思,并没有压缩的作用,这样之后就可以将包文件进行统一的压缩,就不用那么麻烦一个一个的文件压缩了。
2.2压缩指令
gzip指令参数说明:
选项与参数:
-c :将压缩的资料输出到萤幕上,可透过资料流重导向来处理;
-d :解压缩的参数;
-t :可以用来检验一个压缩档的一致性~看看档案有无错误;
-v :可以显示出原档案/压缩档案的压缩比等资讯;
-# :# 为数字的意思,代表压缩等级,-1 最快,但是压缩比最差、-9 最慢,但是压缩比最好!预设是-6 2.3 gzip指令 案 例:
2.3.1 找到/etc/目录中最大的文件 ls -lraS /etc/ | tail -n 10
2.3.2 并将services复制到/tmp中 cp /etc/services . 2.3.3 将/tmp中services进行压缩 gzip -v services 说明:压缩后得到services.gz文件 ,原始文件也就不存在了
2.3.4 对比压缩后与压缩前的文件 ll /etc/services /tmp/services*
2.3.5 由于services这个原本的档案是是文字档,因此我们可以尝试使用zcat/zmore/zless去读取! zmore services.gz
2.3.6 将/tmp中services.gz解压缩 gzip -dv services.gz 说明:解压缩后services.gz文件会被删除
2.3.7 将解开的services用最佳的压缩比压缩,并保留原本的档案 gzip -9 -cv services > services.gz
压缩等级说明: gzip 提供了1~9 的压缩等级,压缩强度依次递增
2.3.8 再次建立的services.gz中,找出http这个关键字在哪几行? zgrep -n 'http' services.gz
~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~
前言:
若说gzip 是为了取代compress 并提供更好的压缩比而成立的,那么bzip2 则是为了取代gzip 并提供更佳的压缩比而来的。bzip2 真是很不错用的东西~这玩意的压缩比竟然比gzip 还要好~至于bzip2 的用法几乎与gzip 相同!看看底下的用法吧!
2.4 bzip2案 例(bzip2, bzcat/bzmore/bzless/bzgrep)
2.4.1 bzip2指令参数选项说明
选项与参数:
-c :将压缩的过程产生的资料输出到萤幕上!
-d :解压缩的参数
-k :保留原始档案,而不会删除原始的档案喔!
-z :压缩的参数(预设值,可以不加)
-v :可以显示出原档案/压缩档案的压缩比等资讯;
-# :与gzip 同样的,都是在计算压缩比的参数, -9 最佳, -1 最快! 2.4.2 将刚刚gzip范例留下来的/tmp/services以bzip2压缩 bzip2 -v services
2.4.3 此时你会发现bzip2比gzip指令压缩强度要好 ls -l services*
2.4.4 读取范例/tmp/services.bz2 文件 bzcat services.bz2 2.4.5 将范例中/tmp/services.bz2文件解压缩 bzip2 -d services.bz2
2.4.6 解开的services用最佳的压缩比压缩,并保留原本的档案 bzip2 -9 -c services > services.bz2
说明:
看上面的范例,你会发现到bzip2 连选项与参数都跟gzip 一模一样!只是副档名由.gz 变成.bz2 而已!其他的用法都大同小异,所以就不一一介绍了!你也可以发现到bzip2 的压缩率确实比gzip 要好些!不过,对于大容量档案来说,bzip2 压缩时间会花比较久喔!至少比gzip 要久的多!这没办法~要有更多可用容量,就得要花费相对应的时间!还OK 啊!
~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~
前言:
虽然bzip2 已经具有很棒的压缩比,不过显然某些自由软体开发者还不满足,因此后来还推出了xz 这个压缩比更高的软体!这个软体的用法也跟gzip/bzip2 几乎一模一样!请看下面案例! 2.5 xz案例( xzcat/xzmore/xzless/xzgrep)
2.5.1 xz选项和说明
选项与参数:
-d :就是解压缩啊!
-t :测试压缩档的完整性,看有没有错误
-l :列出压缩档的相关资讯
-k :保留原本的档案不删除~
-c :同样的,就是将资料由萤幕上输出的意思!
-# :同样的,也有较佳的压缩比的意思!
2.5.2 将刚刚由bzip2所遗留下来的/tmp/services透过xz来压缩 xz -v services (压缩比例以下效果可见,容量又进一步下降的更多)
2.5.3 列出这个压缩档的资讯,然后读出这个压缩档的内容 xz -l services.xz
2.5.4 查看压缩后的压缩档内容 xzcat services.xz(指令都很相似,就不一一截图了)
2.5.5 解压缩 xz -d services.xz 2.5.6 保留原档案的档名,并且建立压缩档! xz -k services 压缩指令总结:
以下是一组时间数据:
『 time [gzip|bzip2|xz] -c services > services.[gz|bz2|xz] 』去执行运算结果,结果发现这三个指令的执行时间依序是: 0.019 s, 0.042s, 0.261s, 看最后一个数字!差了10 倍的时间
通过案例我们发现压缩比例越高时间就越久,虽然xz压缩强度比gizp要高很多,但是xz花的时间实在是太久了,所以如果你不觉得时间成本是你的考量那么使用xz会更好,如果时间是你的重要成本考量,恐怕gzip是比较适合的压缩软体! 如有疑问请说明!
详谈linux中压缩的更多相关文章
- linux中压缩与解压缩命令小结
linux中压缩与解压操作非常常见,其命令参数也非常的多,这里只介绍最经常用的带打包文件的几种压缩和解压方式和几个最常用的参数. 现在最常用的压缩和解压工具是gzip和bzip2,这两种工具不能相互解 ...
- linux 中压缩记得压缩用c,解压用x
tar -c: 建立压缩档案-x:解压-t:查看内容-r:向压缩归档文件末尾追加文件-u:更新原压缩包中的文件 这五个是独立的命令,压缩解压都要用到其中一个,可以和别的命令连用但只能用其中一个.下面的 ...
- linux中压缩、解压缩命令详解
tar -c: 建立压缩档案-x:解压-t:查看内容-r:向压缩归档文件末尾追加文件-u:更新原压缩包中的文件 这五个是独立的命令,压缩解压都要用到其中一个,可以和别的命令连用但只能用其中一个.下面的 ...
- linux中压缩与解压缩命令
.tar 解包:tar xvf FileName.tar 打包:tar cvf FileName.tar DirName (注:tar是打包,不是压缩!) ——————————————— .gz 解压 ...
- linux中压缩解压缩命令
目录 gzip gunzip tar(打包压缩) tar(解包解压) zip unzip bzip2 bunzip2 gzip 解释 命令名称:gzip 命令英文原意:GUN zip 命令所在路径:/ ...
- linux文件压缩与打包
在linux中常见的压缩命令 首先,在linux中压缩文件的扩展名大多是 *.gz gzip程序压缩的文件 *.bz2 bzip2程序压缩的文件 *.tar tar程序打包的数据,并没有压缩过 *.t ...
- linux中tar之解压和压缩常用
我们知道在windows中解压和压缩有两个非常强大的工具winRar和国产的好压工具,在linux中也有一款强大的解压和压缩工具.那就是大名鼎鼎的tar.我们首先看看tar命令的使用格式 语法:tar ...
- <实训|第十一天>学习一下linux中的进程,文件查找,文件压缩与IO重定向
[root@localhost~]#序言 在今后的工作中,运维工程师每天的例行事务就是使用free -m,top,uptime,df -h...每天都要检查一下服务器,看看是否出现异常.那么今天我们就 ...
- linux批量压缩当前目录中文件后,删除原文件
linux批量压缩当前目录中文件后,删除原文件 for i in `ls|awk -F " " '{print $NF}'`; do tar -zcvf $i.tar.gz $i ...
随机推荐
- mapdb的一些性能测试
jdk1.6,8g,64位,Intel Core i5-4210U CPU @ 1.70GHz 2.40GHz 使用memorydb 100个htreemap,每个htreemap对应50条线程操作, ...
- JUI/DWZ介绍、简单使用
简介 由于开发的项目使用JUI,所以学习了. DWZ富客户端框架(jQuery RIAframework), 是中国人自己开发的基于jQuery实现的Ajax RIA开源框架.(现在更名为JUI) 可 ...
- Android进阶(二十四)Android UI---界面开发推荐颜色
Android UI---界面开发推荐颜色 在Android开发过程中,总要给app添加一些背景,个人认为使用纯色调便可以达到优雅的视觉效果. 补充一些常用的颜色值:colors.xml < ...
- 【翻译】从Store生成Checkbox Group
原文:Ext JS: Generating a Checkbox Group from a Store Ext JS的checkbox group可以用来将复选框组合成一个单一的逻辑字段.由于复选框时 ...
- 基于Bootstrap的Metro风格模板
这几天在看Bootstrap的一些书,这里整理一下书中的一些模板,方便以后使用. 1.BootMetro http://www.guoxiaoming.com/bootmetro/ 2.Bootswa ...
- 发布一个参考tornado的高性能c++网络库:libtnet
libtnet是一个用c++编写的高性能网络库,它在设计上面主要参考tornado,为服务端网络编程提供简洁而高效的接口,非常易于使用. Echo Server void onConnEvent(co ...
- ISLR系列:(3)重采样方法 Cross-Validation & Bootstrap
Resampling Methods 此博文是 An Introduction to Statistical Learning with Applications in R 的系列读书笔记,作为本人的 ...
- (十五)UITableViewCell的常见属性
UItableViewCellStyle: typedef NS_ENUM(NSInteger, UITableViewCellStyle) { UITableViewCellStyleDefault ...
- APPCORE Routine APIs
Introduction to APPCORE Routine APIs This chapter provides you with specifications for calling many ...
- 断言(Assertion)需要注意的一个地方
因为断言只在debug构建中有效,所以它是中关重要的去避免运行任何代码或调用任何方法在断言条件中,而这些代码或方法会影响程序的状态. 否则程序的行为将在debug和release构建中变得不一致,这显 ...