测试方法

  1. 使用 python 的 Faker 第三方包伪造数据,写入文件 test.txt
  2. 复制 test.txt 内容为 test2.txt ,将 test2.txt 的内容重定向到 test.txt 中,使 test.txt 的文件大小达到几G
  3. 使用lzo lz4 zstd snappy四种方式对test.txt文件进行压缩,比较压缩时间和压缩率
    1. )压缩率 = 压缩后大小/压缩前大小

测试结果1

测试时间:20181106

由于机器环境限制,test.txt 的大小为3.7G,具体为 3918598144。

压缩方式 压缩时长 压缩后大小 压缩率
lzo 19s-21.8s 2067143270/2.0G 52.75%
lz4 17.2s 2060209418/2.0G 52.57%
zstd 49.4s 1227117514/1.2G 31.32%
snappy 17s 936100017/0.87G 52.7%

说明:

  1. snappy没有命令行测试方法,使用hadoop安装snappy进行测试时,目前无法安装。。。

  2. 使用java程序对snappy压缩方法进行测试

    1) 由于文件过大,jar包运行时即使设置了最大运行内存,也会出现OOM错误,snappy所测试的文件大小调整为1.7G,具体为 1776111485

    2)此程序使用的是snappy-java 的jar包

测试结果2

测试时间:20181107

由于第一次的测试文件大小较小,这次对100G的文件进行压缩测试。

​ 已请运维人员对dev02进行200G硬盘挂载。

增加压缩速度和解压的相关记录。

​ 压缩速度 = 压缩前大小 / (real - user - sys) 压缩时长

​ 数据损失率 = ( 压缩前大小 - 解压后大小 ) / 压缩前大小

​ 解压速度 = 解压后大小 / (real - user - sys) 解压时长

test.txt 的大小为 107G,具体为 114599669632

压缩方式 压缩时长 压缩后大小 压缩率 压缩速度
lzo real 26m6.676s
user 8m42.716s
sys 1m25.524s
60451038045/57G 52.75% 114.03 M/s
lz4 real 25m42.393s
user 7m16.460s
sys 1m23.592s
60249247392/57G 52.57% 106.90 M/s
zstd real 42m46.340s
user 23m37.792s
sys 1m11.096s
35886186839/34G 31.31% 101.43 M/s
解压方式 解压时长 解压后大小 数据损失率 解压速度
lzo real 25m10.172s
user 6m49.908s
sys 1m30.888s
114599669632 0% 102.2 M/s
lz4 real 28m54.584s
user 2m2.332s
sys 1m42.312s
114599669632 0% 72.39 M/s
zstd real 26m47.456s
user 5m16.156s
sys 1m31.908s
114599669632 0% 91.12 M/s

说明:

  1. 以上测试过程中对内存无任何影响,CPU使用率提升30%左右

测试结果3

测试时间:20181108

主要以以下新要求进行测试:

  1. 数据文件的生成过程有可能对压缩有影响

    1. )本次测试文件的内容不要出现一大块的重复数据
  2. 文件内每条数据内至少10个key
    1. )调整数据生成过程
  3. 调整计算公式
    1. )压缩速度 = 压缩前大小 / real 压缩时长
    2. )解压速度 = 解压后大小 / real 解压时长
  4. 没有CPU的具体监控数据
    1. )在表内增加CPU的具体监控数据,主要对某个CPU进行数据采集
    2. )记录方式为 xx%~xx%

说明:

  1. 文件大小为 2.1G,具体是 2175836454
  2. CPU基础值为22%~23%
  3. snappy使用程序进行监控,记录时长为程序内记录的时长
压缩方式 压缩时长 压缩后大小 压缩率 压缩速度 CPU使用率
lzo real 0m12.810s
user 0m9.544s
sys 0m2.316s
1147353171 / 1.1G 52.73% 162 M/s 占用4%~25%
lz4 real 0m14.205s
user 0m8.072s
sys 0m2.792s
1143524488 / 1.1G 52.56% 146.08 M/s 占用6%~20%
zstd real 0m41.900s
user 0m28.872s
sys 0m3.248s
681113354 / 650M 31.30% 49.52 M/s 占用11%~25%
snappy 18.712 s 1146400478 / 1.1G 52.7% 92.9 M/s 占用4%~22%
解压方式 解压时长 解压后大小 数据损失率 解压速度 CPU使用率
lzo real 0m25.260s
user 0m7.428s
sys 0m5.472s
2175836454 0% 82.147 M/s 占用3%~12%
lz4 real 0m6.931s
user 0m2.360s
sys 0m1.884s
2175836454 0% 299.4 M/s 占用6%~9%
zstd real 0m21.659s
user 0m6.080s
sys 0m2.808s
2175836454 0% 95.8 M/s 占用8%~13%
snappy 3.856s 2175836454 0% 538.05 M/s 占用6%~12%

Linux 压缩方式测试的更多相关文章

  1. Linux下几种常见压缩方式测试对比

    目录 Linux下几种常见压缩方式测试对比 参考 简介 测试 总结 Linux下几种常见压缩方式测试对比

  2. Linux —— 压缩文件

    Linux——压缩文件 为什么需要压缩文件?    文件在传输过程中,可能由于文件过大,传输所需时间过多.减少文件大小有两个明显的好处,一是可以减    少存储空间,二是通过网络传输文件时,可以减少传 ...

  3. Linux压缩那些事儿

    tar简介 Linux的压缩命令的源文件只能有一个,这意味在压缩之前不得不先将要压缩的所有文件打包成一个包,然后再压缩包,这样来完成对多个文件的压缩.所以在了解解压缩之前就必须先了解打包命令. Lin ...

  4. Kali Linux Web 渗透测试视频教程—第十四课-arp欺骗、嗅探、dns欺骗、session劫持

    Kali Linux Web 渗透测试视频教程—第十四课-arp欺骗.嗅探.dns欺骗.session劫持 文/玄魂 目录 Kali Linux Web 渗透测试—第十四课-arp欺骗.嗅探.dns欺 ...

  5. Kali Linux Web 渗透测试视频教程— 第十三课-密码破解

    Kali Linux Web 渗透测试— 第十三课-密码破解 文/玄魂 目录 Kali Linux Web 渗透测试— 第十三课-密码破解............................... ...

  6. Kali Linux Web 渗透测试视频教程—第十一课-扫描、sql注入、上传绕过

    Kali Linux Web 渗透测试视频教程—第十一课-扫描.sql注入.上传绕过 文/玄魂 原文链接:http://www.xuanhun521.com/Blog/2014/10/25/kali- ...

  7. linux 压缩文件的命令总结

    Linux压缩文件的读取 *.Z       compress 程序压缩的档案: *.bz2     bzip2 程序压缩的档案: *.gz      gzip 程序压缩的档案: *.tar     ...

  8. linux使用FIO测试磁盘的iops 【转载】

     linux使用FIO测试磁盘的iops 2013-09-23 10:59:21 分类: LINUX FIO是测试IOPS的非常好的工具,用来对硬件进行压力测试和验证,支持13种不同的I/O引擎,包括 ...

  9. linux压缩及vi操作

    一:Linux的压缩方式 1.tar cvf 对文件进行压缩,tar cvf+压缩文件完成的命名+需要压缩的文件 2,tar -tf +命名的压缩文件:表示查看目录里面的内容 3,tar -xf 解压 ...

随机推荐

  1. 打印指针要用%p而不要用%x

    注意: 打印指针要用%p而不要用%x 原因: https://boredzo.org/blog/archives/2007-01-23/please-do-not-use-percent-x-for- ...

  2. JS基础_数据类型-String类型

    <!DOCTYPE html> <html> <head> <meta charset="utf-8" /> <title&g ...

  3. O009、KVM 网络虚拟化基础

    参考https://www.cnblogs.com/CloudMan6/p/5289590.html   网络虚拟化是虚拟化技术中最复杂的部分,学习难度最大.   但因为网络是虚拟化中非常重要的资源, ...

  4. Java 获取日期间的日期 & 根据日期获取星期

    场景:根据起止日期获取中间的日期: 根据日期获取当前日期的星期 根据日期日期获取日期 /** * 获取日期间日期 * @param start * @param end * @return */ pr ...

  5. 外网访问VMware(Centos7.0,NAT模式)搭建的web服务器应用

    首先参考         https://www.cnblogs.com/studyhard-cq/p/11551755.html 设置好NAT模式,能访问公网. 1.打开VMware,点击左上角编辑 ...

  6. DockerScan:Docker安全分析&测试工具

    DockerScan:Docker安全分析&测试工具 今天给大家介绍的是一款名叫DockerScan的工具,我们可以用它来对Docker进行安全分析或者安全测试. 项目主页 http://gi ...

  7. 多线程与UI操作(一)

    C#中禁止跨线程直接访问控件,InvokeRequired是为了解决这个问题而产生的,当一个控件的InvokeRequired属性值为真时,说明有一个创建它以外的线程想访问它. 此时它将会在内部调用n ...

  8. (转) Linux安装启动FTP服务

    Linux安装启动FTP服务 Linux服务器默认是没有开启FTP服务的.也没有FTP服务器,为了文件的传输需要用到FTP服务器,以典型的vsftpd为例.vsftpd作为FTP服务器,在Linux系 ...

  9. Reservoir Computing: Harnessing a Universal Dynamical System

    原文连接:https://sinews.siam.org/Details-Page/reservoir-computing-harnessing-a-universal-dynamical-syste ...

  10. java序列化和反序列化及序列化方式

    平时我们在Java内存中的对象,是无 法进行IO操作或者网络通信的,因为在进行IO操作或者网络通信的时候,人家根本不知道内存中的对象是个什么东西,因此必须将对象以某种方式表示出来,即 存储对象中的状态 ...