原文地址:http://blog.csdn.net/luo6620378xu/article/details/8521223

近日需要在毕业设计中引入一个压缩库,要求压缩与解压缩速度快,但是压缩率可以不那么苛刻。查找资料发现Google的snappy库比较合适,而且该库开源,由C++写成。所以就拿来使用一下,下面权作记录。下面引出的任何涉及Google公司的源代码,版权归Google公司所有,我权作学习交流。文章安排如下,首先简要介绍Snappy,之后安装之,然后以实际例子介绍如何使用,接着bzip2和gzip做了性能比较,最后提出一些使用上面的疑问。

(一)简要介绍

去官网下载之http://code.google.com/p/snappy/。在Project Home处有这么一段英文,我想许多地方都引用和翻译了这段。我也尝试翻译一下。

Snappy is a compression/decompression library.

It does not aim for maximum compression,

or compatibility with any other compression library;

instead, it aims for veryhigh speeds and reasonable compression.

For instance, compared to the fastest mode of zlib,

Snappy is an order of magnitude faster for most inputs,

but the resulting compressed files are anywhere from 20% to 100% bigger.

On a single core of a Core i7 processor in 64-bit mode,

Snappy compresses at about 250 MB/sec or more and

decompresses at about 500 MB/sec or more.

Snappy is widely used inside Google, in everything from BigTable

and MapReduce to our internal RPC systems.

译文:Snappy是一个压缩/解压缩库。它不是以最大压缩率,或者与其他压缩库兼容为目标;它旨在获得高速的压缩和合理的压缩率。例如,Snappy对大多数的输入比zlib的最快模式要快几个数量级,但是其压缩过后的文件通常会比zlib大20%到100%。在Core i7的单核64位模式下,Snappy压缩速度大概可以达到250MB/s或者更快,解压缩可以达到大约500MB/s或更快。

Snappy在Google内部广泛使用,从BigTable,MapReduce到公司内部的RPC系统。

(二)安装过程

下面描述安装过程:

下载snappy-1.0.5.tar.gz,snappy的安装过程与传统的安装过程一样。解压后的INSTALL文件有详细的安装说明。

gunzip snappy-1.0.5.tar.gz

tar xf snappy-1.0.5.tar

cd snappy-1.0.5

./configure

make

make install

安装完成后,生成的动态库和静态库位于/usr/local/lib处,编程需要用到的头文件位于/usr/local/include处。注意需要将这些库文件cp至/usr/lib处,不然就算在链接的时候加上-L/usr/local/lib,在运行时也会报错。./main: error while loading shared libraries: libsnappy.so.1:

cannot open shared object file: No such file or directory

当然这是我的LD_LIBRARY_PATH环境变量的设置问题。

(三)使用snappy

解压出来的README文件介绍了一简单的使用方式。snappy是各种库标示符所在的命名空间。C++使用需要包含#include <snappy.h>头文件,C语言使用需要包含#include<snapyy-c.h>头文件。Snappy使用较为简单,我指的是跟bzip2的库比起来。所有的函数接口都暴露在上述两个头文件中,头文件中有详细的使用说明,并有简单的示例,而且英文通俗易懂。摘抄如下(Google公司版权所有):

snappy.h

  1. // Copyright 2005 and onwards Google Inc.
  2. //
  3. // Redistribution and use in source and binary forms, with or without
  4. // modification, are permitted provided that the following conditions are
  5. // met:
  6. //
  7. //     * Redistributions of source code must retain the above copyright
  8. // notice, this list of conditions and the following disclaimer.
  9. //     * Redistributions in binary form must reproduce the above
  10. // copyright notice, this list of conditions and the following disclaimer
  11. // in the documentation and/or other materials provided with the
  12. // distribution.
  13. //     * Neither the name of Google Inc. nor the names of its
  14. // contributors may be used to endorse or promote products derived from
  15. // this software without specific prior written permission.
  16. //
  17. // THIS SOFTWARE IS PROVIDED BY THE COPYRIGHT HOLDERS AND CONTRIBUTORS
  18. // "AS IS" AND ANY EXPRESS OR IMPLIED WARRANTIES, INCLUDING, BUT NOT
  19. // LIMITED TO, THE IMPLIED WARRANTIES OF MERCHANTABILITY AND FITNESS FOR
  20. // A PARTICULAR PURPOSE ARE DISCLAIMED. IN NO EVENT SHALL THE COPYRIGHT
  21. // OWNER OR CONTRIBUTORS BE LIABLE FOR ANY DIRECT, INDIRECT, INCIDENTAL,
  22. // SPECIAL, EXEMPLARY, OR CONSEQUENTIAL DAMAGES (INCLUDING, BUT NOT
  23. // LIMITED TO, PROCUREMENT OF SUBSTITUTE GOODS OR SERVICES; LOSS OF USE,
  24. // DATA, OR PROFITS; OR BUSINESS INTERRUPTION) HOWEVER CAUSED AND ON ANY
  25. // THEORY OF LIABILITY, WHETHER IN CONTRACT, STRICT LIABILITY, OR TORT
  26. // (INCLUDING NEGLIGENCE OR OTHERWISE) ARISING IN ANY WAY OUT OF THE USE
  27. // OF THIS SOFTWARE, EVEN IF ADVISED OF THE POSSIBILITY OF SUCH DAMAGE.
  28. //
  29. // A light-weight compression algorithm.  It is designed for speed of
  30. // compression and decompression, rather than for the utmost in space
  31. // savings.
  32. //
  33. // For getting better compression ratios when you are compressing data
  34. // with long repeated sequences or compressing data that is similar to
  35. // other data, while still compressing fast, you might look at first
  36. // using BMDiff and then compressing the output of BMDiff with
  37. // Snappy.
  38. #ifndef UTIL_SNAPPY_SNAPPY_H__
  39. #define UTIL_SNAPPY_SNAPPY_H__
  40. #include <stddef.h>
  41. #include <string>
  42. #include "snappy-stubs-public.h"
  43. namespace snappy {
  44. class Source;
  45. class Sink;
  46. // ------------------------------------------------------------------------
  47. // Generic compression/decompression routines.
  48. // ------------------------------------------------------------------------
  49. // Compress the bytes read from "*source" and append to "*sink". Return the
  50. // number of bytes written.
  51. size_t Compress(Source* source, Sink* sink);
  52. bool GetUncompressedLength(Source* source, uint32* result);
  53. // ------------------------------------------------------------------------
  54. // Higher-level string based routines (should be sufficient for most users)
  55. // ------------------------------------------------------------------------
  56. // Sets "*output" to the compressed version of "input[0,input_length-1]".
  57. // Original contents of *output are lost.
  58. //
  59. // REQUIRES: "input[]" is not an alias of "*output".
  60. size_t Compress(const char* input, size_t input_length, string* output);
  61. // Decompresses "compressed[0,compressed_length-1]" to "*uncompressed".
  62. // Original contents of "*uncompressed" are lost.
  63. //
  64. // REQUIRES: "compressed[]" is not an alias of "*uncompressed".
  65. //
  66. // returns false if the message is corrupted and could not be decompressed
  67. bool Uncompress(const char* compressed, size_t compressed_length,
  68. string* uncompressed);
  69. // ------------------------------------------------------------------------
  70. // Lower-level character array based routines.  May be useful for
  71. // efficiency reasons in certain circumstances.
  72. // ------------------------------------------------------------------------
  73. // REQUIRES: "compressed" must point to an area of memory that is at
  74. // least "MaxCompressedLength(input_length)" bytes in length.
  75. //
  76. // Takes the data stored in "input[0..input_length]" and stores
  77. // it in the array pointed to by "compressed".
  78. //
  79. // "*compressed_length" is set to the length of the compressed output.
  80. //
  81. // Example:
  82. //    char* output = new char[snappy::MaxCompressedLength(input_length)];
  83. //    size_t output_length;
  84. //    RawCompress(input, input_length, output, &output_length);
  85. //    ... Process(output, output_length) ...
  86. //    delete [] output;
  87. void RawCompress(const char* input,
  88. size_t input_length,
  89. char* compressed,
  90. size_t* compressed_length);
  91. // Given data in "compressed[0..compressed_length-1]" generated by
  92. // calling the Snappy::Compress routine, this routine
  93. // stores the uncompressed data to
  94. //    uncompressed[0..GetUncompressedLength(compressed)-1]
  95. // returns false if the message is corrupted and could not be decrypted
  96. bool RawUncompress(const char* compressed, size_t compressed_length,
  97. char* uncompressed);
  98. // Given data from the byte source 'compressed' generated by calling
  99. // the Snappy::Compress routine, this routine stores the uncompressed
  100. // data to
  101. //    uncompressed[0..GetUncompressedLength(compressed,compressed_length)-1]
  102. // returns false if the message is corrupted and could not be decrypted
  103. bool RawUncompress(Source* compressed, char* uncompressed);
  104. // Returns the maximal size of the compressed representation of
  105. // input data that is "source_bytes" bytes in length;
  106. size_t MaxCompressedLength(size_t source_bytes);
  107. // REQUIRES: "compressed[]" was produced by RawCompress() or Compress()
  108. // Returns true and stores the length of the uncompressed data in
  109. // *result normally.  Returns false on parsing error.
  110. // This operation takes O(1) time.
  111. bool GetUncompressedLength(const char* compressed, size_t compressed_length,
  112. size_t* result);
  113. // Returns true iff the contents of "compressed[]" can be uncompressed
  114. // successfully.  Does not return the uncompressed data.  Takes
  115. // time proportional to compressed_length, but is usually at least
  116. // a factor of four faster than actual decompression.
  117. bool IsValidCompressedBuffer(const char* compressed,
  118. size_t compressed_length);
  119. // *** DO NOT CHANGE THE VALUE OF kBlockSize ***
  120. //
  121. // New Compression code chops up the input into blocks of at most
  122. // the following size.  This ensures that back-references in the
  123. // output never cross kBlockSize block boundaries.  This can be
  124. // helpful in implementing blocked decompression.  However the
  125. // decompression code should not rely on this guarantee since older
  126. // compression code may not obey it.
  127. static const int kBlockLog = 15;
  128. static const size_t kBlockSize = 1 << kBlockLog;
  129. static const int kMaxHashTableBits = 14;
  130. static const size_t kMaxHashTableSize = 1 << kMaxHashTableBits;
  131. }  // end namespace snappy
  132. #endif  // UTIL_SNAPPY_SNAPPY_H__

snapp-c.h

  1. /*
  2. * Copyright 2011 Martin Gieseking <martin.gieseking@uos.de>.
  3. *
  4. * Redistribution and use in source and binary forms, with or without
  5. * modification, are permitted provided that the following conditions are
  6. * met:
  7. *
  8. *     * Redistributions of source code must retain the above copyright
  9. * notice, this list of conditions and the following disclaimer.
  10. *     * Redistributions in binary form must reproduce the above
  11. * copyright notice, this list of conditions and the following disclaimer
  12. * in the documentation and/or other materials provided with the
  13. * distribution.
  14. *     * Neither the name of Google Inc. nor the names of its
  15. * contributors may be used to endorse or promote products derived from
  16. * this software without specific prior written permission.
  17. *
  18. * THIS SOFTWARE IS PROVIDED BY THE COPYRIGHT HOLDERS AND CONTRIBUTORS
  19. * "AS IS" AND ANY EXPRESS OR IMPLIED WARRANTIES, INCLUDING, BUT NOT
  20. * LIMITED TO, THE IMPLIED WARRANTIES OF MERCHANTABILITY AND FITNESS FOR
  21. * A PARTICULAR PURPOSE ARE DISCLAIMED. IN NO EVENT SHALL THE COPYRIGHT
  22. * OWNER OR CONTRIBUTORS BE LIABLE FOR ANY DIRECT, INDIRECT, INCIDENTAL,
  23. * SPECIAL, EXEMPLARY, OR CONSEQUENTIAL DAMAGES (INCLUDING, BUT NOT
  24. * LIMITED TO, PROCUREMENT OF SUBSTITUTE GOODS OR SERVICES; LOSS OF USE,
  25. * DATA, OR PROFITS; OR BUSINESS INTERRUPTION) HOWEVER CAUSED AND ON ANY
  26. * THEORY OF LIABILITY, WHETHER IN CONTRACT, STRICT LIABILITY, OR TORT
  27. * (INCLUDING NEGLIGENCE OR OTHERWISE) ARISING IN ANY WAY OUT OF THE USE
  28. * OF THIS SOFTWARE, EVEN IF ADVISED OF THE POSSIBILITY OF SUCH DAMAGE.
  29. *
  30. * Plain C interface (a wrapper around the C++ implementation).
  31. */
  32. #ifndef UTIL_SNAPPY_OPENSOURCE_SNAPPY_C_H_
  33. #define UTIL_SNAPPY_OPENSOURCE_SNAPPY_C_H_
  34. #ifdef __cplusplus
  35. extern "C" {
  36. #endif
  37. #include <stddef.h>
  38. /*
  39. * Return values; see the documentation for each function to know
  40. * what each can return.
  41. */
  42. typedef enum {
  43. SNAPPY_OK = 0,
  44. SNAPPY_INVALID_INPUT = 1,
  45. SNAPPY_BUFFER_TOO_SMALL = 2,
  46. } snappy_status;
  47. /*
  48. * Takes the data stored in "input[0..input_length-1]" and stores
  49. * it in the array pointed to by "compressed".
  50. *
  51. * <compressed_length> signals the space available in "compressed".
  52. * If it is not at least equal to "snappy_max_compressed_length(input_length)",
  53. * SNAPPY_BUFFER_TOO_SMALL is returned. After successful compression,
  54. * <compressed_length> contains the true length of the compressed output,
  55. * and SNAPPY_OK is returned.
  56. *
  57. * Example:
  58. *   size_t output_length = snappy_max_compressed_length(input_length);
  59. *   char* output = (char*)malloc(output_length);
  60. *   if (snappy_compress(input, input_length, output, &output_length)
  61. *       == SNAPPY_OK) {
  62. *     ... Process(output, output_length) ...
  63. *   }
  64. *   free(output);
  65. */
  66. snappy_status snappy_compress(const char* input,
  67. size_t input_length,
  68. char* compressed,
  69. size_t* compressed_length);
  70. /*
  71. * Given data in "compressed[0..compressed_length-1]" generated by
  72. * calling the snappy_compress routine, this routine stores
  73. * the uncompressed data to
  74. *   uncompressed[0..uncompressed_length-1].
  75. * Returns failure (a value not equal to SNAPPY_OK) if the message
  76. * is corrupted and could not be decrypted.
  77. *
  78. * <uncompressed_length> signals the space available in "uncompressed".
  79. * If it is not at least equal to the value returned by
  80. * snappy_uncompressed_length for this stream, SNAPPY_BUFFER_TOO_SMALL
  81. * is returned. After successful decompression, <uncompressed_length>
  82. * contains the true length of the decompressed output.
  83. *
  84. * Example:
  85. *   size_t output_length;
  86. *   if (snappy_uncompressed_length(input, input_length, &output_length)
  87. *       != SNAPPY_OK) {
  88. *     ... fail ...
  89. *   }
  90. *   char* output = (char*)malloc(output_length);
  91. *   if (snappy_uncompress(input, input_length, output, &output_length)
  92. *       == SNAPPY_OK) {
  93. *     ... Process(output, output_length) ...
  94. *   }
  95. *   free(output);
  96. */
  97. snappy_status snappy_uncompress(const char* compressed,
  98. size_t compressed_length,
  99. char* uncompressed,
  100. size_t* uncompressed_length);
  101. /*
  102. * Returns the maximal size of the compressed representation of
  103. * input data that is "source_length" bytes in length.
  104. */
  105. size_t snappy_max_compressed_length(size_t source_length);
  106. /*
  107. * REQUIRES: "compressed[]" was produced by snappy_compress()
  108. * Returns SNAPPY_OK and stores the length of the uncompressed data in
  109. * *result normally. Returns SNAPPY_INVALID_INPUT on parsing error.
  110. * This operation takes O(1) time.
  111. */
  112. snappy_status snappy_uncompressed_length(const char* compressed,
  113. size_t compressed_length,
  114. size_t* result);
  115. /*
  116. * Check if the contents of "compressed[]" can be uncompressed successfully.
  117. * Does not return the uncompressed data; if so, returns SNAPPY_OK,
  118. * or if not, returns SNAPPY_INVALID_INPUT.
  119. * Takes time proportional to compressed_length, but is usually at least a
  120. * factor of four faster than actual decompression.
  121. */
  122. snappy_status snappy_validate_compressed_buffer(const char* compressed,
  123. size_t compressed_length);
  124. #ifdef __cplusplus
  125. }  // extern "C"
  126. #endif
  127. #endif  /* UTIL_SNAPPY_OPENSOURCE_SNAPPY_C_H_ */

[转]Snappy压缩库安装和使用之一的更多相关文章

  1. 【神经网络与深度学习】Google Snappy - 一个高速压缩库

    Snappy已经被Google开源,作为一个压缩库,它可以利用单颗Intel Corei7处理器内核处理至少每秒250MB~500MB的数据流. Snappy的前身是Zippy.虽然只是一个数据压缩库 ...

  2. HBase 安装snappy压缩软件以及相关编码配置

    HBase 安装snappy压缩软件以及相关编码配置 前言 ​ 在使用HBase过程中因为数据存储冗余.备份数等相关问题占用过多的磁盘空间,以及在入库过程中为了增加吞吐量所以会采用相关的压缩算法来压缩 ...

  3. SEAL库 - 安装和介绍

    本篇文章介绍:SEAL同态库的安装和简单使用 注:使用Clang++编译的Microsoft Seal比使用GNUG++编译的Microsoft Seal具有更好的运行时性能. 1. cmake:适应 ...

  4. protocol buffer c++ python库安装

    c++库安装较简单,不要用源码,还得下载依赖,就被墙了 https://github.com/google/protobuf/releases  下载一个最新的release安装 #protoc -- ...

  5. phpize 扩展GD库 安装 ! 环境--centos 7 +nginx 1.7.11+php 5.6.7

    使用phpize编译GD库安装,先安装前置库libjpeg libpng zlib  freetype等 都是下面php编译的几个选项 先看php编译的选项: --with-gd=DIR       ...

  6. DCMTK3.6.1(MD支持库)安装说明

    转载:http://qimo601.iteye.com/blog/1685135 [前言] 最近,因为需要开发DICOM网管模块,必须使用DCMTK的DcmNet模块.但是DCMTK3.6.0在Dcm ...

  7. Snappy压缩

    Snappy压缩时,碰到不能解压问题,所用服务器Tomcat8.经验证,降低Tomcat版本为7,才可正常解压文件. 若碰到偶尔不能解压的问题,试着换个浏览器试试.

  8. laravel项目拉取下来安装,node.js库安装

    1.拉取项目 2.切换分支 圈圈里面是版本 composer 安装laravel组件其他库 安装node.js安装包  npm set registry=https://registry.npm.ta ...

  9. python 库安装笔记

    python 库安装笔记 zoerywzhou@163.com http://www.cnblogs.com/swje/ 作者:Zhouwan 2017-2-22 友情提示 安装python库的过程中 ...

随机推荐

  1. vs2013单元测试练习过程

    1.打开VS2013 --> 新建一个项目.这里我们默认创建一个控制台项目.取名为UnitTestDemo 2.在解决方案里面新增一个单元测试项目.取名为UnitTestDemoTest 创建完 ...

  2. 最全面的 C++ 资源、框架大全

    转载自   http://www.codeceo.com/article/cpp-resource-framework.html#0-tsina-1-99850-397232819ff9a47a7b7 ...

  3. NSQ的消息订阅发布测试

    在测试NSQ的Quick Start发现这样一个问题,就是同时只能有一个订阅实例 $ nsq_to_file --topic=test --output- 当存在两个实例时则消息会被发送给其中的一个实 ...

  4. TJI读书笔记16-异常处理

    TJI读书笔记16-异常处理 概念 基本异常情形 异常的捕获 自定义异常 异常说明 捕获所有异常 栈轨迹 重新抛出异常 Java标准异常 使用finally 异常的限制 构造器 异常的匹配 其他乱七八 ...

  5. 【Shell脚本】怎样表示一个for循环

    [Shell脚本]怎样表示一个for循环 在此说一下我常用的两个结构: 1. for i in $(seq 1 100); do         echo $i done 2. for (( i = ...

  6. window7下karma 报 nodejs request TypeError: The header content contains invalid characters BUG

    这个BUG 估计只有中国人才 遇到 打开你的依赖node_modules\karma\node_modules\connect\lib\patch.js 将里面的setHeader方法改成下面这样,干 ...

  7. SQL Server 表变量和临时表的区别

    SQL Server 表变量和临时表的区别 一.表变量 表变量在SQL Server 2000中首次被引入.表变量的具体定义包括列定义,列名,数据类型和约束.而在表变量中可以使用的约束包括主键约束,唯 ...

  8. VC++ 两种动态调整控件位置的方法(CButton设置为Radio形式会出现错误)

    ((CButton*)GetDlgItem(IDC_CHECK1))->MoveWindow(, cy - , , ); ((CButton*)GetDlgItem(IDC_CHECK2))-& ...

  9. datetimepicker一个不错的日历android特效

    datetimepicker一个不错的日历效,选中和选择日历效果都很不错, 实用的时候直接可以把datetimepicker-library这个引入到项目,调用的地方在实现 TimePickerDia ...

  10. win8下始终以管理员身份运行vs2012的解决办法

    因为我的windows8不是专业版的,不能通过网上方法修改组策略,所以尝试了下面的方法: 1. 在vs2012快捷方式上,右键选择兼容性疑难解答: 2. 等待检测完,选择故障排除选项页面,选“疑难解答 ...