1. 前文回顾

  在字符串算法—数据压缩中,我们介绍了哈夫曼压缩算法(Huffman compression),本文将介绍LZW算法

  

2. LZW算法

  这个算法很简单,为了方便讲述,我们将采用16进制,写代码的时候在把它转回2进制就是了。

  在16进制下:A:41; B:42; C:43; D:44;......

  从例子入手:

  

  压缩表是边读数据边建立起来的,一开始,压缩表里的数据为各个字符对应的十六进制值,这里不一一列出,具体可百度26个字母的十六进制。

  首先从第一个数据开始读:

  第一个字符为A, A在压缩表里已存在,值是41;

  

  下一个字符为B,B在压缩表里已存在,值是42;

  前一个字符A与这个字符B结合成AB,给它一个值:81;(为什么是81?因为41~79都被字母用了)

  把AB加到压缩表里:

  

  下一个字符为R,R在压缩表里已存在,值是52;

  前一个字符B与这个字符R结合成BR,给它一个值:82,加到压缩表中:

  

  下一个字符为A,A在压缩表里已存在,值是41;

  前一个字符R与这个字符A结合成RA,给它一个值:83,加到压缩表中:

  如此类推,一直到D那里:

  

  下一个字符为A, A在压缩表里已存在,但下下一个字符为B,它们两组合而成的AB也在压缩表里,我们取含字符最多的AB:

  前一个字符D与这个字符串的首字符A结合成DA,给它一个值:87,加到压缩表中:

  

  下一个字符为R, R在压缩表里已存在,但下下一个字符为A,它们两组合而成的RA也在压缩表里,我们取含字符最多的RA;

  前一个字符串AB与这个字符串的首字符R结合成ABR,给它一个值:88,加到压缩表中:

  

  下一个字符为B, B在压缩表里已存在,但下下一个字符为R,它们两组合而成的BR也在压缩表里,我们取含字符最多的BR;

  前一个字符串RA与这个字符串的首字符B结合成RAB,给它一个值:89,加到压缩表中:

  

  下一个字符为A, A在压缩表里已存在,但下下一个字符为B,它们两组合而成的BR也在压缩表里; 但下下下一个字符为R,它们三组合而成的ABR也在压缩表里,我们取含字符最多的ABR;

  前一个字符串BR与这个字符串的首字符A结合成BRA,给它一个值:8A,加到压缩表中:

  

  下一个字符为A, A在压缩表里已存在,值为41;

  前一个字符串BRA与这个字符A结合成ABRA,给它一个值:8B,加到压缩表中:

  

  下一个字符为空,说明数据已经压缩完了,给个值80作为终止标记:

  

  压缩后的数据就是上述的值的组合,压缩表直接删除。

  压缩后的数据S:41425241434144818382884180。

  压缩的方法讲完了,那么如何解压呢?

  我们也是边解压边建表:

  现有压缩数据S:41425241434144818382884180。

  

  同样的,一开始,压缩表里的数据为各个字符对应的十六进制值,这里不一一列出,具体可百度26个字母的十六进制。

  首先从第一个数据开始读:

  第一个值为41,对应字符A:

  

  下一个数据为42,对应字符B;

  前一个字符A与这个字符B结合成AB,给它一个值:81,加到压缩表中:

  

  下一个数据为52,对应字符R;

  前一个字符B与这个字符R结合成BR,给它一个值:82,加到压缩表中:

  

  如此类推,一直读到81:

  

  下一个数据为81,对应字符串AB;

  前一个字符D与这个字符串的首字符A结合成DA,给它一个值:87,加到压缩表中:

  

  下一个数据为83,对应字符串RA;

  前一个字符串AB与这个字符串的首字符R结合成ABR,给它一个值:88,加到压缩表中:

  

  如此类推,一直读到80:

  

  下一个数据为80,这是压缩的终止值,说明解压完成了,此时,把压缩表丢掉。

  解压后得到原数据S:ABRACADABRABRABRA;

  由于我们的压缩表都是动态生成的,我们省了保存它的时间和空间。

  解压和压缩都介绍完了,这个算法也就结束了,超级简单!

  有时候解压时,会遇到些有趣的情形,如下图:

  原数据压缩:

  

  解压时:

  

  下一个数据为81,对应字符串AB;

  前一个字符B与这个字符串的首字符A结合成BA,给它一个值:82,加到压缩表中:

  

  下一个数据为83,嗯?83?83不在压缩表里啊,去哪找83?

  容我们冷静分析一波:

  首先,压缩表去到了82,下一个数据就是83。因为是83,所以肯定是个字符串。(81以上都是我们自己加的字符串!)

  假设83对应的字符串为X:

  

  前一个字符串AB与这个字符串的首字符X1(假设X是由X1X2X3...XN组成)结合成ABX1,给它一个值:83,加到压缩表中:

  

  即X=ABX1, X1是X的首字符(ABX1的首字符),即X1=A;

  故得知X=ABA:

  

  下一个数据是80,解压完成。解压后的原数据为ABABABA;

  至此,LZW算法介绍完毕。

实现代码:

  

超级简单的数据压缩算法—LZW算法的更多相关文章

  1. 数据压缩算法---LZ77算法 的分析与实现

    LZ77简介 Ziv和Lempel于1977年发表题为“顺序数据压缩的一个通用算法(A Universal Algorithm for Sequential Data Compression )”的论 ...

  2. 【Java/Android性能优 4】PreloadDataCache支持预取的数据缓存,使用简单,支持多种缓存算法,支持不同网络类型,扩展性强

    本文转自:http://www.trinea.cn/android/preloaddatacache/ 本文主要介绍一个支持自动向前或向后获取新数据的缓存的使用及功能.Android图片内存缓存可见I ...

  3. 【数据压缩】LZW算法原理与源代码解析

    转载请注明出处:http://blog.csdn.net/luoshixian099/article/details/50331883 <勿在浮沙筑高台> LZW压缩算法原理很easy,因 ...

  4. LZW算法PHP实现方法 lzw_decompress php

    LZW算法PHP实现方法 lzw_decompress php 博客分类: Php / Pear / Mysql / Node.js   LZW算法简介 字符串和编码的对应关系是在压缩过程中动态生成的 ...

  5. zw版_Halcon图像交换、数据格式、以及超级简单实用的DIY全内存计算.TXT

    zw版_Halcon图像交换.数据格式.以及超级简单实用的DIY全内存计算.TXT Halcon由于效率和其他原因,内部图像采用了很多自有格式,提高运行速度,但在数据交换方面非常麻烦. 特别是基于co ...

  6. phpexcelreader超级简单使用

    phpexcelreader超级简单使用 该php类可以到官网下载:http://www.codeplex.com/PHPExcel,下载的文件不能直接使用要看下面的备注. 备注: 1.要将olere ...

  7. 哈,又一款超级简单的队列(MQ)实现方案来了~

    开源的消息队列已经很多了,但大部分很重,实际环境下,很多可能只是使用到了一点功能而已,杀鸡使用牛刀,着实有些浪费了.很多时候,我们只想要一片绿叶,但它们给了我们整个的春天,很难消化.本着DIR精神, ...

  8. html超级简单实现点赞(收藏)和取消赞效果

    1.前言 我们经常会遇到对一些列表呀进行点赞呀收藏数据等效果呀.今天就用html+css实现超级简单易上手的点赞和取消赞的demo展示. 2.详情 1.css样式 .like{ font-size:6 ...

  9. 图像数据到网格数据-1——MarchingCubes算法

    原文:http://blog.csdn.net/u013339596/article/details/19167907 概述 之前的博文已经完整的介绍了三维图像数据和三角形网格数据.在实际应用中,利用 ...

随机推荐

  1. (转) Ensemble Methods for Deep Learning Neural Networks to Reduce Variance and Improve Performance

    Ensemble Methods for Deep Learning Neural Networks to Reduce Variance and Improve Performance 2018-1 ...

  2. java 静态变量初始化

    java 静态变量在编译阶段就已经明确位置, 所以静态变量的声明与初始化在编码顺序上可以颠倒.也就是说可以先编写初始化的代码,再编写声明代码.如: public class Test { // 静态变 ...

  3. php+mysql 解决emoji问题

    问题描述: php项目使用了emoji表情符号��报错 网上查询资料解决步骤: 1.升级MySQL至5.5或以上(以支持emoji) 2.更改数据库,数据表字符编码为utf8mb4 更改数据库连接方式 ...

  4. jQuery.ready() 函数详解

    jQuery.ready() 函数详解 ready()函数用于在当前文档结构载入完毕后立即执行指定的函数. 该函数的作用相当于window.onload事件. 你可以多次调用该函数,从而绑定多个函数, ...

  5. GoEasy的使用

    GoEasy介绍 http请求短连接,一次请求响应后关闭,而GoEasy建立了客户端与服务器之间的长连接. goeasy支持服务器到客户端的消息发布,客户端到客户端的消息发布 GoEasy用来做什么 ...

  6. 【C/C++】Rotate Array

    实现数组旋转(循环右移) 如数组 [1, 2, 3, 4, 5, 6, 7],右移 3 位则为 [5, 6, 7, 1, 2, 3, 4] 首先使用泛型函数 void Rotate(void *fro ...

  7. vue中提示toFixed不是函数

     vue中toFixed获取小数点后两位 错误提示:.toFixed is not a function解决办法:Number(_this.group_cash).toFixed(2) 转自:http ...

  8. HTTP rfc是什么及其工作过程

    概念: HTTP协议描述的是发送方与接收方的通信协议,通过两方的自觉遵守而存在,HTTP是运行于应用层的协议,基于TCP协议而运作.基本上是客户/服务器对答模式,其中也包括在传输过程中的代理,网关,通 ...

  9. 数据分析---SQL(Access数据库)

    1. SQL(Structure Quest Language) 一种结构化查询语言,它是一种通用的关系型数据库操作语言,用于存取数据,查询,更新和管理数据库. 2. 基本语句 Select, Cre ...

  10. Python—装饰器详解

    装饰器:(语法糖) 本质是函数,它是赋予函数新功能,但是不改变函数的源代码及调用方式   原则: 1.不能修改被装饰函数的源代码 2.不能修改被装饰函数的调用方式 3.函数的返回值也不变 这两点简而言 ...