C# 霍夫曼二叉树压缩算法实现

知道有的人比较懒,直接贴全部代码.

一开始一次性Code完了压缩部分代码.只调试了2,3次就成功了.

一次性写150行代码,没遇到什么bug的感觉还是蛮爽的.

写解压代码,才发现压缩代码有些细节问题.

对最后一个字符处理问题.

遇到比较折腾点:构建二叉树时,把原本应该是(叶结点的有值的)节点放在了左节点,正确应该放在右节点,导致生成的编码序列不满足(任意编码不是其他编码的前缀).导致解码失败.

使用方法:

var srcData = Encoding.UTF8.GetBytes(textBox1.Text);
            var cpsData = Compress(srcData);
            treeView1.ExpandAll();
           var depData = DeCompress(cpsData);
            var depStr = Encoding.UTF8.GetString(depData );

这个TreeView就是显示二叉树的,要添加控件,或者删除代码.

快速理解:
1.此压缩直接对字节流进行压缩.
2.压缩原理:字节流对每个直接使用率不平均,所以用变长的编码对256个字节重新编码,以较短的编码表示使用率高的字节,较长编码表示使用率低的字节.
所以总体来看,用新的编码表示的字节流要比原来的短.(除非字节流特别小,压缩效果就不好)
3.由于二叉树的性质,将使用率低的先加入树,使用率高的后加入作为使用率低的节点的父节点的兄弟节点(因为有值的节点必须是叶结点).从最底下向上构建
二叉树.

 using System;

 using System.Collections.Generic;

 using System.ComponentModel;

 using System.Data;

 using System.Drawing;

 using System.Linq;

 using System.Text;

 using System.Windows.Forms;

 using System.IO;

 namespace 霍夫曼二叉树压缩

 {

     public partial class Form1 : Form

     {

         public Form1()

         {

             InitializeComponent();

             var s=GetCode();

            var b= GetByteByCode(s);

         }

         private void button1_Click(object sender, EventArgs e)

         {

             var srcData = Encoding.UTF8.GetBytes(textBox1.Text);

             var cpsData = Compress(srcData);

             treeView1.ExpandAll();

            var depData = DeCompress(cpsData);

             var depStr = Encoding.UTF8.GetString(depData );

         }

         Dictionary<int, string> dicCode = new Dictionary<int, string>();

         byte[] Compress(byte[] data)

         {

             Dictionary<byte, int> everyCount = new Dictionary<byte, int>();

             foreach (var d in data)

             {

                 if(everyCount.ContainsKey(d)==false )

                     everyCount.Add(d,);

                 everyCount[d]++;

             }

             var orderAscCounts = everyCount.OrderBy(a=>a.Value);

             Queue<Count> queCouts = new Queue<Count>();

             orderAscCounts.ToList().ForEach(d => {

                 queCouts.Enqueue(new Count { key=d.Key, count=d.Value });

             });

             BuildTree(ref queCouts);

             foreach (var a in BNode.nodes)

             {

                 var code = new string(GetCode(a).Reverse().ToArray());

                 dicCode.Add(a.key,code);

             }

             BNode root = BNode.nodes[];

             while(root.parent!=null){

                 root = root.parent;

             }

             CreateTreeView(root,treeView1.Nodes);

             string curCode = "";

             List<byte> outData = new List<byte>();

             foreach (var d in data)

             {

                 curCode += dicCode[d];

                 if (curCode.Length >= )

                 {

                     byte curBit = GetByteByCode(curCode.Substring(,));

                     outData.Add(curBit);

                     curCode = curCode.Length >  ? curCode.Substring(, curCode.Length - ) : "";

                 }

             }

             if (curCode != "")

             {

                 curCode = curCode.PadRight(,'');

                 byte curBit = GetByteByCode(curCode);

                 outData.Add(curBit);

             }

             return outData.ToArray();

         }

         byte[] DeCompress(byte[] data)

         {

             string codes = "";

             for (int i = ; i < data.Length - ;i++ )

             {

                 codes += GetCode(data[i]);

             }

             codes += GetCode(data[data.Length-]).TrimEnd('');

             var bdata = GetCode(codes);

             return bdata;

         }

         byte GetByteByCode(string curCode)

         {

             return Convert.ToByte(curCode, );

         }

         byte[] GetCode(string code)

         {

             List<byte> datas = new List<byte>();

             int pos = ;

             var orderDicCode=dicCode.OrderByDescending(a=>a.Value.Length);

             do{

                 int p=-;

                 foreach (var vCode in orderDicCode)

                 {

                      p = code.IndexOf(vCode.Value);

                     if (p == )

                     {

                         datas.Add((byte)vCode.Key);

                         code = code.Substring(vCode.Value.Length , code.Length-vCode.Value.Length );

                         break;

                     }

                 }

                 if (p == -)

                 {

                     throw new Exception("解压出错:发现未能识别的编码,编码表或数据已被破坏!");

                 }

             }while(code.Length>);

            /* for (int i = 1; pos + i < code.Length ; i++)

             {

                 var firstCode = code.Substring(pos, i);

                 var secondCode = code.Substring(pos, i + 1);

                 var first = dicCode.Where(a => a.Value == firstCode);

                 var second = dicCode.Where(a => a.Value == secondCode);

                 if (first.Count() > 0 && second.Count() == 0 ){

                     datas.Add( (byte)first.First().Key);

                     pos = pos+i;

                     i = 1;

                 }

                 else if (pos + i == code.Length - 1 && second.Count() > 0)

                     datas.Add(  (byte)second.First().Key );

             }*/

             return datas.ToArray();

         }

         string GetCode(byte b )

         {

             return Convert.ToString(b, ).PadLeft(, '');//Convert.ToString(b, 2) ;//:

         }

         string GetCode(BNode a)

         {

             if (a.parent!=null)

                 return (a.isLeft ? "" : "")+GetCode(a.parent);

             return  "" ;

         }

         BNode BuildTree(ref Queue<Count> queCouts )

         {

             var first = queCouts.Dequeue();

             var second = queCouts.Dequeue();

             var lft =first.node==null? new BNode {  key=first.key, count=first.count  } : first.node;

             var rgt = second.node == null ? new BNode { key = second.key, count = second.count } : second.node;

             if (rgt.key == -)

             {

                 var temp = lft;

                 lft = rgt;

                 rgt = temp;

             }

             var pnode = new BNode

             {

                 key = -, count = first.count + second.count

             };

             lft.isLeft = true;

             rgt.isLeft = false;

             pnode.left = lft;

             pnode.right = rgt;

             lft.parent = pnode;

             rgt.parent = pnode;

             if (lft.key != -)

                 BNode.nodes.Add(lft);

             if (rgt.key != -)

                 BNode.nodes.Add(rgt);

             if (queCouts.Count > ){

                  queCouts.Enqueue(new Count { count=pnode.count, key=pnode.key, node=pnode });

                 var orderQue = queCouts.OrderBy(q => q.count).ToList();

                 queCouts.Clear();

                 foreach (var a in orderQue)

                     queCouts.Enqueue(a);

                 return BuildTree(ref queCouts);

             }

             else

                 return pnode;

         }

         void CreateTreeView(BNode node , TreeNodeCollection tnc)

         {

             if (node == null) return;

             var newNode = tnc.Add((node.isLeft ? "" : "") + (node.key!=-?"-"+node.key + ":" + node.count:""));

             CreateTreeView(node.left,newNode.Nodes);

             CreateTreeView(node.right, newNode.Nodes);

         }

         class Count

         {

            public int key;

            public int count;

            public BNode node;

         }

         class BNode{

             public int key;

             public int count;

             public BNode left;

             public BNode right;

             public BNode parent;

             public bool isLeft = false;

             public static List<BNode> nodes = new List< BNode>();

         }

     }

 }

C# 霍夫曼二叉树压缩算法实现的更多相关文章

赫夫曼\哈夫曼\霍夫曼编码 (Huffman Tree)
哈夫曼树给定n个权值作为n的叶子结点,构造一棵二叉树,若带权路径长度达到最小,称这样的二叉树为最优二叉树,也称为哈夫曼树(Huffman Tree).哈夫曼树是带权路径长度最短的树,权值较大的结点离 ...
word2vec 中的数学原理二预备知识霍夫曼树
主要参考: word2vec 中的数学原理详解自己动手写 word2vec 编码的话,根是不记录在编码中的这一篇主要讲的就是霍夫曼树(最优二叉树)和编码. ...
霍夫曼编码（Huffman Coding）
霍夫曼编码(Huffman Coding)是一种编码方法,霍夫曼编码是可变字长编码(VLC)的一种. 霍夫曼编码使用变长编码表对源符号(如文件中的一个字母)进行编码,其中变长编码表是通过一种评估来源符 ...
CF 463A && 463B 贪心 && 463C 霍夫曼树 && 463D 树形dp && 463E 线段树
http://codeforces.com/contest/462 A:Appleman and Easy Task 要求是否全部的字符都挨着偶数个'o' #include <cstdio> ...
word2vec中关于霍夫曼树的
再谈word2vec 标签: word2vec自然语言处理NLP深度学习语言模型 2014-05-28 17:17 16937人阅读评论(7) 收藏举报分类: Felven在职场(86) ...
Alink漫谈(十六) ：Word2Vec源码分析之建立霍夫曼树
Alink漫谈(十六) :Word2Vec源码分析之建立霍夫曼树目录 Alink漫谈(十六) :Word2Vec源码分析之建立霍夫曼树 0x00 摘要 0x01 背景概念 1.1 词向量基础 ...
Java数据结构（十二）—— 霍夫曼树及霍夫曼编码
霍夫曼树基本介绍和创建基本介绍又称哈夫曼树,赫夫曼树给定n个权值作为n个叶子节点,构造一棵二叉树,若该树的带权路径长度(wpl)达到最小,称为最优二叉树霍夫曼树是带权路径长度最短的树,权值较 ...
基于python的二元霍夫曼编码译码详细设计
一.设计题目对一幅BMP格式的灰度图像(个人证件照片)进行二元霍夫曼编码和译码二.算法设计 (1)二元霍夫曼编码: ①:图像灰度处理: 利用python的PIL自带的灰度图像转换函数,首先将彩色图 ...
采用霍夫曼编码(Huffman)画出字符串各字符编码的过程并求出各字符编码 --多媒体技术与应用
题目:有一个字符串:cabcedeacacdeddaaaba,问题: (1)采用霍夫曼编码画出编码的过程,并写出各字符的编码 (2)根据求得的编码,求得各编码需要的总位数 (3)求出整个字符串总编码长 ...

随机推荐

PHP 如何安全的使用 MySQL ？
大多数 PHP 程序员对 MySQL 肯定不陌生,至于各种 MySQL 函数的用法在开发手册和 w3school 这类网站上也有很多介绍.但是,你所用的写法真的安全吗?面对越来越猖獗的黑客攻击,SQL ...
在非UI线程中更改UI（Delphi使用隐藏窗口来处理，QT使用信号槽）
在Delphi里我记得是使用TThread.Synchronize(TThreadMethod),原理是利用了一个隐藏窗口来处理. 在QT Debug模式一下,碰到了同样的问题,显示错误: canno ...
Delphi中用Webbrowser加载百度地图滚轮失效（ApplicationEvents里使用IsChild提前判断是哪个控件的消息）
在Delphi中使用Webbrowser加载百度地图时,点击了其它界面,再回到百度地图中,即使点击了鼠标,再用滚轮也不能缩放地图,除非点地图里面的自带的控件,之后才能缩放,原因是因为其它窗体控件获得 ...
Spark、Shark集群安装部署及遇到的问题解决
1.部署环境 OS:Red Hat Enterprise Linux Server release 6.4 (Santiago) Hadoop:Hadoop 2.4.1 Hive:0.11.0 JDK ...
Oracle 搜集统计信息
常用的统计信息收集脚本: 非分区表: BEGIN DBMS_STATS.GATHER_TABLE_STATS(ownname => 'SCOTT', ...
小细节：Java中split()中的特殊分隔符小数点
这两天做项目过程中由于数据表字段设计的太恶心了,导致自己填坑关于微信支付和支付宝的支付有一个不同点:就是金额的处理,支付宝金额的单位是0.01元,但是微信支付中1表示0.01元,当时设计价格的时候使 ...
asp.net生成二维码的方法
asp.net生成二维码的方法 [复制链接] 这个要利用一个Dll文件. 如下 Gma.QrCodeNet.Encoding.dll (105.5 KB, 下载次数: 27) 当然大家也可以直 ...
QTP自动化测试权威指南连载（一）
第一章简介什么是自动化测试自动化测试是对一个已有的手工测试过程减少并尽可能排除人工干预的过程. 什么时候适合做自动化测试下面是一组适合将手工测试自动化的考量因素: ● 测试需要经常重复. ● ...
机器安装第二个tomcat ,出现报错如何解决
1.本机安装第二个 tomcat 后,出现报错如下图所示最后解决办法是在安装的时候 ,windows 服务名称和另一个tomcat 起不一样的名称就可以了如下图
scrollView的用法
- (void)viewDidLoad { [super viewDidLoad]; scrollView = [[UIScrollView alloc] initWith ...

C# 霍夫曼二叉树压缩算法实现

C# 霍夫曼二叉树压缩算法实现的更多相关文章

随机推荐

热门专题