C++哈夫曼树编码和译码的实现
一.背景介绍:
给定n个权值作为n个叶子结点,构造一棵二叉树,若带权路径长度达到最小,称这样的二叉树为最优二叉树,也称为哈夫曼树(Huffman Tree)。哈夫曼树是带权路径长度最短的树,权值较大的结点离根较近。
二.实现步骤:
1.构造一棵哈夫曼树
2.根据创建好的哈夫曼树创建一张哈夫曼编码表
3.输入一串哈夫曼序列,输出原始字符
三.设计思想:
1.首先要构造一棵哈夫曼树,哈夫曼树的结点结构包括权值,双亲,左右孩子;假如由n个字符来构造一棵哈夫曼树,则共有结点2n-1个;在构造前,先初始化,初始化操作是把双亲,左右孩子的下标值都赋为0;然后依次输入每个结点的权值
2.第二步是通过n-1次循环,每次先找输入的权值中最小的两个结点,把这两个结点的权值相加赋给一个新结点,,并且这个新结点的左孩子是权值最小的结点,右孩子是权值第二小的结点;鉴于上述找到的结点都是双亲为0的结点,为了下次能正确寻找到剩下结点中权值最小的两个结点,每次循环要把找的权值最小的两个结点的双亲赋值不为0(i).就这样通过n-1循环下、操作,创建了一棵哈夫曼树,其中,前n个结点是叶子(输入的字符结点)后n-1个是度为2的结点
3.编码的思想是逆序编码,从叶子结点出发,向上回溯,如果该结点是回溯到上一个结点的左孩子,则在记录编码的数组里存“0”,否则存“1”,注意是倒着存;直到遇到根结点(结点双亲为0),每一次循环编码到根结点,把编码存在编码表中,然后开始编码下一个字符(叶子)
4.译码的思想是循环读入一串哈夫曼序列,读到“0”从根结点的左孩子继续读,读到“1”从右孩子继续,如果读到一个结点的左孩子和右孩子是否都为0,如果是说明已经读到了一个叶子(字符),翻译一个字符成功,把该叶子结点代表的字符存在一个存储翻译字符的数组中,然后继续从根结点开始读,直到读完这串哈夫曼序列,遇到结束符便退出翻译循环
四.源代码:
- /***************************************
- 目的:1.根据输入的字符代码集及其权值集,
- 构造赫夫曼树,输出各字符的赫夫曼编码
- 2.输入赫夫曼码序列,输出原始字符代码
- 作者:Dmego 时间:2016-11-11
- ****************************************/
- #include<iostream>
- #define MAX_MA 1000
- #define MAX_ZF 100
- using namespace std;
- //哈夫曼树的储存表示
- typedef struct
- {
- int weight; //结点的权值
- int parent, lchild, rchild;//双亲,左孩子,右孩子的下标
- }HTNode,*HuffmanTree; //动态分配数组来储存哈夫曼树的结点
- //哈夫曼编码表的储存表示
- typedef char **HuffmanCode;//动态分配数组存储哈夫曼编码
- //返回两个双亲域为0且权值最小的点的下标
- void Select(HuffmanTree HT, int n, int &s1, int &s2)
- {
- /*n代表HT数组的长度
- */
- //前两个for循环找所有结点中权值最小的点(字符)
- for (int i = ; i <= n; i++)
- {//利用for循环找出一个双亲为0的结点
- if (HT[i].parent == )
- {
- s1 = i;//s1初始化为i
- break;//找到一个后立即退出循环
- }
- }
- for (int i = ; i <= n; i++)
- {/*利用for循环找到所有结点(字符)权值最小的一个
- 并且保证该结点的双亲为0*/
- if (HT[i].weight < HT[s1].weight && HT[i].parent == )
- s1 = i;
- }
- //后两个for循环所有结点中权值第二小的点(字符)
- for (int i = ; i <= n; i++)
- {//利用for循环找出一个双亲为0的结点,并且不能是s1
- if (HT[i].parent == && i != s1)
- {
- s2 = i;//s2初始化为i
- break;//找到一个后立即退出循环
- }
- }
- for (int i = ; i <= n; i++)
- {/*利用for循环找到所有结点(字符)权值第二小的一个,
- 该结点满足不能是s1且双亲是0*/
- if (HT[i].weight < HT[s2].weight && HT[i].parent == && i!= s1)
- s2 = i;
- }
- }
- //构造哈夫曼树
- void CreateHuffmanTree(HuffmanTree &HT, int n)
- {
- /*-----------初始化工作-------------------------*/
- if (n <= )
- return;
- int m = * n - ;
- HT = new HTNode[m + ];
- for (int i = ; i <= m; ++i)
- {//将1~m号单元中的双亲,左孩子,右孩子的下标都初始化为0
- HT[i].parent = ; HT[i].lchild = ; HT[i].rchild = ;
- }
- for (int i = ; i <= n; ++i)
- {
- cin >> HT[i].weight;//输入前n个单元中叶子结点的权值
- }
- /*-----------创建工作---------------------------*/
- int s1,s2;
- for (int i = n + ; i <= m; ++i)
- {//通过n-1次的选择,删除,合并来构造哈夫曼树
- Select(HT, i - , s1, s2);
- /*cout << HT[s1].weight << " , " << HT[s2].weight << endl;*/
- /*将s1,s2的双亲域由0改为i
- (相当于把这两个结点删除了,这两个结点不再参与Select()函数)*/
- HT[s1].parent = i;
- HT[s2].parent = i;
- //s1,与s2分别作为i的左右孩子
- HT[i].lchild = s1;
- HT[i].rchild = s2;
- //结点i的权值为s1,s2权值之和
- HT[i].weight = HT[s1].weight + HT[s2].weight;
- }
- }
- //从叶子到根逆向求每个字符的哈夫曼编码,储存在编码表HC中
- void CreatHuffmanCode(HuffmanTree HT, HuffmanCode &HC, int n)
- {
- HC = new char*[n + ];//分配储存n个字符编码的编码表空间
- char *cd = new char[n];//分配临时存储字符编码的动态空间
- cd[n - ] = '\0';//编码结束符
- for (int i = ; i <= n; i++)//逐个求字符编码
- {
- int start = n - ;//start 开始指向最后,即编码结束符位置
- int c = i;
- int f = HT[c].parent;//f指向结点c的双亲
- while (f != )//从叶子结点开始回溯,直到根结点
- {
- --start;//回溯一次,start向前指向一个位置
- if (HT[f].lchild == c) cd[start] = '';//结点c是f的左孩子,则cd[start] = 0;
- else cd[start] = '';//否则c是f的右孩子,cd[start] = 1
- c = f;
- f = HT[f].parent;//继续向上回溯
- }
- HC[i] = new char[n - start];//为第i个字符编码分配空间
- strcpy(HC[i], &cd[start]);//把求得编码的首地址从cd[start]复制到HC的当前行中
- }
- delete cd;
- }
- //哈夫曼译码
- void TranCode(HuffmanTree HT,char a[],char zf[],char b[],int n)
- {
- /*
- HT是已经创建好的哈夫曼树
- a[]用来传入二进制编码
- b[]用来记录译出的字符
- zf[]是与哈夫曼树的叶子对应的字符(叶子下标与字符下标对应)
- n是字符个数,相当于zf[]数组得长度
- */
- int q = *n-;//q初始化为根结点的下标
- int k = ;//记录存储译出字符数组的下标
- int i = ;
- for (i = ; a[i] != '\0';i++)
- {//for循环结束条件是读入的字符是结束符(二进制编码)
- //此代码块用来判断读入的二进制字符是0还是1
- if (a[i] == '')
- {/*读入0,把根结点(HT[q])的左孩子的下标值赋给q
- 下次循环的时候把HT[q]的左孩子作为新的根结点*/
- q = HT[q].lchild;
- }
- else if (a[i] == '')
- {
- q = HT[q].rchild;
- }
- //此代码块用来判断HT[q]是否为叶子结点
- if (HT[q].lchild == && HT[q].rchild == )
- {/*是叶子结点,说明已经译出一个字符
- 该字符的下标就是找到的叶子结点的下标*/
- b[k++] = zf[q];//把下标为q的字符赋给字符数组b[]
- q = * n - ;//初始化q为根结点的下标
- //继续译下一个字符的时候从哈夫曼树的根结点开始
- }
- }
- /*译码完成之后,用来记录译出字符的数组由于没有结束符输出的
- 时候回报错,故紧接着把一个结束符加到数组最后*/
- b[k] = '\0';
- }
- //菜单函数
- void menu()
- {
- cout << endl;
- cout << " ┏〓〓〓〓〓〓〓〓〓〓〓〓〓〓〓〓〓〓〓〓〓〓〓〓〓〓〓〓〓┓" << endl;
- cout << " ┃ ★★★★★★★哈夫曼编码与译码★★★★★★★ ┃" << endl;
- cout << " ┃ 1. 创建哈夫曼树 ┃" << endl;
- cout << " ┃ 2. 进行哈夫曼编码 ┃" << endl;
- cout << " ┃ 3. 进行哈夫曼译码 ┃" << endl;
- cout << " ┃ 4. 退出程序 ┃" << endl;
- cout << " ┗〓〓〓〓〓〓〓〓〓〓〓〓〓〓〓〓〓〓〓〓〓〓〓〓〓〓〓〓〓┛" << endl;
- cout << " <><注意:空格字符用'- '代替><>" << endl;
- cout << endl;
- }
- void main()
- {
- int falg;//记录要编码的字符个数
- char a[MAX_MA];//储存输入的二进制字符
- char b[MAX_ZF];//存储译出的字符
- char zf[MAX_ZF];//储存要编码的字符
- HuffmanTree HT = NULL;//初始化树为空数
- HuffmanCode HC = NULL;//初始化编码表为空表
- menu();
- while (true)
- {
- int num;
- cout << "<><请选择功能(1-创建 2-编码 3-译码 4-退出)><>: ";
- cin >> num;
- switch (num)
- {
- case :
- cout << "<><请输入字符个数><>:";
- cin >> falg;
- //动态申请falg个长度的字符数组,用来存储要编码的字符
- /*char *zf = new char[falg];*/
- cout << "<><请依次输入" << falg << "个字符:><>: ";
- for (int i = ; i <= falg; i++)
- cin >> zf[i];
- cout << "<><请依次输入" << falg << "个字符的权值><>: ";
- CreateHuffmanTree(HT, falg);//调用创建哈夫曼树的函数
- cout << endl;
- cout << "<><创建哈夫曼成功!,下面是该哈夫曼树的参数输出><>:" << endl;
- cout << endl;
- cout << "结点i"<<"\t"<<"字符" << "\t" << "权值" << "\t" << "双亲" << "\t" << "左孩子" << "\t" << "右孩子" << endl;
- for (int i = ; i <= falg * - ; i++)
- {
- cout << i << "\t"<<zf[i]<< "\t" << HT[i].weight << "\t" << HT[i].parent << "\t" << HT[i].lchild << "\t" << HT[i].rchild << endl;
- }
- cout << endl;
- break;
- case :
- CreatHuffmanCode(HT, HC, falg);//调用创建哈夫曼编码表的函数
- cout << endl;
- cout << "<><生成哈夫曼编码表成功!,下面是该编码表的输出><>:" << endl;
- cout << endl;
- cout << "结点i"<<"\t"<<"字符" << "\t" << "权值" << "\t" << "编码" << endl;
- for (int i = ; i <= falg; i++)
- {
- cout << i << "\t"<<zf[i]<< "\t" << HT[i].weight << "\t" << HC[i] << endl;
- }
- cout << endl;
- break;
- case :
- cout << "<><请输入想要翻译的一串二进制编码><>:";
- /*这样可以动态的直接输入一串二进制编码,
- 因为这样输入时最后系统会自动加一个结束符*/
- cin >> a;
- TranCode(HT, a, zf, b, falg);//调用译码的函数,
- /*这样可以直接把数组b输出,因为最后有
- 在数组b添加输出时遇到结束符会结束输出*/
- cout << endl;
- cout << "<><译码成功!翻译结果为><>:" << b << endl;
- cout << endl;
- break;
- case :
- cout << endl;
- cout << "<><退出成功!><>" << endl;
- exit();
- default:
- break;
- }
- }
- //-abcdefghijklmnopqrstuvwxyz
- //186 64 13 22 32 103 21 15 47 57 1 5 32 20 57 63 15 1 48 51 80 23 8 18 1 16 1
- //
- }
哈夫曼编码译码
五.运行截图:
C++哈夫曼树编码和译码的实现的更多相关文章
- puk1521 赫夫曼树编码
Description An entropy encoder is a data encoding method that achieves lossless data compression by ...
- java实现哈弗曼树和哈夫曼树压缩
本篇博文将介绍什么是哈夫曼树,并且如何在java语言中构建一棵哈夫曼树,怎么利用哈夫曼树实现对文件的压缩和解压.首先,先来了解下什么哈夫曼树. 一.哈夫曼树 哈夫曼树属于二叉树,即树的结点最多拥有2个 ...
- 数据结构之C语言实现哈夫曼树
1.基本概念 a.路径和路径长度 若在一棵树中存在着一个结点序列 k1,k2,……,kj, 使得 ki是ki+1 的双亲(1<=i<j),则称此结点序列是从 k1 到 kj 的路径. 从 ...
- Alink漫谈(十六) :Word2Vec源码分析 之 建立霍夫曼树
Alink漫谈(十六) :Word2Vec源码分析 之 建立霍夫曼树 目录 Alink漫谈(十六) :Word2Vec源码分析 之 建立霍夫曼树 0x00 摘要 0x01 背景概念 1.1 词向量基础 ...
- 【算法】赫夫曼树(Huffman)的构建和应用(编码、译码)
参考资料 <算法(java)> — — Robert Sedgewick, Kevin Wayne <数据结构> ...
- 哈夫曼编码与解码的C++实现:建立哈夫曼树、进行哈夫曼编码与解码
最近完成了数据结构课程设计,被分到的题目是<哈夫曼编码和解码>,现在在这篇博文里分享一下自己的成果. 我在设计时,在网上参考了很多老师和前辈的算法和代码,向他们表示感谢!他们的成果给了我很 ...
- [C++]哈夫曼树(最优满二叉树) / 哈夫曼编码(贪心算法)
一 哈夫曼树 1.1 基本概念 算法思想 贪心算法(以局部最优,谋求全局最优) 适用范围 1 [(约束)可行]:它必须满足问题的约束 2 [局部最优]它是当前步骤中所有可行选择中最佳的局部选择 3 [ ...
- 数据结构图文解析之:哈夫曼树与哈夫曼编码详解及C++模板实现
0. 数据结构图文解析系列 数据结构系列文章 数据结构图文解析之:数组.单链表.双链表介绍及C++模板实现 数据结构图文解析之:栈的简介及C++模板实现 数据结构图文解析之:队列详解与C++模板实现 ...
- 哈夫曼树(Huffman Tree)与哈夫曼编码
哈夫曼树(Huffman Tree)与哈夫曼编码(Huffman coding)
随机推荐
- Ionic 常用插件
ionic扩展插件 1.ionic-timepicker 时间选择 https://github.com/rajeshwarpatlolla/ionic-timepicker 2.ionic-da ...
- git 安装教程
昆,简单说下安装教程1,安装Git2,安装TortoiseGit3,打开第一步安装的git工具GIT BASH
- ionic + cordova+angularJs 搭建的H5 App完整版总结
为期半个月的项目实践开发,已完整告一段落,团队小组获得第一名,辛苦总算没有白费,想起有一天晚上,整个小组的人,联调到12点才从公司回去,真是心酸.这里总结一下,项目过程中遇到的问题 和感悟.哈哈, ...
- tp框架之函数调用
1.如果要在一个方法里面调用另一个方法,可以先用A方法实例化控制器 $m = A("控制器名"); ,然后根据方法名调用 $m->方法名(可传参数); 2.自定义函数库 ( ...
- llvm-summary
llvm 学习总结 Type define int类型 IntegerType::get(mod->getContext(), 32) long类型 IntegerType::get(mod-& ...
- .Net缓存管理框架CacheManager(转)
转载地址:http://www.cnblogs.com/JustRun1983/p/CacheManager.html Cache缓存在计算机领域是一个被普遍使用的概念.硬件中CPU有一级缓存,二级缓 ...
- 【Java EE 学习 82 下】【MAVEN整合Eclipse】【MAVEN的一些高级概念】
一.MAVEN整合Eclipse MAVEN是非常优秀,但是总是要开命令行敲命令是比较不爽的,我们已经习惯了使用IDE,所以还有一种将MAVEN整合到Eclipse的方法. 详情查看:http://w ...
- 解决Linux不能上网ping:unknown host的问题
修改配置文件:/etc/sysconfig/network-scripts/ifcfg-eth0 vim /etc/sysconfig/network-scripts/ifcfg-eth0 在里面添加 ...
- 在IIS8.5的环境下配置WCF的Restful Service
今天在客户的环境中(Windows Server 2012 R2 + IIS 8.5)搭建Call WCF Restful Service的功能,发现了几个环境配置的问题,记录如下: 1):此环境先安 ...
- VS2012调试时很慢的解决方案
1.转自http://guooge.com/archives/408.html VS2010调试极慢获取出现死机,因为启动了IntelliTrace Visual Studio 2010 Ulti ...