C++实现哈夫曼编码/译码器(数据结构)
设计一个哈夫曼编码、译码系统。对一个ASCII编码的文本文件中的字符进行哈夫曼编码,生成编码文件;反过来,可将编码文件译码还原为一个文本文件。
(1) 从文件中读入任意一篇英文短文(文件为ASCII编码,扩展名为txt);
(2) 统计并输出不同字符在文章中出现的频率(空格、换行、标点等也按字符处理);
(3) 根据字符频率构造哈夫曼树,并给出每个字符的哈夫曼编码;
(4) 图形化输出哈夫曼树、哈夫曼编码;
(5) 将文本文件利用哈夫曼树进行编码,存储成压缩文件(编码文件后缀名.huf)
(6) 用哈夫曼编码来存储文件,并和输入文本文件大小进行比较,计算文件压缩率;
(7) 进行译码,将huf文件译码为ASCII编码的txt文件,与原txt文件进行比较。
[测试数据]文本文件自行选择,至少含3000个字符。
[实现代码]
#include<iostream>
#include<fstream>
#include<queue>
#include<math.h>
using namespace std;
struct Node{
public:
Node *right;
Node *left;
char data;
int weight;
int x[];
};
void InsertionSort(Node*A[],int n){
for(int i=;i<n;i++){
Node *get=A[i];
int j=i-;
while(j>=&&A[j]->weight>get->weight){
A[j+]=A[j];
j--;
}
A[j+]=get;
}
}
Node* father(Node*root,Node*son){
Node*temp;
if(root==NULL||son==NULL)
return NULL;
if(root->left==son||root->right==son)
return root;
temp=father(root->left,son);
if(temp!=NULL)
return temp;
else
return father(root->right,son);
}
void preorder(Node*root){
if(root!=NULL) {
cout<<root->weight<<" ";
preorder(root->left);
preorder(root->right);
}
}
void sumlevel(Node*root,int *count,int l){
if(root!=NULL) {
count[l]=count[l]+;
sumlevel(root->left,count,l+);
sumlevel(root->right,count,l+);
}
}
void levelorder(Node*t,int*count){
queue<Node*>q;
int x=,i=;
if(t!=NULL){
Node*p;
for(int z=;z<;z++){
cout<<" ";
}
cout<<t->data<<"("<<t->weight<<")"<<endl;
x=x+;
i=i+;
q.push(t);
while(!q.empty()){
p=q.front();
q.pop();
if(p->left){
for(int z=;z</(i+);z++) cout<<" ";
cout<<p->left->data<<"("<<p->left->weight<<")";
if(x==count[i]){
cout<<endl;
i++;
x=;
}
x=x+;
q.push(p->left);
}
if(p->left){
for(int z=;z</(i);z++) cout<<" ";
cout<<p->right->data<<"("<<p->right->weight<<")";
if(x==count[i]){
cout<<endl;
i++;
x=;
}
x=x+;
q.push(p->right);
}
}
}
}
void TreePrint(Node *T,int level)
{
if (T!=NULL) return;
TreePrint(T->right,level+); //打印右子树,并将层次加1
for (int i=;i<level;i++) //按照递归的层次打印空格
{
printf(" ");
}
cout<<T->weight<<endl;
TreePrint(T->left,level+); //打印左子树,并将层次加1
}
int main(){
//打开待压缩文件
ifstream file("C:\\Users\\wenjian\\start.txt");
char a;
Node *root1;
int n[]={};
int x,i,j,num=;
while(!file.eof()){
file.get(a);
if(file.fail()) break;
x=a;
n[x]++;
}
for(i=;i<;i++){
if(n[i]!=) num++;
}
Node *m[num],*mm[num];
for(i=;i<num;i++){
m[i]=new Node;
m[i]->left=NULL;
m[i]->right=NULL;
}
j=;
for(i=;i<;i++){
if(n[i]!=){
m[j]->data=i;
m[j]->weight=n[i];
j++;
}
}
InsertionSort(m,num);
Node *p1,*p2,*p,*t;
j=;
for(i=;i<num;i++){
mm[i]=m[i];
}
for(i=;i<num-;i++){
t=new Node;
p1=m[i];
p2=m[i+];
t->weight=m[i]->weight+m[i+]->weight;
t->left=p1;
t->right=p2;
p=t;
j=i+;
while(j<num&&p->weight > m[j]->weight){
m[j-]=m[j];
j=j+;
}
m[j-]=p;
}
root1=m[num-];
int zz[];
Node *s,*z;
for(i=;i<num;i++){
for(int xx=;xx<;xx++){
zz[xx]=-;
}
s=father(root1,mm[i]);
z=mm[i];
j=;
while(s!=root1){
if(s->left==z){
zz[-j]=;
}
if(s->right==z){
zz[-j]=;
}
z=s;
s=father(root1,z);
j++;
}
if(s->left==z) zz[-j]=;
if(s->right==z) zz[-j]=;
x=;
for(int xx=g0;xx<;xx++){
if(zz[xx]>-) x++;
}
for(int xx=;xx<;xx++){
zz[xx]=zz[xx+-x];
}
for(int xx=x;xx<;xx++){
zz[xx]=-;
}
for(int xx=;xx<;xx++){
mm[i]->x[xx]=zz[xx];
}
}
for(i=;i<num;i++){
cout<<mm[i]->data<<":"<<mm[i]->weight<<" ";
for(j=;j<;j++){
if(mm[i]->x[j]>=) cout<<mm[i]->x[j];
}
cout<<endl;
}
file.close();
//再次打开文件
ifstream file1("C:\\Users\\wenjian\\start.txt");
//生成的中间文件
ofstream putfile("C:\\Users\\daima\\progress.txt");
//生成压缩.huf文件
ofstream assicfile("C:\\Users\\wenjian\\assic.huf");
int f=,o=,w=;
while(!file1.eof()){
file1.get(a);
if(file1.fail()) break;
for(i=;i<num;i++){
if(mm[i]->data==a){
for(j=;j<;j++){
o=;
if(mm[i]->x[j]==-) break;
putfile<<mm[i]->x[j];
if(f<){
for(int d=;d<-f;d++){
o=*o;
}
w=mm[i]->x[j]*o+w;
f=f+;
}
if(f==){
w=mm[i]->x[j]+w;
f=;
char ww=w;
assicfile<<ww;
w=;
}
}
}
}
}
file1.close();
putfile.close();
// ifstream outfile("progress.txt");
// ofstream infile("end.txt"); /////
//重新打开中间文件,生成最终解压文件
ifstream outfile("C:\\Users\\daima\\progress.txt");
ofstream infile("C:\\Users\\wenjian\\end.txt");
char y;
while(!outfile.eof()){
if(outfile.fail()) break;
s=root1;
z=s;
while(z->left){
outfile.get(y);
if(y==''){
s=z;
z=s->left;
}
if(y==''){
s=z;
z=s->right;
}
}
if(outfile.fail()) break;
infile<<z->data;
}
outfile.close();
infile.close();
int sum[]={};
sumlevel(root1,sum,);
levelorder(root1,sum);
int q=;
for(i=;i<;i++){
q=q*;
if(q>=num) break;
}
int zzz=i+;
ifstream file2("end.txt");
while(!file2.eof()){
if(file2.fail()) break;
file2.get(a);
for(i=;i<zzz;i++){
}
if(file2.fail()) break;
}
file2.close();
float g,h;
cout<<"请分别输入原文件与压缩文件大小:"<<endl;
cin>>g;
cin>>h;
float hh=h/g;
cout<<"压缩率:"<<-hh<<endl;
}
C++实现哈夫曼编码/译码器(数据结构)的更多相关文章
- c++实验8 哈夫曼编码-译码器
哈夫曼编码-译码器 此次实验的注释解析多加不少---若对小伙伴们有帮助 希望各位麻烦点个关注 多谢 1.哈夫曼树构造算法为: (1)由给定的n个权值{w1,w2,…,wn}构造n棵只有根结点的二叉树, ...
- 数据结构图文解析之:哈夫曼树与哈夫曼编码详解及C++模板实现
0. 数据结构图文解析系列 数据结构系列文章 数据结构图文解析之:数组.单链表.双链表介绍及C++模板实现 数据结构图文解析之:栈的简介及C++模板实现 数据结构图文解析之:队列详解与C++模板实现 ...
- SDUT 3345 数据结构实验之二叉树六:哈夫曼编码
数据结构实验之二叉树六:哈夫曼编码 Time Limit: 1000MS Memory Limit: 65536KB Submit Statistic Problem Description 字符的编 ...
- 20172332 2017-2018-2 《程序设计与数据结构》Java哈夫曼编码实验--哈夫曼树的建立,编码与解码
20172332 2017-2018-2 <程序设计与数据结构>Java哈夫曼编码实验--哈夫曼树的建立,编码与解码 哈夫曼树 1.路径和路径长度 在一棵树中,从一个结点往下可以达到的孩子 ...
- SDUT OJ 数据结构实验之二叉树六:哈夫曼编码
数据结构实验之二叉树六:哈夫曼编码 Time Limit: 1000 ms Memory Limit: 65536 KiB Submit Statistic Discuss Problem Descr ...
- [数据结构与算法]哈夫曼(Huffman)树与哈夫曼编码
声明:原创作品,转载时请注明文章来自SAP师太技术博客( 博/客/园www.cnblogs.com):www.cnblogs.com/jiangzhengjun,并以超链接形式标明文章原始出处,否则将 ...
- C语言数据结构之哈夫曼树及哈夫曼编码的实现
代码清单如下: #pragma once #include<stdio.h> #include"stdlib.h" #include <string.h> ...
- Java数据结构(十二)—— 霍夫曼树及霍夫曼编码
霍夫曼树 基本介绍和创建 基本介绍 又称哈夫曼树,赫夫曼树 给定n个权值作为n个叶子节点,构造一棵二叉树,若该树的带权路径长度(wpl)达到最小,称为最优二叉树 霍夫曼树是带权路径长度最短的树,权值较 ...
- 10: java数据结构和算法: 构建哈夫曼树, 获取哈夫曼编码, 使用哈夫曼编码原理对文件压缩和解压
最终结果哈夫曼树,如图所示: 直接上代码: public class HuffmanCode { public static void main(String[] args) { //获取哈夫曼树并显 ...
随机推荐
- Ethical Hacking - NETWORK PENETRATION TESTING(13)
Nmap Nmap is a network discovery tool that can be used to gather detailed information about any clie ...
- Python Ethical Hacking - VULNERABILITY SCANNER(1)
HTTP REQUESTS BASIC INFORMATION FLOW The user clicks on a link. HTML website generates a request(cli ...
- ClickHouse源码笔记2:聚合流程的实现
上篇笔记讲到了聚合函数的实现并且带大家看了聚合函数是如何注册到ClickHouse之中的并被调用使用的.这篇笔记,笔者会续上上篇的内容,将剖析一把ClickHouse聚合流程的整体实现. 第二篇文章, ...
- 解决nginx在Linux中已经正常启动,Windows端的浏览器却无法访问的问题
一:查看Linux中nginx已经正常启动 二:查看80端口,未被占用 三:检查防火墙的问题 关闭防火墙:chkconfig iptables off //失败 暂时关闭防火墙:service ipt ...
- sqlserver安装出现找不到数据库引擎错误
sqlserver安装出现找不到数据库引擎错误 问题的解决 第一次安装SQL server,发现它较于Oracle,都有安装卸载十分麻烦的特点.刚开始安装,就让我频繁遇到这个“找不到数据库引擎”的错误 ...
- 【mysql】- 锁篇(下)
InnoDB存储引擎中的锁 表级锁 表级别的S锁.X锁 在对某个表执行SELECT.INSERT.DELETE.UPDATE语句时,InnoDB存储引擎是不会为这个表添加表级别的S锁或者X锁的 表级别 ...
- 【mysql】- 索引简介篇
简介 我们都知道mysql使用存储引擎的是InnoDB,InnoDB使用的索引的对应的数据结构是B+树 结构图: 如上图所示,我们实际用户记录是存放在B+树的最底层的节点上,这些节点也被称为叶子节点或 ...
- 无法定位序数242于动态链接库,Anaconda3\Library\bin\mkl_intel_thread
python.exe-找不到序数:无法定位序数242与动态链接库libiomp5md.dll上.或无法定位程序输入点 mkl_dft_create_descriptor_md于动态链接库 Ancond ...
- 开源项目推荐 - 巨鲸任务调度平台(Spark、Flink)
Big Whale(巨鲸),为美柚大数据研发的大数据任务调度平台,提供Spark.Flink等离线任务的调度(支持任务间的依赖调度)以及实时任务的监控,并具有批次积压告警.任务异常重启.重复应用监测. ...
- 《Python编程快速上手 —让繁琐工作自动化》|百度网盘免费下载|Python自动化办公
Python编程快速上手—让繁琐工作自动化 提取码:u8vj 如今,人们面临的大多数任务都可以通过编写计算机软件来完成. Python 是一种解释型.面向对象.动态数据类型的高级程序设计语言.通过 P ...