C++实现哈夫曼编码/译码器(数据结构)
设计一个哈夫曼编码、译码系统。对一个ASCII编码的文本文件中的字符进行哈夫曼编码,生成编码文件;反过来,可将编码文件译码还原为一个文本文件。
(1) 从文件中读入任意一篇英文短文(文件为ASCII编码,扩展名为txt);
(2) 统计并输出不同字符在文章中出现的频率(空格、换行、标点等也按字符处理);
(3) 根据字符频率构造哈夫曼树,并给出每个字符的哈夫曼编码;
(4) 图形化输出哈夫曼树、哈夫曼编码;
(5) 将文本文件利用哈夫曼树进行编码,存储成压缩文件(编码文件后缀名.huf)
(6) 用哈夫曼编码来存储文件,并和输入文本文件大小进行比较,计算文件压缩率;
(7) 进行译码,将huf文件译码为ASCII编码的txt文件,与原txt文件进行比较。
[测试数据]文本文件自行选择,至少含3000个字符。
[实现代码]
#include<iostream>
#include<fstream>
#include<queue>
#include<math.h>
using namespace std;
struct Node{
public:
Node *right;
Node *left;
char data;
int weight;
int x[];
};
void InsertionSort(Node*A[],int n){
for(int i=;i<n;i++){
Node *get=A[i];
int j=i-;
while(j>=&&A[j]->weight>get->weight){
A[j+]=A[j];
j--;
}
A[j+]=get;
}
}
Node* father(Node*root,Node*son){
Node*temp;
if(root==NULL||son==NULL)
return NULL;
if(root->left==son||root->right==son)
return root;
temp=father(root->left,son);
if(temp!=NULL)
return temp;
else
return father(root->right,son);
}
void preorder(Node*root){
if(root!=NULL) {
cout<<root->weight<<" ";
preorder(root->left);
preorder(root->right);
}
}
void sumlevel(Node*root,int *count,int l){
if(root!=NULL) {
count[l]=count[l]+;
sumlevel(root->left,count,l+);
sumlevel(root->right,count,l+);
}
}
void levelorder(Node*t,int*count){
queue<Node*>q;
int x=,i=;
if(t!=NULL){
Node*p;
for(int z=;z<;z++){
cout<<" ";
}
cout<<t->data<<"("<<t->weight<<")"<<endl;
x=x+;
i=i+;
q.push(t);
while(!q.empty()){
p=q.front();
q.pop();
if(p->left){
for(int z=;z</(i+);z++) cout<<" ";
cout<<p->left->data<<"("<<p->left->weight<<")";
if(x==count[i]){
cout<<endl;
i++;
x=;
}
x=x+;
q.push(p->left);
}
if(p->left){
for(int z=;z</(i);z++) cout<<" ";
cout<<p->right->data<<"("<<p->right->weight<<")";
if(x==count[i]){
cout<<endl;
i++;
x=;
}
x=x+;
q.push(p->right);
}
}
}
}
void TreePrint(Node *T,int level)
{
if (T!=NULL) return;
TreePrint(T->right,level+); //打印右子树,并将层次加1
for (int i=;i<level;i++) //按照递归的层次打印空格
{
printf(" ");
}
cout<<T->weight<<endl;
TreePrint(T->left,level+); //打印左子树,并将层次加1
}
int main(){
//打开待压缩文件
ifstream file("C:\\Users\\wenjian\\start.txt");
char a;
Node *root1;
int n[]={};
int x,i,j,num=;
while(!file.eof()){
file.get(a);
if(file.fail()) break;
x=a;
n[x]++;
}
for(i=;i<;i++){
if(n[i]!=) num++;
}
Node *m[num],*mm[num];
for(i=;i<num;i++){
m[i]=new Node;
m[i]->left=NULL;
m[i]->right=NULL;
}
j=;
for(i=;i<;i++){
if(n[i]!=){
m[j]->data=i;
m[j]->weight=n[i];
j++;
}
}
InsertionSort(m,num);
Node *p1,*p2,*p,*t;
j=;
for(i=;i<num;i++){
mm[i]=m[i];
}
for(i=;i<num-;i++){
t=new Node;
p1=m[i];
p2=m[i+];
t->weight=m[i]->weight+m[i+]->weight;
t->left=p1;
t->right=p2;
p=t;
j=i+;
while(j<num&&p->weight > m[j]->weight){
m[j-]=m[j];
j=j+;
}
m[j-]=p;
}
root1=m[num-];
int zz[];
Node *s,*z;
for(i=;i<num;i++){
for(int xx=;xx<;xx++){
zz[xx]=-;
}
s=father(root1,mm[i]);
z=mm[i];
j=;
while(s!=root1){
if(s->left==z){
zz[-j]=;
}
if(s->right==z){
zz[-j]=;
}
z=s;
s=father(root1,z);
j++;
}
if(s->left==z) zz[-j]=;
if(s->right==z) zz[-j]=;
x=;
for(int xx=g0;xx<;xx++){
if(zz[xx]>-) x++;
}
for(int xx=;xx<;xx++){
zz[xx]=zz[xx+-x];
}
for(int xx=x;xx<;xx++){
zz[xx]=-;
}
for(int xx=;xx<;xx++){
mm[i]->x[xx]=zz[xx];
}
}
for(i=;i<num;i++){
cout<<mm[i]->data<<":"<<mm[i]->weight<<" ";
for(j=;j<;j++){
if(mm[i]->x[j]>=) cout<<mm[i]->x[j];
}
cout<<endl;
}
file.close();
//再次打开文件
ifstream file1("C:\\Users\\wenjian\\start.txt");
//生成的中间文件
ofstream putfile("C:\\Users\\daima\\progress.txt");
//生成压缩.huf文件
ofstream assicfile("C:\\Users\\wenjian\\assic.huf");
int f=,o=,w=;
while(!file1.eof()){
file1.get(a);
if(file1.fail()) break;
for(i=;i<num;i++){
if(mm[i]->data==a){
for(j=;j<;j++){
o=;
if(mm[i]->x[j]==-) break;
putfile<<mm[i]->x[j];
if(f<){
for(int d=;d<-f;d++){
o=*o;
}
w=mm[i]->x[j]*o+w;
f=f+;
}
if(f==){
w=mm[i]->x[j]+w;
f=;
char ww=w;
assicfile<<ww;
w=;
}
}
}
}
}
file1.close();
putfile.close();
// ifstream outfile("progress.txt");
// ofstream infile("end.txt"); /////
//重新打开中间文件,生成最终解压文件
ifstream outfile("C:\\Users\\daima\\progress.txt");
ofstream infile("C:\\Users\\wenjian\\end.txt");
char y;
while(!outfile.eof()){
if(outfile.fail()) break;
s=root1;
z=s;
while(z->left){
outfile.get(y);
if(y==''){
s=z;
z=s->left;
}
if(y==''){
s=z;
z=s->right;
}
}
if(outfile.fail()) break;
infile<<z->data;
}
outfile.close();
infile.close();
int sum[]={};
sumlevel(root1,sum,);
levelorder(root1,sum);
int q=;
for(i=;i<;i++){
q=q*;
if(q>=num) break;
}
int zzz=i+;
ifstream file2("end.txt");
while(!file2.eof()){
if(file2.fail()) break;
file2.get(a);
for(i=;i<zzz;i++){
}
if(file2.fail()) break;
}
file2.close();
float g,h;
cout<<"请分别输入原文件与压缩文件大小:"<<endl;
cin>>g;
cin>>h;
float hh=h/g;
cout<<"压缩率:"<<-hh<<endl;
}
C++实现哈夫曼编码/译码器(数据结构)的更多相关文章
- c++实验8 哈夫曼编码-译码器
哈夫曼编码-译码器 此次实验的注释解析多加不少---若对小伙伴们有帮助 希望各位麻烦点个关注 多谢 1.哈夫曼树构造算法为: (1)由给定的n个权值{w1,w2,…,wn}构造n棵只有根结点的二叉树, ...
- 数据结构图文解析之:哈夫曼树与哈夫曼编码详解及C++模板实现
0. 数据结构图文解析系列 数据结构系列文章 数据结构图文解析之:数组.单链表.双链表介绍及C++模板实现 数据结构图文解析之:栈的简介及C++模板实现 数据结构图文解析之:队列详解与C++模板实现 ...
- SDUT 3345 数据结构实验之二叉树六:哈夫曼编码
数据结构实验之二叉树六:哈夫曼编码 Time Limit: 1000MS Memory Limit: 65536KB Submit Statistic Problem Description 字符的编 ...
- 20172332 2017-2018-2 《程序设计与数据结构》Java哈夫曼编码实验--哈夫曼树的建立,编码与解码
20172332 2017-2018-2 <程序设计与数据结构>Java哈夫曼编码实验--哈夫曼树的建立,编码与解码 哈夫曼树 1.路径和路径长度 在一棵树中,从一个结点往下可以达到的孩子 ...
- SDUT OJ 数据结构实验之二叉树六:哈夫曼编码
数据结构实验之二叉树六:哈夫曼编码 Time Limit: 1000 ms Memory Limit: 65536 KiB Submit Statistic Discuss Problem Descr ...
- [数据结构与算法]哈夫曼(Huffman)树与哈夫曼编码
声明:原创作品,转载时请注明文章来自SAP师太技术博客( 博/客/园www.cnblogs.com):www.cnblogs.com/jiangzhengjun,并以超链接形式标明文章原始出处,否则将 ...
- C语言数据结构之哈夫曼树及哈夫曼编码的实现
代码清单如下: #pragma once #include<stdio.h> #include"stdlib.h" #include <string.h> ...
- Java数据结构(十二)—— 霍夫曼树及霍夫曼编码
霍夫曼树 基本介绍和创建 基本介绍 又称哈夫曼树,赫夫曼树 给定n个权值作为n个叶子节点,构造一棵二叉树,若该树的带权路径长度(wpl)达到最小,称为最优二叉树 霍夫曼树是带权路径长度最短的树,权值较 ...
- 10: java数据结构和算法: 构建哈夫曼树, 获取哈夫曼编码, 使用哈夫曼编码原理对文件压缩和解压
最终结果哈夫曼树,如图所示: 直接上代码: public class HuffmanCode { public static void main(String[] args) { //获取哈夫曼树并显 ...
随机推荐
- ADB-常见命令使用详解
ADB命令使用详解 ADB是一个 客户端-服务器端 程序, 其中客户端是你用来操作的电脑, 服务器端是android设备. 1.连接android设置adb connect 设备名例如:adb con ...
- Oracle-常见的命令
--------------输入一下指令,按下快捷键 F8 select * from emp; --------------创建表格 create table 表名( 字段名1 数据类型1, 字段名 ...
- HTML学习分享二
一 . 常用快捷键 ctrl + s : 保存 ctrl + x.ctrl + c.ctrl + v : 剪切.复制.粘贴 ctrl + a : 全选 sh ...
- Redis 分布式锁(一)
前言 本文力争以最简单的语言,以博主自己对分布式锁的理解,按照自己的语言来描述分布式锁的概念.作用.原理.实现.如有错误,还请各位大佬海涵,恳请指正.分布式锁分两篇来讲解,本篇讲解客户端,下一篇讲解r ...
- Spring-Boot 多数据源配置+动态数据源切换+多数据源事物配置实现主从数据库存储分离
一.基础介绍 多数据源字面意思,比如说二个数据库,甚至不同类型的数据库.在用SpringBoot开发项目时,随着业务量的扩大,我们通常会进行数据库拆分或是引入其他数据库,从而我们需要配置多个数据源. ...
- mybatis generator 的日常使用
一.mybatis-generator的基本配置与使用 使用mybatis-generator来生成常用的dao层类与xml,可以满足基础的增删改查功能 1. 添加pom依赖,常用的几个依赖包 < ...
- Spring框架零基础学习(一):IOC|DI、AOP
文章目录 一.IDEA创建Spring项目 二.Spring: IOC和DI 三.Spring: AOP 参考链接: HOW2J.CN:Spring idea创建一个spring项目 一.IDEA创建 ...
- 请解释ASP.NET中的web页面与其隐藏类之间的关系
其实页面与其隐藏类之间就是一个部分类的关系,你在页面上放一个一个的控件就是在这个类中定义一个一个的属性, 因为是同一个类的部分类的关系,所以隐藏类可以访问到页面上控件,这样做是为了把展现与处理逻辑分开 ...
- FaaS 给前端带来了什么?
一.Serverless 与 FaaS Serverless 是一种云计算理念,即无服务器计算(Serverless Computing): Serverless suggests that the ...
- python读取hdfs并返回dataframe教程
不多说,直接上代码 from hdfs import Client import pandas as pd HDFSHOST = "http://xxx:50070" FILENA ...