Huffman编码实现文件的压缩与解压缩。

以前没事的时候写的，c++写的，原理很简单，代码如下：

 #include <cstdio>

 #include <cstdlib>

 #include <iostream>

 #include <string>

 //#include <bitset>

 #include <fstream>

 #include <ctime>

 const int maxCodeNum = ;

 using namespace std;

 //哈夫曼树的树节点

 struct HaffTreeNode{

     HaffTreeNode * lNode;

     HaffTreeNode * rNode;

     string  haffCode;

     int value;

     int alpha;

     HaffTreeNode()

         :lNode(NULL), rNode(NULL), haffCode(""), value(), alpha(){;}

 };

 //链表节点，用于生成哈夫曼树

 struct ListNode{

     struct HaffTreeNode HaffTreeNode;

     ListNode *nextListNode;

     ListNode()

         :nextListNode(NULL){;}

 };

 //用与保存输入文件统计信息的hash表

 typedef struct HashTable{

     int value;

     int alpha;

     HashTable()

         :value(), alpha(){}

     //比较函数用于排序使用

     inline friend int operator-(const HashTable & a, const HashTable & b){

         return a.value - b.value;

     }

 } HashTable;

 HashTable charHashTable[maxCodeNum];

 //排序使用的比较大小的函数

 int hashComp(const void * a, const void * b)

 {

     return  *((HashTable *)a) - *((HashTable *)b);

 }

 //创建一个哈夫曼树

 HaffTreeNode * createHaffTreeNodeTree(HashTable table[])

 {

     ListNode *root = new ListNode;

     ListNode *next = root;

     for(int i = ; /*i < maxCodeNum - 1*/; ++i){

         if(table[i].value == )//如果对应的码不为0，就为其分配一个树节点

             continue;

         next->HaffTreeNode.alpha = table[i].alpha;

         next->HaffTreeNode.value = table[i].value;

         if(i ==maxCodeNum - )

             break;

         next->nextListNode = new ListNode;

         next = next->nextListNode;

     }

     while(root->nextListNode != NULL){

         ListNode * currNode = new ListNode;

         currNode->HaffTreeNode.value = root->HaffTreeNode.value + root->nextListNode->HaffTreeNode.value;

         currNode->HaffTreeNode.lNode =  &(root->HaffTreeNode);

         currNode->HaffTreeNode.rNode =  &(root->nextListNode->HaffTreeNode);

         root = root->nextListNode->nextListNode;    //概率最小的两个码相加组成一个新的节点

         ListNode * nextNode = root;

         ListNode * prevNode = NULL;

         while(nextNode != NULL && currNode->HaffTreeNode.value > nextNode->HaffTreeNode.value){

             prevNode = nextNode;

             nextNode = nextNode->nextListNode;

         }

         if(prevNode == NULL){//将这个新的节点插入到所有节点之前（currNode目前还是最小的）

             currNode->nextListNode = nextNode;

             root = currNode;

         }else{//插入到节点中间或者节点之后的位置

             prevNode->nextListNode = currNode;

             currNode->nextListNode = nextNode;

         }

     }//在这个list中所有的元素遍历完成之后返回

     return &(root->HaffTreeNode);//返回书的根节点的哈弗满节点，这个节点已经构造成为了一棵树

 }

 string huffmanCodeTable[maxCodeNum];

 string haffCode;

 //给哈夫曼树编码

 void createHaffmanTable(HaffTreeNode * root)

 {

     if(root->lNode == NULL && root->rNode == NULL){

         huffmanCodeTable[root->alpha] = haffCode;

         haffCode.erase(haffCode.length() - );

         return;

     }//给各个节点赋予相应的哈夫曼编码

     haffCode.append("");

     createHaffmanTable(root->lNode);

     haffCode.append("");

     createHaffmanTable(root->rNode);

     if(!haffCode.empty()){

         haffCode.erase(haffCode.length() - );

     }

     return;

 }

 //将生成的二进制长串编码转换成字符用于存储在压缩文件中

 unsigned char StrToBin(string str)

 {

     unsigned int ans =;

     int tmpNum = atoi(str.c_str());

     int multiNum = ;

     while(tmpNum != ){

         ans += tmpNum%*multiNum;

         tmpNum/=;

         multiNum *= ;

     }

     return (unsigned char) ans;

 }

 //用于将压缩文件的字符转换成huffman编码

 string BinToStr(unsigned char c)

 {

     string tmpNumStr;

     while(c != ){

         tmpNumStr.insert(tmpNumStr.begin(), (unsigned char)(c% + ''));

         c /= ;

     }

     if(tmpNumStr.length() < ){

         tmpNumStr.insert(tmpNumStr.begin(),   - tmpNumStr.length(), '');

     }

     return tmpNumStr;

 }

 //下面是将huffman码译成原字符的程序

 char huffDecode(HaffTreeNode * root, string & code)

 {

     unsigned int i;

     for( i = ; i < code.length(); ++i){

         if(root->alpha == )

             root = (code[i] - '')?root->rNode:root->lNode;

         else{

             code.erase(, i);

             return root->alpha;

         }

     }

     if(root->alpha !=){

         code.erase(, i);

         return root->alpha;

     }

     code.clear();

     return '\0';

 }

 int main(int argc, char ** argv)

 {

     if(argc != ){

         printf("Error number of arguments!\n");

     }

     FILE * fin = fopen(argv[], "r");

     int c = ;

     while((c = fgetc(fin)) != EOF && c != '\n'){

         putchar(c);

         putchar('*');

         charHashTable[c].alpha = c;

         charHashTable[c].value++;

     }

     qsort(charHashTable, sizeof(charHashTable)/sizeof(charHashTable[]),

             sizeof(charHashTable[]), hashComp);

     /*建立有关本文件的huffman树*/

     HaffTreeNode * haffTreeRoot = createHaffTreeNodeTree(charHashTable);

     createHaffmanTable(haffTreeRoot);

     cout << "Char\tTimes\tCodes";

     for(int i = ; i < maxCodeNum; ++i){

         if(charHashTable[i].value != ){

             cout << (char)charHashTable[i].alpha << "\t" << charHashTable[i].value

                  << "\t" << huffmanCodeTable[charHashTable[i].alpha] << "\n";

         }

     }

     FILE * fout;

     if((fout = fopen(argv[], "w")) == NULL){

         perror("open output file error!\n");

     }

     rewind(fin);

     string buf; 

     while((c = fgetc(fin)) != EOF){ /*将文件通过huffman码转来进行压缩*/

         //printf("The char is %c  ", c);

         buf += huffmanCodeTable[c];

         cout << buf << endl;

         if(buf.length() > ){   //当转换的字符得到的huffman码达到8的时候转换成一个字符填入目标文件

             fputc(StrToBin(buf.substr(, )), fout);

             buf.erase(, );

         }

     }

     int leftZero = ;   //保存不到8位的余留位的个数

     if(!buf.empty()){

         buf.append((leftZero =  - buf.length()), '');

         fputc(StrToBin(buf), fout);

     }

     if(fclose(fin) == -)

         perror("close file error!\n");

     if(fclose(fout) == -)

         perror("close file error!\n");

     if((fin = fopen(argv[], "rb")) == NULL)//打开压缩文件，开始解码

         perror("Open file error!\n");

     if((fout = fopen("huffmanDecompose.txt", "w")) == NULL)

         perror("Open file error!\n");

     //开始解码

     int bin;

     buf.clear();

     while((bin = fgetc(fin)) != EOF){

         buf.append(BinToStr(bin));

     }

     while(buf.length() - leftZero !=  && !buf.empty()){

         fputc(huffDecode(haffTreeRoot, buf), fout);

     }

     if(fclose(fin) != )

         perror("close file error!\n");

     if(fclose(fout) != )

         perror("close file error!\n");

     return ;

 }

./a.out file1 file2
file1:输入文件
file2:输出文件（压缩后）
要锁完成后会将文压缩文件解压到huffmanDecompose.txt这个文件中

Huffman编码实现文件的压缩与解压缩。的更多相关文章

C# 下利用ICSharpCode.SharpZipLib.dll实现文件/目录压缩、解压缩
ICSharpCode.SharpZipLib.dll下载地址 1.压缩某个指定文件夹下日志,将日志压缩到CompressionDirectory文件夹中,并清除原来未压缩日志. #region 压缩 ...
Linux之文件的压缩与解压缩
压缩格式 .zip,.rar,.7z,.tar,.gz,.xz,.bz2,.tar.gz,.tar.xz,.tar.bz2,其中,形如*.tar.gz为tar打包,gz压缩的文件 zip压缩打包程序 ...
Linux文件打包压缩、解压缩、备份命令使用方法（转载）
对于刚刚接触Linux的人来说,一定会给Linux下一大堆各式各样的文件名给搞晕.别个不说,单单就压缩文件为例,我们知道在Windows下最常见的压缩文件就只有两种,一是,zip,另一个是.rar.可 ...
java实现单个或多个文件的压缩、解压缩支持zip、rar等格式
代码如下: package com.cn.util; import java.io.BufferedInputStream; import java.io.File; import java.io.F ...
Linux下文件的压缩与解压缩
一.zip格式 zip可能是目前使用的最多的文档压缩格式.它最大的优点就是在不同的操作系统平台上使用.缺点就是支持的压缩率不是很高,而tar.gz和tar.bz2在压缩率方面做得非常好. 我们可以使 ...
C# 文件/文件夹压缩解压缩
项目上用到的,随手做个记录,哈哈. 直接上代码: using System; using System.Data; using System.Configuration; using System.C ...
Linux下文件的压缩与打包
一.Linux下常见的文件压缩命令: 在Linux的环境中,压缩文件的扩展名大多是:『*.tar, *.tar.gz, *.tgz, *.gz, *.Z, *.bz2』,为什么会有这样的扩展名呢? 这 ...
C#压缩文件,C#压缩文件夹,C#获取文件
using System; using System.Data; using System.Configuration; using System.Collections.Generic; using ...
Jcompress: 一款基于huffman编码和最小堆的压缩、解压缩小程序
前言最近基于huffman编码和最小堆排序算法实现了一个压缩.解压缩的小程序.其源代码已经上传到github上面: Jcompress下载地址 .在本人的github上面有一个叫Utility的re ...

随机推荐

Windows 7 下 Node.js 连接 Oracle
原创作者: sailtseng 1. 安装 Oracle 11g express 详见: <Windows 7 x64 安装 Oracle 11g Express> 2. 安装 Micr ...
001-Bitcoin比特币与BlockChain区块链技术
一.比特币历史 2008 年 10 月 31 日,一个网名叫中本聪(英文翻译过来滴)的家伙发布比特币唯一的白皮书:<Bitcoin:A Peer-to-PeerElectronic Cash S ...
openPOWERLINK代码在vs2008下编译
以openPOWERLINK_V1.08为例: 1.在主目录下新建Build目录 2.使用cmake-gui对代码进行配置 3.配置完成后生成工程文件xxx.sln 4.使用vs2008打开上述文件, ...
C/C++中的行读取
在C语言里面一直很容易混淆的,gets和fgetS的区别: char * fgets ( char * str, int num, FILE * stream ); Reads characters ...
android adb devices offline的解决办法
在做Android开发时经常出现android adb devices offline,解决办法如下: 1 重启adb服务 adb kill-server adb start-server linux ...
go——接口
Go语言提供了另外一种数据类型,即接口,它把所有具有共性的方法定义在一起,任何其它类型只要实现了这些方法就是实现了这个接口. 接口代表一种调用契约,是多个方法声明的集合.在某些动态语言里,接口(int ...
WinForm下的Nhibernate+Spring.Net的框架配置文件
1.先将配置文件放到如下:<?xml version="1.0" encoding="utf-8"?> <configuration> ...
LeetCode：组合总数II【40】
LeetCode:组合总数II[40] 题目描述给定一个数组 candidates 和一个目标数 target ,找出 candidates 中所有可以使数字和为 target 的组合. candi ...
java HttpURLConnection 请求实例
package app.works; import org.json.JSONObject; import java.io.BufferedReader; import java.io.InputSt ...
org.springframework.beans.factory.config.PropertyPlaceholderConfigurer类
<bean id="investorQueryConfigurer" class="org.springframework.beans.factory.config ...

Huffman编码实现文件的压缩与解压缩。

Huffman编码实现文件的压缩与解压缩。的更多相关文章

随机推荐

热门专题