Java 树结构实际应用二（哈夫曼树和哈夫曼编码）

赫夫曼树

1 基本介绍

1) 给定 n 个权值作为 n 个叶子结点，构造一棵二叉树，若该树的带权路径长度(wpl)达到最小，称这样的二叉树为

最优二叉树，也称为哈夫曼树(Huffman Tree), 还有的书翻译为霍夫曼树。

2) 赫夫曼树是带权路径长度最短的树，权值较大的结点离根较近

2 赫夫曼树几个重要概念和举例说明

1) 路径和路径长度：在一棵树中，从一个结点往下可以达到的孩子或孙子结点之间的通路，称为路径。通路

中分支的数目称为路径长度。若规定根结点的层数为 1，则从根结点到第 L 层结点的路径长度为 L-1

2) 结点的权及带权路径长度：若将树中结点赋给一个有着某种含义的数值，则这个数值称为该结点的权。结

点的带权路径长度为：从根结点到该结点之间的路径长度与该结点的权的乘积

3) 树的带权路径长度：树的带权路径长度规定为所有叶子结点的带权路径长度之和，记为 WPL(weighted path

length) ,权值越大的结点离根结点越近的二叉树才是最优二叉树。

4) WPL 最小的就是赫夫曼树

3 赫夫曼树创建思路图解

给你一个数列 {13, 7, 8, 3, 29, 6, 1}，要求转成一颗赫夫曼树.

 思路分析(示意图)：

{13, 7, 8, 3, 29, 6, 1}

构成赫夫曼树的步骤：

1) 从小到大进行排序, 将每一个数据，每个数据都是一个节点，每个节点可以看成是一颗最简单的二叉树

2) 取出根节点权值最小的两颗二叉树

3) 组成一颗新的二叉树, 该新的二叉树的根节点的权值是前面两颗二叉树根节点权值的和

4) 再将这颗新的二叉树，以根节点的权值大小再次排序，不断重复 1-2-3-4 的步骤，直到数列中，所有的数

据都被处理，就得到一颗赫夫曼树

5) 图解:

4 赫夫曼树的代码实现

package huffmanTree;

import java.util.ArrayList;

import java.util.Collections;

public class HuffmanTree {

    public static void main(String[] args) {

        int[] arr = {13, 7, 8, 3, 29, 6, 1};

        Node createHuffmanTree = createHuffmanTree(arr);

        preOrder(createHuffmanTree);

    }

    // 前序遍历方法

    public static void preOrder(Node root) {

        if(root != null) {

            root.preOrder();

        } else {

            System.out.println("空树！");

        }

    }

    // 创建哈夫曼树

    public static Node createHuffmanTree(int[] arr) {

        // 1 遍历arr数组

        // 2 将arr的每个元素构成一个Node

        // 3 将Node放入ArrayList

        ArrayList<Node> nodes = new ArrayList<Node>();

        for (int value: arr) {

            nodes.add(new Node(value));

        }

        while(nodes.size() > 1) {

            Collections.sort(nodes);

//            System.out.println(nodes.toString());

            // 取出根节点权值最小的两个二叉树

            Node leftNode = nodes.get(0);

            Node rightNode = nodes.get(1);

            // 构建新二叉树

            Node parent = new Node(leftNode.value + rightNode.value);

            parent.left = leftNode;

            parent.right = rightNode;

            // 删除处理过的节点

            nodes.remove(leftNode);

            nodes.remove(rightNode);

            // parent加入List

            nodes.add(parent);

//            Collections.sort(nodes);

//            System.out.println(nodes.toString());

        }

        // 返回root

        return nodes.get(0);

    }

}

// 创建节点

class Node implements Comparable<Node>{

    int value;

    Node left;

    Node right;

    public void preOrder() {

        System.out.println(this);

        if(this.left != null) {

            this.left.preOrder();

        }

        if(this.right != null) {

            this.right.preOrder();

        }

    }

    public Node(int value) {

        this.value = value;

    }

    @Override

    public String toString() {

        return "Node [value= " + value + "]";

    }

    @Override

    public int compareTo(Node o) {

        return this.value - o.value;

    }

}

赫夫曼编码

1 基本介绍

1) 赫夫曼编码也翻译为

哈夫曼编码(Huffman Coding)，又称霍夫曼编码，是一种编码方式, 属于一种程序算法

2) 赫夫曼编码是赫哈夫曼树在电讯通信中的经典的应用之一。

3) 赫夫曼编码广泛地用于数据文件压缩。其压缩率通常在 20%～90%之间

4) 赫夫曼码是可变字长编码(VLC)的一种。Huffman 于 1952 年提出一种编码方法，称之为最佳编码

2 原理剖析

 通信领域中信息的处理方式 1-定长编码

通信领域中信息的处理方式 2-变长编码

通信领域中信息的处理方式 3-赫夫曼编码

步骤如下：

传输的字符串

1) i like like like java do you like a java

2) d:1 y:1 u:1 j:2 v:2 o:2 l:4 k:4 e:4 i:5 a:5

:9 // 各个字符对应的个数

3) 按照上面字符出现的次数构建一颗赫夫曼树, 次数作为权值

步骤：

构成赫夫曼树的步骤：

1) 从小到大进行排序, 将每一个数据，每个数据都是一个节点，每个节点可以看成是一颗最简单的二叉树

2) 取出根节点权值最小的两颗二叉树

3) 组成一颗新的二叉树, 该新的二叉树的根节点的权值是前面两颗二叉树根节点权值的和

4) 再将这颗新的二叉树，以根节点的权值大小再次排序，不断重复 1-2-3-4 的步骤，直到数列中，所有的数据都被处理，

就得到一颗赫夫曼树

4) 根据赫夫曼树，给各个字符,规定编码 (前缀编码)，向左的路径为 0 向右的路径为 1 ，编码

如下:

o: 1000

u: 10010 d: 100110 y: 100111 i: 101

a : 110

k: 1110

e: 1111

j: 0000

v: 0001

l: 001

: 01

5) 按照上面的赫夫曼编码，我们的"i like like like java do you like a java"

字符串对应的编码为 (注

意这里我们使用的无损压缩)

10101001101111011110100110111101111010011011110111101000011000011100110011110000110

01111000100100100110111101111011100100001100001110 通过赫夫曼编码处理长度为 133

6）长度为： 133

说明:

原来长度是 359 , 压缩了 (359-133) / 359 = 62.9%

此编码满足前缀编码, 即字符的编码都不能是其他字符编码的前缀。不会造成匹配的多义性

赫夫曼编码是无损处理方案

注意事项

注意, 这个赫夫曼树根据排序方法不同，也可能不太一样，这样对应的赫夫曼编码也不完全一样，但是 wpl 是

一样的，都是最小的, 最后生成的赫夫曼编码的长度是一样，比如: 如果我们让每次生成的新的二叉树总是排在权

值相同的二叉树的最后一个，则生成的二叉树为:

3 最佳实践-数据压缩(创建赫夫曼树)

将给出的一段文本，比如 "i like like like java do you like a java" ，根据前面的讲的赫夫曼编码原理，对其进行数

据压缩处理，形式如：

"1010100110111101111010011011110111101001101111011110100001100001110011001111000011001111000100100100

110111101111011100100001100001110

步骤：根据赫夫曼编码压缩数据的原理，需要创建 "i like like like java do you like a java" 对应的赫夫曼树

思路：前面已经分析过了，而且我们已然讲过了构建赫夫曼树的具体实现。

代码实现：

package com.lin.HuffmanCode_0314;

import java.util.ArrayList;

import java.util.Collections;

import java.util.HashMap;

import java.util.List;

import java.util.Map;

public class HuffmanCode {

    public static void main(String[] args) {

        String content = "i like like like java do you like a java";

        byte[] contentBytes = content.getBytes();

        System.out.println(contentBytes.length); // 40

        List<Node> nodes = getNodes(contentBytes);

        System.out.println(nodes);

        // 创建哈夫曼树

        System.out.println("哈夫曼树");

        Node createHuffmanTree = createHuffmanTree(nodes);

        preOrder(createHuffmanTree);

    }

    /**

     *

     * @Description:生成赫夫曼树对应的赫夫曼编码<br>

     *                 思路：将赫夫曼编码存放在Map<

     * @author LinZM

     * @date 2021-3-14 21:09:30

     * @version V1.8

     */

    // 前序遍历

    private static void preOrder(Node root){

        if(root != null) {

            root.preOrder();

        } else {

            System.out.println("空树！");

        }

    }

    /**

     *

     * @Description:

     * @author LinZM

     * @date 2021-3-14 20:45:23

     * @version V1.8

     * @param bytes接收字节数组

     * @param

     */

    private static List<Node> getNodes(byte[] bytes){

        // 1 创建一个ArrayList

        ArrayList<Node> nodes= new ArrayList<Node>();

        // 遍历bytes，统计每一个byte出现的次数->map[key, value]

        Map<Byte, Integer> counts = new HashMap();

        for(byte b: bytes) {

            Integer count = counts.get(b);    //

            if(count == null) {    // Map中还没有这个字符数据, 第一次

                counts.put(b, 1);

            } else {

                counts.put(b, count + 1);

            }

        }

        // 把每个键值对转成一个Node对象， 并加入到nodes集合

        for(Map.Entry<Byte, Integer> entry: counts.entrySet()) {

            nodes.add(new Node(entry.getKey(), entry.getValue()));

        }

        return nodes;

    }

    // 通过List创建赫夫曼树

    private static Node createHuffmanTree(List<Node> nodes) {

        while(nodes.size() > 1) {

            Collections.sort(nodes);

            Node leftNode = nodes.get(0);

            Node rightNode = nodes.get(1);

            Node parent = new Node(null, leftNode.weight + rightNode.weight);

            parent.left = leftNode;

            parent.right = rightNode;

            nodes.remove(leftNode);

            nodes.remove(rightNode);

            nodes.add(parent);

        }

    return nodes.get(0);

    }

}

class Node implements Comparable<Node>{

    Byte data;// 存放数据本身

    int weight; // 权值，字符出现的次数

    Node left;

    Node right;

    public Node(Byte data, int weight) {

        this.data = data;

        this.weight = weight;

    }

    @Override

    public int compareTo(Node o) {

        // TODO Auto-generated method stub

        return this.weight - o.weight;

    }

    @Override

    public String toString() {

        return "Node [data = " + data + " weight= " + weight + "]";

    }

    // 前序遍历

    public void preOrder() {

        System.out.println(this);

        if(this.left != null) {

            this.left.preOrder();

        }

        if(this.right != null) {

            this.right.preOrder();

        }

    }

}

仅供参考，有错误还请指出！

有什么想法，评论区留言，互相指教指教。

觉得不错的可以点一下右边的推荐哟

Java 树结构实际应用二（哈夫曼树和哈夫曼编码）的更多相关文章

Java数据结构（十二）—— 霍夫曼树及霍夫曼编码
霍夫曼树基本介绍和创建基本介绍又称哈夫曼树,赫夫曼树给定n个权值作为n个叶子节点,构造一棵二叉树,若该树的带权路径长度(wpl)达到最小,称为最优二叉树霍夫曼树是带权路径长度最短的树,权值较 ...
数据结构图文解析之：哈夫曼树与哈夫曼编码详解及C++模板实现
0. 数据结构图文解析系列数据结构系列文章数据结构图文解析之:数组.单链表.双链表介绍及C++模板实现数据结构图文解析之:栈的简介及C++模板实现数据结构图文解析之:队列详解与C++模板实现 ...
java实现哈弗曼树和哈夫曼树压缩
本篇博文将介绍什么是哈夫曼树,并且如何在java语言中构建一棵哈夫曼树,怎么利用哈夫曼树实现对文件的压缩和解压.首先,先来了解下什么哈夫曼树. 一.哈夫曼树哈夫曼树属于二叉树,即树的结点最多拥有2个 ...
10: java数据结构和算法: 构建哈夫曼树, 获取哈夫曼编码, 使用哈夫曼编码原理对文件压缩和解压
最终结果哈夫曼树,如图所示: 直接上代码: public class HuffmanCode { public static void main(String[] args) { //获取哈夫曼树并显 ...
C语言数据结构之哈夫曼树及哈夫曼编码的实现
代码清单如下: #pragma once #include<stdio.h> #include"stdlib.h" #include <string.h> ...
04-树6. Huffman Codes--优先队列（堆）在哈夫曼树与哈夫曼编码上的应用
题目来源:http://www.patest.cn/contests/mooc-ds/04-%E6%A0%916 In 1953, David A. Huffman published his pap ...
c++实现哈夫曼树，哈夫曼编码，哈夫曼解码（字符串去重，并统计频率）
#include <iostream> #include <iomanip> #include <string> #include <cstdlib> ...
Java 树结构实际应用四（平衡二叉树/AVL树）
平衡二叉树(AVL 树) 1 看一个案例(说明二叉排序树可能的问题) 给你一个数列{1,2,3,4,5,6},要求创建一颗二叉排序树(BST), 并分析问题所在.  左边 BST 存在的问题分析: ...
(哈夫曼树)HuffmanTree的java实现
参考自:http://blog.csdn.net/jdhanhua/article/details/6621026 哈夫曼树哈夫曼树(霍夫曼树)又称为最优树. 1.路径和路径长度在一棵树中,从一个结 ...

随机推荐

HDU 6395 Sequence（分段矩阵快速幂）题解
题意: 已知$A,B,C,D,P,n$以及 \[\left\{ \begin{aligned} & F_1 = A \\ & F_2 = B\\ & F_n = C*F_{ ...
Linux的IO调度程序
Linux的IO调度机制浅析现代计算机体系中,磁盘的速度和CPU的速度差距太大了,如果简单的将系统的IO请求按照请求的顺序进行顺序处理的话,系统的IO开销将导致系统的效率十分的低下,因此就需要将IO ...
element-ui UI 组件库剖析
element-ui UI 组件库剖析 /* Automatically generated by './build/bin/build-entry.js' */ https://github.com ...
js console API All In One
js console API All In One const log = console.log; for(const key in console) { log(`navigator.${key} ...
React PureComponent All In One
React PureComponent All In One import React, { // useState, // useEffect, // Component, PureComponen ...
React Hooks 实现一个计时器组件
React Hooks 实现一个计时器组件 useEffect https://reactjs.org/docs/hooks-reference.html#useeffect import React ...
how to install MySQL on macOS
how to install MySQL on macOS MySQL Community Server 8.0.21 # version $ mysqladmin --version # 8.0.2 ...
Make one your own Online Video Recorder by using WebRTC & vanilla javascript
Make one your own Online Video Recorder by using WebRTC & vanilla javascript Online Video Record ...
css & auto height & overflow: hidden;
css & auto height & overflow: hidden; {overflow: hidden; height: 100%;} is the panacea! {溢出: ...
css var & auto width css triangle
css var & auto width css triangle https://codepen.io/xgqfrms/pen/PooeEbd css var https://codepen ...

Java 树结构实际应用 二（哈夫曼树和哈夫曼编码）

Java 树结构实际应用 二（哈夫曼树和哈夫曼编码）的更多相关文章

随机推荐

热门专题

Java 树结构实际应用二（哈夫曼树和哈夫曼编码）

Java 树结构实际应用二（哈夫曼树和哈夫曼编码）的更多相关文章