一、关于Huffman树

Huffman树(哈夫曼树)可以解决下述问题:

  • 一颗\(n\)个叶节点的\(k\)叉树,第\(i\)个叶节点的权值为\(w_i\),现在欲求\(\sum w_i\times l_i\)的最小值,其中\(l_i\)表示第\(i\)个叶子节点到根结点的距离。

二、具体实现

为了保证\(\sum w_i\times l_i\)最小,我们应该保证权值越大的叶节点深度越小。可以看出,这是很简单的贪心思想。

特殊地,我们可以先从二叉Huffman树开始研究。二叉Huffman树的实现过程如下:

1.构造一个小根堆,依次插入这\(n\)个节点的权值。

2.从堆内依次取出权值最小的两个节点\(w_1,w_2\),令\(ans+=w_1+w_2\)。

3.把\(w_1+w_2\)作为新的节点\(w_3\),并插入到堆中。此时\(w_3\)为\(w_1,w_2\)的父亲节点。

4.重复上述操作,直到堆的大小等于1。

Huffman树并没有真正的建立一棵树,只是在操作的时候形成一棵树的结构。

下图是二叉Huffman树的具体执行过程:最终ans=33。

  1. for(int i=1;i<n;i++){//n个数,操作(n-1)次
  2. int x=q.top();q.pop();
  3. int y=q.top();q.pop();
  4. q.push(x+y);
  5. ans+=x+y;
  6. }

例1:P1090 合并果子

分析:

因为多多每次合并消耗的体力等于要合并的两堆果子的重量之和,所以最终消耗的体力就是每堆果子的重量\(\times\)合并的次数。这正符合Huffman树能解决的问题类型。

代码如下:

  1. #include<bits/stdc++.h>
  2. using namespace std;
  3. priority_queue<int,vector<int>,greater<int> > q;//小根堆
  4. int a[10010],ans;
  5. int main()
  6. {
  7. int n;
  8. scanf("%d",&n);
  9. for(int i=1;i<=n;i++){
  10. scanf("%d",&a[i]);
  11. q.push(a[i]);
  12. }
  13. while(n!=1){//重复操作直到只剩下一个节点
  14. int x=q.top();q.pop();
  15. int y=q.top();q.pop();
  16. q.push(x+y);
  17. ans+=x+y;
  18. n--;
  19. }
  20. printf("%d",ans);
  21. return 0;
  22. }

现在我们由二叉延伸到k叉Huffman树。此时将每次取出的2个数改为k个数。这时存在一个问题,在最后一次取值时,剩余的节点可能不足以取出k个。显然这样不是最优解,当我们任取Huffman树中一个深度最大的节点,并改为树根的子节点,此时\(\sum w_i \times l_i\)就会更小。

因此只有我们补加一些额外的空节点,并将这些空节点放置在最底层时才能保证贪心算法的正确性。

当\((n-1)mod(k-1)\neq 0\)时,我们还需要补充\((k-1)-(n-1)mod(k-1)\)个节点保证等式\((n-1)mod(k-1)=0\)成立。

例2:P2168 [NOI2015]荷马史诗

分析:

这道题构造的编码方式其实就是Huffman编码,我们把单词出现的次数作为Huffman树的叶节点的权值,然后求出k叉Huffman树即可。

代码如下:

  1. #include<bits/stdc++.h>
  2. #define ll long long
  3. using namespace std;
  4. struct node{
  5. ll h,w;
  6. bool operator <(const node &other)const{
  7. return (w!=other.w)? w>other.w:h>other.h;
  8. }
  9. };
  10. priority_queue<node> q;
  11. int n,k,sum;
  12. ll t,ans;
  13. int main()
  14. {
  15. scanf("%d%d",&n,&k);
  16. for(int i=1;i<=n;i++){
  17. scanf("%lld",&t);
  18. q.push((node){1,t});
  19. }
  20. if((n-1)%(k-1)) sum=(k-1)-(n-1)%(k-1);
  21. for(int i=1;i<=sum;i++) q.push((node){1,0});
  22. sum+=n;
  23. while(sum!=1){
  24. ll partw=0,maxh=0;
  25. for(int i=1;i<=k;i++){
  26. node now=q.top();q.pop();
  27. partw+=now.w;
  28. maxh=max(maxh,now.h);
  29. }
  30. ans+=partw;
  31. q.push((node){maxh+1,partw});
  32. sum-=(k-1);
  33. }
  34. printf("%lld\n%lld",ans,q.top().h-1);
  35. return 0;
  36. }

[算法]Huffman树(哈夫曼树)的更多相关文章

  1. Huffman Tree (哈夫曼树学习)

    WPL 和哈夫曼树 哈夫曼树,又称最优二叉树,是一棵带权值路径长度(WPL,Weighted Path Length of Tree)最短的树,权值较大的节点离根更近. 首先介绍一下什么是 WPL,其 ...

  2. 树-哈夫曼树(Huffman Tree)

    概述 哈夫曼树:树的带权路径长度达到最小. 构造规则 1. 将w1.w2.-,wn看成是有n 棵树的森林(每棵树仅有一个结点): 2. 在森林中选出根结点的权值最小的两棵树进行合并,作为一棵新树的左. ...

  3. 【算法】赫夫曼树(Huffman)的构建和应用(编码、译码)

    参考资料 <算法(java)>                           — — Robert Sedgewick, Kevin Wayne <数据结构>       ...

  4. [C++]哈夫曼树(最优满二叉树) / 哈夫曼编码(贪心算法)

    一 哈夫曼树 1.1 基本概念 算法思想 贪心算法(以局部最优,谋求全局最优) 适用范围 1 [(约束)可行]:它必须满足问题的约束 2 [局部最优]它是当前步骤中所有可行选择中最佳的局部选择 3 [ ...

  5. 经典树与图论(最小生成树、哈夫曼树、最短路径问题---Dijkstra算法)

    参考网址: https://www.jianshu.com/p/cb5af6b5096d 算法导论--最小生成树 最小生成树:在连通网的所有生成树中,所有边的代价和最小的生成树,称为最小生成树. im ...

  6. 哈夫曼树(三)之 Java详解

    前面分别通过C和C++实现了哈夫曼树,本章给出哈夫曼树的java版本. 目录 1. 哈夫曼树的介绍 2. 哈夫曼树的图文解析 3. 哈夫曼树的基本操作 4. 哈夫曼树的完整源码 转载请注明出处:htt ...

  7. 哈夫曼树(二)之 C++详解

    上一章介绍了哈夫曼树的基本概念,并通过C语言实现了哈夫曼树.本章是哈夫曼树的C++实现. 目录 1. 哈夫曼树的介绍 2. 哈夫曼树的图文解析 3. 哈夫曼树的基本操作 4. 哈夫曼树的完整源码 转载 ...

  8. 哈夫曼树(一)之 C语言详解

    本章介绍哈夫曼树.和以往一样,本文会先对哈夫曼树的理论知识进行简单介绍,然后给出C语言的实现.后续再分别给出C++和Java版本的实现:实现的语言虽不同,但是原理如出一辙,选择其中之一进行了解即可.若 ...

  9. 哈夫曼树——c++

    哈夫曼树的介绍 Huffman Tree,中文名是哈夫曼树或霍夫曼树,它是最优二叉树. 定义:给定n个权值作为n个叶子结点,构造一棵二叉树,若树的带权路径长度达到最小,则这棵树被称为哈夫曼树. 这个定 ...

随机推荐

  1. Journal of Proteomics Research | 利用混合蛋白质组模型对MBR算法中错误转移鉴定率的评估

    题目:Evaluating False Transfer Rates from the Match-between-Runs Algorithm with a Two-Proteome Model 期 ...

  2. VMWARE虚拟机安装系统提示CPU已被客户机操作系统禁用和secureCUT乱码

    错误:VMWARE虚拟机安装系统提示CPU已被客户机操作系统禁用 改正:找到虚拟机的位置找到下图灰色的部分:打开 .vmx后缀的操作系统配置文件,加入以下代码: cpuid.1.eax = :: 2. ...

  3. 记录一次云主机部署openstack的血泪史

    看见这个部署成功的留下了激动的泪水 经过长时间的BUG苦肝终于成功部署成功  部署的环境2vCPU 8GB 阿里云主机,部署成功以后内存占用确实蛮高的 记录这一次踩坑,给后来者避免踩坑时间,个人踩坑踩 ...

  4. HTML中的IE条件注释,让低版本IE也能正常运行HTML5+CSS3网站的3种解决方案

    最近的项目中,因为需要兼容IE7,IE8,IE9,解研究了IE的条件注释,顺手写下来备忘.  HTML中的IE条件注释 IE条件注释是一种特殊的HTML注释,这种注释只有IE5.0及以上版本才能理解. ...

  5. 微信开发+百度AI学习:环境搭建

    注册成为百度开发者,百度接入指南http://ai.baidu.com/docs#/Begin/top 选择分类进去创建应用,接口权限全部选择好了,这样就可以只创建一个应用就有全部接口权限. C#开发 ...

  6. [dp]牛牛与数组

    时间限制:C/C++ 1秒,其他语言2秒 空间限制:C/C++ 32768K,其他语言65536K 64bit IO Format: %lld 题目描述 牛牛喜欢这样的数组: 1:长度为n 2:每一个 ...

  7. 从sslyze看TLS证书的点点滴滴

    纵观眼下,https已经深入大街小巷,成为网络生活中不可或缺的一部分了.提到了https,我们又不得不想到TLS(SSL),而提到了TLS,我们又不得不提到一个让人捉摸不透的东西:TLS证书. 关于证 ...

  8. 探索学习率设置技巧以提高Keras中模型性能 | 炼丹技巧

      学习率是一个控制每次更新模型权重时响应估计误差而调整模型程度的超参数.学习率选取是一项具有挑战性的工作,学习率设置的非常小可能导致训练过程过长甚至训练进程被卡住,而设置的非常大可能会导致过快学习到 ...

  9. random方法

    random.randint(1,10)     # 产生 1 到 10 的一个整数型随机数 ,包括1和10random.random()        # 产生 0 到 1 之间的随机浮点数rand ...

  10. Dome_iptest_server

    一个简单的ip测试服务器 打印返回 请求头request import socket def send_data(conn, data=None, status=200): if status != ...