测试代码:

  1. #include <iostream>
  2. using namespace std;
  3. #include <string>
  4. #include <windows.h>
  5. #include <string.h>
  6. #include <stdio.h>
  7. #include <stdlib.h>
  8. #include <time.h>
  9. #include <map>
  10. const int maxval = 2000000 * 5;
  11. #include <unordered_map>
  12. void map_test()
  13. {
  14. printf("map_test\n");
  15. map<int, int> mp;
  16. clock_t startTime, endTime;
  17. startTime = clock();
  18. for (int i = 0; i < maxval; i++)
  19. {
  20. mp[rand() % maxval]++;
  21. }
  22. endTime = clock();
  23. printf("%lf\n", (double)(endTime - startTime) / CLOCKS_PER_SEC);
  24. printf("insert finish\n");
  25. startTime = clock();
  26. for (int i = 0; i < maxval; i++)
  27. {
  28. if (mp.find(rand()%maxval) == mp.end())
  29. {
  30. //printf("not found\n");
  31. }
  32. }
  33. endTime = clock();
  34. printf("%lf\n", (double)(endTime - startTime) / CLOCKS_PER_SEC);
  35. printf("find finish\n");
  36. startTime = clock();
  37. for(auto it = mp.begin(); it!=mp.end(); it++)
  38. {
  39. }
  40. endTime = clock();
  41. printf("%lf\n", (double)(endTime - startTime) / CLOCKS_PER_SEC);
  42. printf("travel finish\n");
  43. printf("------------------------------------------------\n");
  44. }
  45. void hash_map_test()
  46. {
  47. printf("hash_map_test\n");
  48. unordered_map<int, int> mp;
  49. clock_t startTime, endTime;
  50. startTime = clock();
  51. for (int i = 0; i < maxval; i++)
  52. {
  53. mp[rand() % maxval] ++;
  54. }
  55. endTime = clock();
  56. printf("%lf\n", (double)(endTime - startTime) / CLOCKS_PER_SEC);
  57. printf("insert finish\n");
  58. startTime = clock();
  59. for (int i = 0; i < maxval; i++)
  60. {
  61. if (mp.find(rand() % maxval) == mp.end())
  62. {
  63. //printf("not found\n");
  64. }
  65. }
  66. endTime = clock();
  67. printf("%lf\n", (double)(endTime - startTime) / CLOCKS_PER_SEC);
  68. printf("find finish\n");
  69. startTime = clock();
  70. for(auto it = mp.begin(); it!=mp.end(); it++)
  71. {
  72. }
  73. endTime = clock();
  74. printf("%lf\n", (double)(endTime - startTime) / CLOCKS_PER_SEC);
  75. printf("travel finish\n");
  76. printf("------------------------------------------------\n");
  77. }
  78. int main(int argc, char *argv[])
  79. {
  80. srand(0);
  81. map_test();
  82. Sleep(1000);
  83. srand(0);
  84. hash_map_test();
  85. system("pause");
  86. return 0;
  87. }

详解:

map(使用红黑树)与unordered_map(hash_map)比较

    map理论插入、查询时间复杂度O(logn)

    unordered_map理论插入、查询时间复杂度O(1)


数据量较小时,可能是由于unordered_map(hash_map)初始大小较小,大小频繁到达阈值,多次重建导致插入所用时间稍大。(类似vector的重建过程)。

哈希函数也是有消耗的(应该是常数时间),这时候用于哈希的消耗大于对红黑树查找的消耗(O(logn)),所以unordered_map的查找时间会多余对map的查找时间。


数据量较大时,重建次数减少,用于重建的开销小,unordered_map O(1)的优势开始显现


数据量更大,优势更明显


使用空间:

前半部分为map,后半部分为unordered_map

unordered_map占用的空间比map略多,但可以接受。

map和unordered_map内部实现应该都是采用达到阈值翻倍开辟空间的机制(16、32、64、128、256、512、1024……)浪费一定的空间是不可避免的。并且在开双倍空间时,若不能从当前开辟,会在其他位置开辟,开好后将数据移过去。数据的频繁移动也会消耗一定的时间,在数据量较小时尤为明显。


一种方法是手写定长开散列。这样做在数据量较小时有很好地效果(避免了数据频繁移动,真正趋近O(1))。但由于是定长的,在数据量较大时,数据重叠严重,散列效果急剧下降,时间复杂度趋近O(n)。


一种折中的方法是自己手写unordered_map(hash_map),将初始大小赋为一个较大的值。扩张可以模仿STL的双倍扩张,也可以自己采用其他方法。这样写出来的是最优的,但是实现起来极为麻烦。

综合利弊,我们组采用unordered_map。


附:使用Dev测试与VS2017测试效果相差极大???

效率差了10倍???

原因:

Dev

VS2017

在Debug下,要记录断点等调试信息,的确慢。

Release:不对源代码进行调试,编译时对应用程序的速度进行优化,使得程序在代码大小和运行速度上都是最优的。

VS2017切到release后,还更快

除了前面说的Debug与release导致效率差异外,编译器的不同也会导致效率差异。

学到了。

福大软工1816 · 第五次作业 - 结对作业2_map与unordered map的比较测试的更多相关文章

  1. 福大软工1816 · 第五次作业 - 结对作业2_EXE图片_备用

    1_每日推荐界面.png 2_论文搜索界面.png 2_论文搜索界面_搜索功能.png 3_流行趋势_十大热词排名统计图.png 4_人物界面.png 5_我的收藏界面.png 6_设置界面.png ...

  2. 福大软工1816:Alpha事后诸葛

    福大软工·第十一次作业-Alpha事后诸葛亮 组长博客链接 本次作业博客链接 项目Postmortem 模板 设想和目标 我们的软件要解决什么问题?是否定义得很清楚?是否对典型用户和典型场景有清晰的描 ...

  3. 福大软工1816 · 课程计划预报(K班)

    实践课安排 对应教学周序 时间 内容 3 09.22 业界交流讲座 6 10.13 团队选题报告答辩 7 10.20 UML设计 8 10.27 团队项目需求答辩 11 11.17 团队现场编程实战与 ...

  4. 福大软工1816:Beta总结

    第三视角Beta答辩总结 博客链接以及团队信息 组长博客链接 成员信息(按拼音排序) 姓名 学号 备注 张扬 031602345 组长 陈加伟 031602204 郭俊彦 031602213 洪泽波 ...

  5. 福大软工1816:Alpha(10/10)

    Alpha 冲刺 (10/10) 队名:第三视角 组长博客链接 本次作业链接 团队部分 团队燃尽图 工作情况汇报 张扬(组长) 过去两天完成了哪些任务: 文字/口头描述: 1.和愈明.韫月一起对接 2 ...

  6. 福大软工1816:Beta(1/7)

    Beta 冲刺 (1/7) 队名:第三视角 组长博客链接 本次作业链接 团队部分 团队燃尽图 工作情况汇报 张扬(组长) 过去两天完成了哪些任务 文字/口头描述 答辩 组织会议 复习课本 展示GitH ...

  7. 福大软工1816:Alpha(3/10)

    Alpha 冲刺 (3/10) 队名:第三视角 组长博客链接 本次作业链接 团队部分 团队燃尽图 工作情况汇报 张扬(组长) 过去两天完成了哪些任务: 文字/口头描述: 1.学习qqbot库: 2.实 ...

  8. 福大软工1816 ·软工之404NoteFound团队选题报告

    目录 NABCD分析引用 N(Need,需求): A(Approach,做法): B(Benefit,好处): C(Competitors,竞争): D(Delivery,交付): 初期 中期 个人贡 ...

  9. 福大软工1816 - 404 Note Found选题报告

    目录 NABCD分析引用 N(Need,需求): A(Approach,做法): B(Benefit,好处): C(Competitors,竞争): D(Delivery,交付): 初期 中期 个人贡 ...

随机推荐

  1. Git-2.15.1.2-64-bit安装

    方法/步骤    我们在百度搜索git,然后在git的官网上找到git的下载页面,如下图所示.在首页在Downloads处选择下载Windows版本,当然您可以根据需求下载其他版本的安装文件.     ...

  2. git找回本地误删的文件或文件夹

    一:首先,我们先用git status 看看工作区的变化 application/Admin/Conf/config.php 如果要恢复文件记住这个 application 如果要恢复文件夹记住这个工 ...

  3. laravel4.2 union联合,join关联分组查询最新记录时,查询条件不对,解决方案

    需求: 分组联合查询,或者最新记录. 问题:  mysql分组的时候默认会查询第一条记录,存在gourp by时 order by 无效. 一般解决办法就是 ,select * from ( sele ...

  4. Scala 语法(一)

    (1)基本语法 变量 val var(可变变量): 数据类型 Byte,Char,Int,Short,Long,String(字符),Float,Double,Boolean(true,flase). ...

  5. 大数据学习之Hadoop环境搭建

    一.Hadoop的优势 1)高可靠性:因为Hadoop假设计算元素和存储会出现故障,因为它维护多个工作数据副本,在出现故障时可以对失败的节点重新分布处理. 2)高扩展性:在集群间分配任务数据,可方便的 ...

  6. core dump文件分析和调试

    core介绍 当程序运行的过程中异常终止或崩溃,操作系统会将程序当时的内存状态记录下来,保存在一个文件中,这种行为就叫做Core Dump(中文有的翻译成"核心转储").我们可以认 ...

  7. AMD,CMD,CommonJs,UMD讲解

    一.CommonJS CommonJS规范加载模块是同步的,只有加载完成,才能执行后面的操作 CommonJS规范中的module.exports和require 每个文件就是一个模块,有自己的作用域 ...

  8. solr环境搭建及java小demo

    一配置solr环境 1.下载solr 2.配置solr(最好单独分离出一个tomcat,一台机器启动多个tomcat参见:http://www.cnblogs.com/lxlwellaccessful ...

  9. 为什么我要放弃javaScript数据结构与算法(第十章)—— 排序和搜索算法

    本章将会学习最常见的排序和搜索算法,如冒泡排序.选择排序.插入排序.归并排序.快速排序和堆排序,以及顺序排序和二叉搜索算法. 第十章 排序和搜索算法 排序算法 我们会从一个最慢的开始,接着是一些性能好 ...

  10. 在线elasticsearch集群批量写入变慢,导致kafka消息消费延迟

    写入报错如些: -- ::24.166 [elasticsearch[_client_][listener][T#1]] INFO com.mobanker.framework.es.Elastics ...