unordered_map(hash_map)和map的比较

测试代码：

#include <iostream>

using namespace std;

#include <string>

#include <windows.h>

#include <string.h>

#include <stdio.h>

#include <stdlib.h>

#include <time.h>

#include <map>

const int maxval = 2000000 * 5;

#include <unordered_map>

void map_test()

{

	printf("map_test\n");

	map<int, int> mp;

	clock_t startTime, endTime;

	startTime = clock();

	for (int i = 0; i < maxval; i++)

	{

		mp[rand() % maxval]++;

	}

	endTime = clock();

	printf("%lf\n", (double)(endTime - startTime) / CLOCKS_PER_SEC);

	printf("insert finish\n");

	startTime = clock();

	for (int i = 0; i < maxval; i++)

	{

		if (mp.find(rand()%maxval) == mp.end())

		{

			//printf("not found\n");

		}

	}

	endTime = clock();

	printf("%lf\n", (double)(endTime - startTime) / CLOCKS_PER_SEC);

	printf("find finish\n");

	startTime = clock();

	for(auto it = mp.begin(); it!=mp.end(); it++)

	{

	}

	endTime = clock();

	printf("%lf\n", (double)(endTime - startTime) / CLOCKS_PER_SEC);

	printf("travel finish\n");

	printf("------------------------------------------------\n");

}

void hash_map_test()

{

	printf("hash_map_test\n");

	unordered_map<int, int> mp;

	clock_t startTime, endTime;

	startTime = clock();

	for (int i = 0; i < maxval; i++)

	{

		mp[rand() % maxval] ++;

	}

	endTime = clock();

	printf("%lf\n", (double)(endTime - startTime) / CLOCKS_PER_SEC);

	printf("insert finish\n");

	startTime = clock();

	for (int i = 0; i < maxval; i++)

	{

		if (mp.find(rand() % maxval) == mp.end())

		{

			//printf("not found\n");

		}

	}

	endTime = clock();

	printf("%lf\n", (double)(endTime - startTime) / CLOCKS_PER_SEC);

	printf("find finish\n");

	startTime = clock();

	for(auto it = mp.begin(); it!=mp.end(); it++)

	{

	}

	endTime = clock();

	printf("%lf\n", (double)(endTime - startTime) / CLOCKS_PER_SEC);

	printf("travel finish\n");

	printf("------------------------------------------------\n");

}

int main(int argc, char *argv[])

{

	srand(0);

	map_test();

	Sleep(1000);

	srand(0);

	hash_map_test();

	system("pause");

	return 0;

}

详解：

map(使用红黑树)与unordered_map(hash_map)比较

map理论插入、查询时间复杂度O(logn)

unordered_map理论插入、查询时间复杂度O(1)

数据量较小时，可能是由于unordered_map(hash_map)初始大小较小，大小频繁到达阈值，多次重建导致插入所用时间稍大。(类似vector的重建过程)。

哈希函数也是有消耗的（应该是常数时间），这时候用于哈希的消耗大于对红黑树查找的消耗(O(logn))，所以unordered_map的查找时间会多余对map的查找时间。

数据量较大时，重建次数减少，用于重建的开销小，unordered_map O(1)的优势开始显现

数据量更大，优势更明显

使用空间：

前半部分为map,后半部分为unordered_map

unordered_map占用的空间比map略多，但可以接受。

map和unordered_map内部实现应该都是采用达到阈值翻倍开辟空间的机制（16、32、64、128、256、512、1024……）浪费一定的空间是不可避免的。并且在开双倍空间时，若不能从当前开辟，会在其他位置开辟，开好后将数据移过去。数据的频繁移动也会消耗一定的时间，在数据量较小时尤为明显。

一种方法是手写定长开散列。这样做在数据量较小时有很好地效果（避免了数据频繁移动，真正趋近O(1)）。但由于是定长的，在数据量较大时，数据重叠严重，散列效果急剧下降，时间复杂度趋近O(n)。

一种折中的方法是自己手写unordered_map(hash_map)，将初始大小赋为一个较大的值。扩张可以模仿STL的双倍扩张，也可以自己采用其他方法。这样写出来的是最优的，但是实现起来极为麻烦。

综合利弊，我们组采用unordered_map。

附：使用Dev测试与VS2017测试效果相差极大？？？

效率差了10倍？？？

原因：

Dev

VS2017

在Debug下，要记录断点等调试信息，的确慢。

Release：不对源代码进行调试，编译时对应用程序的速度进行优化，使得程序在代码大小和运行速度上都是最优的。

VS2017切到release后，还更快

除了前面说的Debug与release导致效率差异外，编译器的不同也会导致效率差异。

学到了。

unordered_map(hash_map)和map的比较的更多相关文章

hash_map和map的区别
hash_map和map的区别分类: STL2008-10-15 21:24 5444人阅读评论(0) 收藏举报 class数据结构编译器存储平台tree 这里列几个常见问题,应该对你理解和使用 ...
C++中的hash_map和map的区别
hash_map和map的区别在哪里?构造函数.hash_map需要hash函数,等于函数:map只需要比较函数(小于函数). 存储结构.hash_map采用hash表存储,map一般采用红黑树(RB ...
boost::unordered_map 和 std::map 的效率与内存比较
例子链接:http://blog.csdn.net/gamecreating/article/details/7698719 结论: unordered_map 查找效率快五倍,插入更快,节省一定内存 ...
std::unordered_map与std::map
前者查找更快.后者自动排序,并可指定排序方式. 资料参考: https://blog.csdn.net/photon222/article/details/102947597
福大软工1816 · 第五次作业 - 结对作业2_map与unordered map的比较测试
测试代码: #include <iostream> using namespace std; #include <string> #include <windows.h& ...
STL中的map、unordered_map、hash_map
转自https://blog.csdn.net/liumou111/article/details/49252645 在之前使用STL时,经常混淆的几个数据结构,特别是做Leetcode的题目时,对于 ...
map、hash_map、unordered_map 的思考
#include <map> map<string,int> dict; map是基于红黑树实现的,可以快速查找一个元素是否存在,是关系型容器,能够表达两个数据之间的映射关系. ...
map vs hash_map
1. map, multimap, set, multiset g++ 中 map, multimap, set, multiset 由红黑树实现 map: bits/stl_map.h multim ...
c++ map unordered_map
map operator<的重载一定要定义成const.因为map内部实现时调用operator<的函数好像是const. #include<string> #include& ...

随机推荐

最完整的数据倾斜解决方案(spark)
一.了解数据倾斜数据倾斜的原理: 在执行shuffle操作的时候,按照key,来进行values的数据的输出,拉取和聚合.同一个key的values,一定是分配到一个Reduce task进行处理. ...
Set的源码分析
Set的内部实现其实是一个Map.即HashSet的内部实现是一个HashMap,TreeSet的内部实现是一个TreeMap,LinkedHashSet的内部实现是一个LinkedHashMap. ...
单片机-C语言-定义和申明
以下代码是单片机程序,51单片机,编译器为HT-IDE3000, 简单来说头文件中只能申明, 变量在头文件中申明时,要加上extern 这个关键字用来告诉编译器,变量在其它的文件中定义,为什么要在头 ...
#if、#if defined 的使用
#if的使用 if 后面接的是表达式 #if a==1 code -- #endif 如果#if后面的表达式能成立,就会把#if和#endif之间的代码编译进去 #if defined的使用 #if ...
jz_2440_电阻屏触摸驱动
驱动中: 入口函数init内: /* 1. 分配一个input_dev结构体 */ s3c_ts_dev = input_allocate_device(); /*------------------ ...
破解有道词典在线翻译接口--python
没什么好说的,直接上代码. import requests # import json import time import random import hashlib translate = inp ...
[原创]python写的sniffer
import socket s=socket.socket(socket.PF_PACKET,socket.SOCK_RAW,8) while 1: data=s.recv(65535) print ...
eclipse注释任务标记
一.概述 TODO: + 说明: 如果代码中有该标识,说明在标识处有功能代码待编写,待实现的功能在说明中会简略说明. FIXME: + 说明: 如果代码中有该标识,说明标识处代码需要修正,甚至代码是 ...
利用反射获取Model值
public ActionResult Base(UserModel Model) { Model.Tel = string.Format("{0}-{1}", Model.Are ...
C# 简单工厂
如下: public static IList<T> Create<T>(Type type) { if (type == typeof(List<T>)) { r ...

unordered_map(hash_map)和map的比较

测试代码：

详解：

unordered_map(hash_map)和map的比较的更多相关文章

随机推荐

热门专题