在元素的装载数量明确的时候HashMap的大小应该如何选择。

今天看到美团招聘给出了一道小题目，关于HashMap的性能问题。问题如下：

java hashmap，如果确定只装载100个元素，new HashMap(?)多少是最佳的，why？

要回答这个问题，首先得知道影响HashMap性能的参数有哪些。咱们翻翻JDK。

在JDK6中是这么描述的：

HashMap的实例有两个参数影响其性能：初始容量和加载因子。

首先我们来看初始容量和加载因子的定义。

容量是哈希表中桶的数量，初始容量只是哈希表在创建时的容量。

加载因子是哈希表在其容量自动增加之前可以达到多满的一种尺度。

当哈希表中条目的数目超过容量乘加载因子的时候，则要对该哈希表进行rehash操作，从而哈希表将具有大约两倍的桶数。（以上摘自JDK6）

HashMap默认的加载因子是0.75 .它在时间和空间成本上寻求了一种折中。

回到本文的问题。根据JDK中的描述，如果这个只装载100个元素的HashMap没有特殊的用途，那么为了在时间和空间上达到最佳性能，HashMap的初始容量可以设为

100/0.75 = 133.33。为了防止rehash，向上取整，为134。

但是还有另外一个问题，就是hash碰撞的问题。如果我们将HashMap的容量设置为134，那么如何保证其中的哈希碰撞会比较少呢？

除非重写hashcode()方法，否则，似乎没有办法保证。

那么这里不得不提HashMap如何为元素选择下标的方法了。

    static int indexFor(int h, int length) {

        return h & (length-1);

    }

其中h为key哈希后得到的值，length为哈希表的长度。

134-1 = 128 + 6 -1；

那么 length-1的二进制值的最后3位为101；

假设这100个装载的元素中他们的key在哈希后有得到两个值（h），他们的二进制值除了低3位之外都相同，而第一个值的低3位为011，第二个值的低3位为001；

这时候进行java的&预算，011 & 101 = 001 ；001 & 101 = 001；

他们的值相等了，那么这个时候就会发生哈希碰撞。

除此之外还有一个更加严重的问题，由于在101中第二位是0，那么，无论我们的key在哈希运算之后得到的值h是什么，那么在&运算之后，得到的结果的倒数第二位均为0；

因此，对于hash表所有下标的二进制的值而言，只要低位第二位的值为1，（例如0010,0011,0111,1111）那么这个下标所代表的桶将一直是空的，因为代码中的&运算的结果永远不会产生低位第二位为1的值。这就大大地浪费了空间，同时还增加了哈希碰撞的概率。这无疑会降低HashMap的效率。

那么如何才能减少这种浪费呢？最佳的方法当然是让length-1的二进制值全部位均为1.那么length的值是多少合适呢？

没错，length=2^n。

只要将hash表的长度设为2的N次方，那么，所有的哈希桶均有被使用的可能。

再次回到美团提出的问题，与134最靠近的2^n无疑是128。

如果只修改HashMap的长度而不修改HashMap的加载因子的话，HashMap会进行rehash操作，这是一个代价很大的操作，所以不可取。

那么应该选择的就应该是256。

而由于空间加大和有效利用哈希桶，这时的哈希碰撞将大大降低，因此HashMap的读取效率会比较高。

所以，最后结论就是：HashMap的大小应该设置为256。

结果的补充：其实在Java中，无论你的HashMap(x)中的x设置为多少，HashMap的大小都是2^n。2^n是大于x的第一个数。因为HashMap的初始化代码中有以下这行代码：

 int capacity = 1;

        while (capacity < initialCapacity)

            capacity <<= 1;

但是这就带来了一个问题，如果x=100，那么HashMap的初始大小应该是128.但是100/128=0.78，已经超过默认加载因子(0.75)的大小了。因此会resize一次，变成256。所以最好的结果还是256。

最后发个参考链接：http://www.iteye.com/topic/539465

另，总结StringBuffer、ArrayList、HashMap的扩容：

StringBuffer:内部实现是一个字符数组。初始默认大小为16，当然也可以在其构造方法中进行设置。当新添加字符或字符串时，发现数组容量不够。这个时候就需要使用Array.copyOf()方法进行扩充。扩充的新的数组大小等于，（原始容量*2+2）和（数组实际字符个数+新增的字符长度）之间的较大值。

ArrayList:内部实现是一个Object的数组。初始默认大小为0，当然也可以在其构造方法中设置。当添加一个Object时，默认扩充数组容量为10。然后每次扩充的新的数组大小等于，（原始容量*3/2）和（数组的长度+1）之间的较大值。根据每次增加一个Object，可得该情况每次扩充的固定大小为3/2。当初始大小为手动设置的时候，每次扩充的新的数组大小等于，（原始容量*3/2）和（数组的长度+1）之间的较大值。

HashMap:内部实现是一个Entry的数组，默认大小是空的数组。初始化的容量是16，加载因子是3/4(当数组元素数量大于总容量的加载因子的时候，扩充数组)。当默认不是空的数组时，当达到加载因子的比例的时候，每次扩充初始容量的2倍

关于HashMap初始化容量问题的更多相关文章

HashMap初始化容量过程
集合是Java开发日常开发中经常会使用到的,而作为一种典型的K-V结构的数据结构,HashMap对于Java开发者一定不陌生.在日常开发中,我们经常会像如下方式以下创建一个HashMap: Map&l ...
hashmap 为什么初始化容量是2的幂次方
个人理解做下记录,不正确的地方望不吝赐教这是hashmap初始化容量时候对容量大小做的处理,保证初始化容量为最近的2的幂次方(JDK1.8) static final int tableSize ...
阿里巴巴Java开发手册建议创建HashMap时设置初始化容量，但是多少合适呢？
集合是Java开发日常开发中经常会使用到的,而作为一种典型的K-V结构的数据结构,HashMap对于Java开发者一定不陌生. 关于HashMap,很多人都对他有一些基本的了解,比如他和hashtab ...
为什么要指定HashMap的容量？HashMap指定容量初始化后，底层Hash数组已经被分配内存了吗？
为什么要指定HashMap的容量? 首先创建HashMap时,指定容量比如1024后,并不是HashMap的size不是1024,而是0,插入多少元素,size就是多少: 然后如果不指定HashMap ...
jdk1.8 HashMap底层数据结构：深入解析为什么jdk1.8 HashMap的容量一定要是2的n次幂
前言 1.本文根据jdk1.8源码来分析HashMap的容量取值问题: 2.本文有做 jdk1.8 HashMap.resize()扩容方法的源码解析:见下文“一.3.扩容:同样需要保证扩容后的容量是 ...
为什么jdk1.8 HashMap的容量一定要是2的n次幂
一.jdk1.8中,对“HashMap的容量一定要是2的n次幂”做了严格控制 1.默认初始容量: [Java] 纯文本查看复制代码 ? 1 2 3 4 /** * The default init ...
我说HashMap初始容量是16，面试官让我回去等通知
众所周知HashMap是工作和面试中最常遇到的数据类型,但很多人对HashMap的知识止步于会用的程度,对它的底层实现原理一知半解,了解过很多HashMap的知识点,却都是散乱不成体系,今天一灯带你一 ...
Java 中 HashMap 初始化时赋值
1.HashMap 初始化的文艺写法 HashMap 是一种常用的数据结构,一般用来做数据字典或者 Hash 查找的容器.普通青年一般会这么初始化:HashMap<String, Strin ...
HashMap的容量大小增长原理（JDK1.6/1.7/1.8）
. 前言 HashMap的容量大小会根据其存储数据的数量多少而自动扩充,即当HashMap存储数据的数量到达一个阈值(threshold)时,再往里面增加数据,便可能会扩充HashMap的容量. 可能 ...

随机推荐

SQL Server 2012不支持Microsoft Visual Studio Test Controller 2010
折腾了一个上午, 发现Test Controller怎么都连不上SQL. 能尝试的都尝试了, 觉得应该看看是不是有不支持的问题. 找到了这篇. TFS 2010 will not support ...
DNS named.conf文件详解
配置文件: /etc/named.conf /在NAMED.CONF 配置文件中使用//和/* */来进行注释, options { /*OPTIONS选项用来定义一些影响整个DNS服 ...
使用BeyondCompare比较文件夹下的文件时，相同的文件内容，但显示为不相同
主要原因是: 两个文件行尾标题不一致而导致的,一个是PC,一个是Unix 解决办法: 随便比较文件夹中的两个文件,点击规则,去掉比较行尾(pc/mac/unix)选项,点击确认,回到文件夹比较界面,刷 ...
转：修改Android签名证书keystore的密码、别名alias以及别名密码
转自:http://blog.k-res.net/archives/1671.html 二月 5, 2014 | Posted by K-Res 之前在测试Eclipse ADT的Custom ...
Scheme 4 Javaer-3.高阶函数
1.3 Formulating Abstractions with Higher-Order Procedures 教材有时候依照学生的基础.从0讲起:有时候给出一个大图,然后具体地逐一介绍. 本文 ...
VS中的代码拖放
平时数据操作中,我们经常在选择文件,由于数据太多.数据目录太深,选择数据文件到TextBox中非常不方便,于是就想让控件支持拖放数据,很多软件都支持这个功能,非常实用. 在ArcGIS10.x开发平台 ...
虚拟机chrome os 没有可用网络错误
从http://chromeos.hexxeh.net/ 下载了一个chrome os的VM版本的,在VM9上打开运行,一直提示没有可用网络解决方案查看虚拟机的网络设置设置为 NAT方式查看主机 ...
html5图像、图片处理【转】
本文主题情人节在网上看到国外JS牛人利用HTML5技术实现的一朵玫瑰花,深切的感受到HTML5技术的强大.本着学习的态度看了一下那朵玫瑰花的源代码,其中用到的HTML5技术是canvas标签,于是灵 ...
TP框架中如何使用SESSION限制登录？
TP框架中如何使用SESSION限制登录? 之前总是被问题今天才明白,最高效的来做页面访问限制问题. OOP思想中的继承特性,实现验证,是否已经登录,不必每个页面都进行判断. 实现如下: 继承Cont ...
JSTL核心标签
JSTL 核心标签库标签共有13个,功能上分为4类: 1.表达式控制标签:out.set.remove.catch 2.流程控制标签:if.choose.when.otherwise 3.循环标签:f ...

关于HashMap初始化容量问题

在元素的装载数量明确的时候HashMap的大小应该如何选择。

关于HashMap初始化容量问题的更多相关文章

随机推荐

热门专题