HashMap的底层数据结构

  • 1.7之前是:数组+链表
    数组的元素是Map.Entiry对象
    当出现哈希碰撞的时候,使用链表解决,
    先计算出key对应的数组的下标,这个数组的这个位置上为空,直接放入,
    如果不为空而且出现哈希碰撞,就把元素添加到链表的头部的,
    new Entry(key,value,table[i]);这样这个Entry就是链表的头部了,然后放到数组的index位置上。

  • 1.8是:数组+链表+红黑树
    数组的元素是Map.Node对象继承Map.Entry包含属性有:
    当前node对象的hash值,
    当前node对象的key,
    当前node对象的下一个节点对象next,
    当前node对象的value

  • 1.8为什么使用数组+链表+红黑树?
    因为如果一个hashmap在同一个数组位置上出现hash碰撞过多,那么这个链表的长度会很长,
    插入块,但是查询因为使用的遍历所以会比较慢。

HashMap的大致结构


HashMap的关键属性有哪些?

  • 数组的默认大小16
  • 数组的最大为2的30次方
  • 扩容因子0.75
  • threshold
  • 当前数组的大小

初始大小或者扩容的数组大小为什么一定是2的次幂?

因为计算key的下标的时候使用的是:key的hashcode值 &(按位与) 数组的长度-1 ,
固定为2的次幂能保证碰撞几率小。

怎么通过key计算得到数组的下标的?

key的hashcode值 & 数组的长度-1 ;
& (与运算)

hashMap的大小是怎么计算的?

  • 有一个全局变量size,每次put的时候++,remove的时候--;

HashMap中Put方法的工作原理

  • 获取key的hashCode()值,通过位运算得到数组的下标。
  • 如果该位置上为空直接放入该数组的下标位置。
  • 如果不为空出现了碰撞,去遍历链表或者树,利用key的equal()方法是否存在相同的节点,如果相同就覆盖,不相同就放到链表的尾部。
  • 如果碰撞导致链表过长,长度大于等于8,就把链表转换成红黑树;
  • 如果数组的容量超过了总容量*负载因子的值,就要resize。

HashMap中Get方法的工作原理

bucket里的第一个节点,直接命中;
如果有冲突,则通过key.equals(k)去查找对应的entry
若为树,则在树中通过key.equals(k)查找,O(logn);
若为链表,则在链表中通过key.equals(k)查找,O(n)。

什么是哈希冲突?

哈希表在新增元素的时候首先会根据hash函数算出这个元素存放的数组的位置,
但是,有可能存在不同的key值得到相同的数组位置(两个元素的HashCode值相同),这个时候就是哈希冲突。

HashMap怎么处理哈希冲突(哈希碰撞的)

动态数组+链表(单向)的方式。

如果某个位置上的链表很长,会影响检索,JDK1.8引入了当链表的长度大于8的时候会将链表动态替换为一个红黑树,增加了搜索性能。
等于说由:数组+链表

变成了数组+链表+红黑树

HashMap中的数组什么时候扩容(rehash)

当HashMapde的长度超出了负载因子与当前容量的乘积(默认16*0.75=12)时,
通过调用resize方法重新创建一个原来HashMap大小的2倍的newTable数组,
并将原先table的元素全部移到newTable里面,重新计算hash,然后再重新根据hash分配位置,,最大扩容为2的30次方+1。
负载因子默认是:0.75

你了解重新调整HashMap大小存在什么问题吗

多线程环境下,有可能多个线程同时进行resize,在这过程中,可能产生死锁或者死循环。
具体原因不清楚。

多线程下的HashMap

HashMap是线程不安全的,所以在多线程的环境中我们需要寻找替代方案:

  • 使用Map m = Collections.synchronizedMap(new HashMap(...));实现同步
  • 使用java.util.HashTable,效率最低(因为所有的方法都是同步的,几乎被淘汰了)
  • 使用java.util.concurrent.ConcurrentHashMap,相对安全,效率高(建议使用)

Fail-Fast 机制

Fail-fast 机制是 java 集合(Collection)中的一种错误机制,
java.util.HashMap 不是线程安全的,如果在使用迭代器的过程中有其他线程修改了 map,
那么将抛出 ConcurrentModificationException,这就是所谓 fail-fast 策略
这一策略在源码中的实现是通过 modCount 也就是修改次数实现的。

与之关联的面试题:
遇到过ConcurrentModficationException(并发修改异常)异常吗?为什么会出现?如何解决?

HashMap和Hashtable的区别

  • 主要区别:Hashtable是线程安全,而HashMap则非线程安全。
  • HashMap可以使用null作为key,而Hashtable则不允许null作为key
  • HashMap的迭代器(Iterator)是fail-fast迭代器,而Hashtable的enumerator迭代器不是fail-fast的
    就是当有其它线程改变了HashMap的结构(增加或者移除元素),将会抛出ConcurrentModificationException
  • 由于Hashtable是线程安全的也是synchronized,所以在单线程环境下它比HashMap要慢

资源

小灰灰的讲解

一文搞定HashMap的实现原理和面试

HashMap工作原理及实现

必懂知识——HashMap的实现原理的更多相关文章

  1. Java面试必问之Hashmap底层实现原理(JDK1.7)

    1. 前言 Hashmap可以说是Java面试必问的,一般的面试题会问: Hashmap有哪些特性? Hashmap底层实现原理(get\put\resize) Hashmap怎么解决hash冲突? ...

  2. Java面试必问之Hashmap底层实现原理(JDK1.8)

    1. 前言 上一篇从源码方面了解了JDK1.7中Hashmap的实现原理,可以看到其源码相对还是比较简单的.本篇笔者和大家一起学习下JDK1.8下Hashmap的实现.JDK1.8中对Hashmap做 ...

  3. 面试必问:HashMap 底层实现原理

    HashMap是在面试中经常会问的一点,很多时候我们仅仅只是知道HashMap他是允许键值对都是Null,并且是非线程安全的,如果在多线程的环境下使用,是很容易出现问题的. 这是我们通常在面试中会说的 ...

  4. 2018年Fintech金融科技关键词和入行互金从业必懂知识

    2018年过去大半,诸多关键词进入眼帘: 5G,消费降级,数据裸奔,新零售,AI,物联网,云计算,合规监管,风控,割韭菜,区块链,生物识别,国民空闲时间以及金融科技. 这些词充斥着我们的生活和时间,而 ...

  5. 从代码层读懂 Java HashMap 的实现原理

    概述 Hashmap继承于AbstractMap,实现了Map.Cloneable.Java.io.Serializable接口.它的key.value都可以为null,映射不是有序的.Hashmap ...

  6. 深度剖析HashMap的数据存储实现原理(看完必懂篇)

    深度剖析HashMap的数据存储实现原理(看完必懂篇) 具体的原理分析可以参考一下两篇文章,有透彻的分析! 参考资料: 1. https://www.jianshu.com/p/17177c12f84 ...

  7. Java基础知识强化之集合框架笔记79:HashMap的实现原理

    1. HashMap的实现原理之 HashMap数据结构: HashMap是对数据结构中哈希表(Hash Table)的实现, Hash表又叫散列表.Hash表是根据关键码Key来访问其对应的值Val ...

  8. 优秀后端架构师必会知识:史上最全MySQL大表优化方案总结

    本文原作者“ manong”,原创发表于segmentfault,原文链接:segmentfault.com/a/1190000006158186 1.引言   MySQL作为开源技术的代表作之一,是 ...

  9. 牛客网Java刷题知识点之HashMap的实现原理、HashMap的存储结构、HashMap在JDK1.6、JDK1.7、JDK1.8之间的差异以及带来的性能影响

    不多说,直接上干货! 福利 => 每天都推送 欢迎大家,关注微信扫码并加入我的4个微信公众号:   大数据躺过的坑      Java从入门到架构师      人工智能躺过的坑          ...

随机推荐

  1. Jmeter4.0---- 修改jmeter源代码(18)

    1.说明 jmeter本身功能很强大,但是在使用的时候我们会发现有些想法jmeter无法帮我们实现,这个时候就需要我们细节去修改一下它的源代码,来满足我们的需求. * 仅供参考 2.步骤 第一步: j ...

  2. Python脚本:Linux自动化执行Python脚本

    1.环境及其工具: ubuntu 16.04 python2.7(自带) pip2.7(安装) virtualenv(安装) crontab (自带) 2.pip2.7安装 (1)尝试使用 sudo ...

  3. SIP 3pcc

    3PCC全称Third Party Call Control,中文即第三方电话呼叫控制,指的是由第三方控制者在另外两者之间建立一个会话,由控制者负责会话双方的媒体协商.3PCC是一种非常灵活的会话控制 ...

  4. canvas学习之初级运用

    <html> <head> <meta charset=utf-8> <title>绘制简单图形</title> <style typ ...

  5. js对象中属性调用.和[] 两种方式的区别

    JS 调用属性一般有两种方法——点和中括号的方法. 标准格式是对象.属性(不带双引号),注意一点的是:js对象的属性,key标准是不用加引号的,加也可以,特别的情况必须加,如果key数字啊,表达式啊等 ...

  6. php实现多进程、多线程

    孤儿进程:一个父进程退出,而它的一个或多个子进程还在运行,那么那些子进程将成为孤儿进程.孤儿进程将被init进程(进程号为1)所收养,并由init进程对它们完成状态收集工作. 僵尸进程:一个进程使用f ...

  7. 17.SpringMVC核心技术-拦截器

    SpringMVC 中的 Interceptor 拦截器是非常重要和相当有用的,它的主要作用是拦截指定 的用户请求, 并进行相应的预处理与后处理.其拦截的时间点在“处理器映射器根据用户提 交的请求映射 ...

  8. DbHelper简单的使用

    using System; using System.Windows.Forms; using System.Data.SqlClient; namespace WindowsFormsApp3 { ...

  9. python异步编程 (转载)

    Python Async/Await入门指南   转自:https://zhuanlan.zhihu.com/p/27258289 本文将会讲述Python 3.5之后出现的async/await的使 ...

  10. Java通过JDBC连接SQL Server2017数据库

    一.需要明白的基础知识 数据库名 驱动jar(x表示版本号) 具体驱动类 连接字符串(ip地址,端口号,名字) Oracle ojdbc-x.jar oracle.jdbc.oracleDriver ...