来看看面试必问的HashMap,一次彻底帮你搞定HashMap源码
HashMap结构
数组+链表+红黑树
链表大于8转红黑树,红黑树节点数小于6退回链表。
存放的key-value的Node节点
static class Node<K,V> implements Map.Entry<K,V> {
final int hash;
final K key;
V value;
Node<K,V> next;
}
树形结构的Node节点
static final class TreeNode<K,V> extends LinkedHashMap.Entry<K,V> {
TreeNode<K,V> parent; // red-black tree links
TreeNode<K,V> left;
TreeNode<K,V> right;
TreeNode<K,V> prev; // needed to unlink next upon deletion
boolean red;
}
他的继承结构是这样,可以看到继承了Node节点
看懂一条语句
hash & tab.length-1
代码中多处都可以看到这条代码,实际上这条语句只是做了一个取余(%)的动作。一个&怎么做的取余的操作:
HashMap的容量为2^n其二进制结构如下
任何数&2^n-1(01111…)其结果都是去0xxxx,做了快速取余的操作。后续会看到该条语句频繁出现
几个核心参数
- Node<K,V>[] table:存放Node的数组
- int size:表示当前HashMap包含的键值对数量
- int threshold:表示当前HashMap能够承受的最多的键值对数量,一旦超过这个数量HashMap就会进行扩容
- final float loadFactor:负载因子,用于扩容
- int DEFAULT_INITIAL_CAPACITY = 16:默认的table初始容量
- float DEFAULT_LOAD_FACTOR = 0.75f:默认的负载因子
- int TREEIFY_THRESHOLD = 8: 链表长度大于该参数转红黑树
- int UNTREEIFY_THRESHOLD = 6: 当树的节点数小于等于该参数转成链表
初始化方法
指定了具体的容量,以及负载因子的初始化方法。当知道需要放入的元素的个数时可以先指定避免多次扩容造成性能浪费。
public HashMap(int initialCapacity) {
this(initialCapacity, DEFAULT_LOAD_FACTOR);
}
public HashMap(int initialCapacity, float loadFactor) {
this.loadFactor = loadFactor;
this.threshold = tableSizeFor(initialCapacity);
}
核心方法 public V get(Object key)
参数key,以及该key的hash
先判断数组是否已经初始化了,以及数组长度。
在判断tab[(n - 1) & hash],前文提到的那一条语句,用key的hash取余数组长度判断数组中的位置是否存在元素。
- 不存在元素
数组中不存在元素,肯定没有产生hash冲突,那么元素肯定不存在 - 数组当前位置存在元素
判断key的hsah相等并且(key的地址相等或者equals相等)。那么可以确定元素在数组中。 - 数组当前位置存在元素,但是key不相等
接下来会去判断数组中当前位置是否存在next元素(Node节点结构),如果有next说明存在链表或者树形结构。
接下来判断Node是否是TreeNode,如果是则按照遍历树方式遍历得到结果,不是则按照遍历链表的形式遍历得到结果。
final Node<K,V> getNode(int hash, Object key) {
Node<K,V>[] tab = table;
Node<K,V> first = tab[(n - 1) & hash];
Node<K,V> e = first.next;
int n = tab.length;
K k;
//数组是否已经初始化
if (tab!= null && n > 0 && first != null) {
//table中是否有节点,key是否相等
if (first.hash == hash && ((k = first.key) == key || (key != null && key.equals(k))))
return first;
//key不相等,判断是否有next,并且判断是树的节点还是链表的节点,再以不同的方式去遍历获取
if (e != null) {
if (first instanceof TreeNode)
return ((TreeNode<K,V>)first).getTreeNode(hash, key);
do {
if (e.hash == hash && ((k = e.key) == key || (key != null && key.equals(k))))
return e;
} while ((e = e.next) != null);
}
}
return null;
}
核心方法 public V put(K key, V value)
put方法比较长,分几种情况解析
- 第一次put元素,数组还未初始化:调用resize()初始化数组,直接放入table相应位置。(resize扩容方法很重要)
- table中该位置没产生Hash冲突:构造节点放入table中
- 产生Hash冲突,先判断table中节点元素key是否相等,相等则替换value
- 产生Hash冲突,节点是TreeNode:按红黑树的方式插入节点
- 产生Hash冲突,节点是Node:构造节点按链表的方式插入,并且检查插入后是否到达转红黑树的阈值8
final V putVal(int hash, K key, V value, boolean onlyIfAbsent, boolean evict) {
Node<K,V>[] tab;
Node<K,V> p;
int n;
int i;
//第一次put元素,数组还未初始化
if ((tab = table) == null || (n = tab.length) == 0)
//调用resize()初始化数组
n = (tab = resize()).length;
//table中该位置没产生Hash冲突
if ((p = tab[i = (n - 1) & hash]) == null)
//构造节点放入table中
tab[i] = newNode(hash, key, value, null);
else {
//产生Hash冲突
Node<K,V> e; K k;
//table中节点元素key是否相等
if (p.hash == hash && ((k = p.key) == key || (key != null && key.equals(k))))
//记录下节点的引用,后续替换E节点的值
e = p;
else if (p instanceof TreeNode)
//节点是TreeNode:按红黑树的方式插入节点
e = ((TreeNode<K,V>)p).putTreeVal(this, tab, hash, key, value);
else {
//节点是Node,链表情况
for (int binCount = 0; ; ++binCount) {
//遍历到链表尾部还未发现相同的key,则构造节点插入到链表
if ((e = p.next) == null) {
p.next = newNode(hash, key, value, null);
if (binCount >= TREEIFY_THRESHOLD - 1)
//检查插入后是否到达转红黑树的阈值8
treeifyBin(tab, hash);
break;
}
//检查是否有相同的key,有就退出,e = p.next已经记录了E的引用
if (e.hash == hash &&
((k = e.key) == key || (key != null && key.equals(k))))
break;
p = e;
}
}
//上述各种情况下,如果不是插入节点的情况下
//存在key相同的情况下,完成一个值的替换
if (e != null) {
V oldValue = e.value;
if (!onlyIfAbsent || oldValue == null)
e.value = value;
return oldValue;
}
}
//检查是否需要扩容 存在的数量>hashmap容量*负载因子就需要扩容
if (++size > threshold)
resize();
return null;
}
核心方法Node<K,V>[] resize()
最重要的部分来了,也是面试官最喜欢问的HashMap的扩容
- 第一次初始化时候调用
- 存放的键值对的数量>hashmap容量*负载因子就需要扩容
初始化时候调用resize
扩容后得到的是一个Node数组。由于第一次初始化,肯定是不存在链表,红黑树等结构的,以及Node节点的。只是对一些属性做了赋值操作,和返回一个空的Node数组。
threshold:HashMap能够承受的最多的键值对数量;如果指定了容量和负载因子,则threshold = 指定的容量*负载因子;
Node<K,V>[] table:存放Node的数组,创建了一个容量为16(未指定具体容量时,默认为16)的Node数组。
省略部分与第一次初始化无关代码不重要的代码
final HashMap.Node<K,V>[] resize() {
//16*0.75=12
threshold = (int)(DEFAULT_LOAD_FACTOR * DEFAULT_INITIAL_CAPACITY);
//16
HashMap.Node<K,V>[] newTab = (HashMap.Node<K,V>[])new HashMap.Node[DEFAULT_INITIAL_CAPACITY];
table = newTab;
return newTab;
}
扩容调用resize 重点来了
先删除一些与扩容无关的代码
final Node<K,V>[] resize() {
Node<K,V>[] oldTab = table;
int oldCap = (oldTab == null) ? 0 : oldTab.length;
int oldThr = threshold;
int newCap, newThr = 0;
if (oldCap > 0) {
//容量和阈值都扩大成两倍
newCap = oldCap << 1;
newThr = oldThr << 1;
}
//设置阈值属性
threshold = newThr;
//新建一个是之前两倍容量的大小的Node数组
Node<K,V>[] newTab = (Node<K,V>[])new Node[newCap];
//属性赋值
table = newTab;
//完成一些准备,开始准备迁移之前节点
if (oldTab != null) {
//循环迁移每个节点数据
for (int j = 0; j < oldCap; ++j) {
Node<K,V> e;
//并不数组中是每个位置都有元素
if ((e = oldTab[j]) != null) {
//数据需要迁移,table相应位置置空
oldTab[j] = null;
//不存在链表情况
if (e.next == null)
//重新对新的容量快速取余,放入相应的位置
newTab[e.hash & (newCap - 1)] = e;
//树结构(较为复杂后续再分析)
else if (e instanceof TreeNode)
((TreeNode<K,V>)e).split(this, newTab, j, oldCap);
//链表结构
else {
//不需要移动的链表的头尾指针
Node<K,V> loHead = null, loTail = null;
//需要移动的链表的头尾指针
Node<K,V> hiHead = null, hiTail = null;
Node<K,V> next;
//遍历链表将一个链表拆成两个链表,这里主要分析一下拆分依据
do {
next = e.next;
//扩容后余数与之前一致,不需要移动的节点。
if ((e.hash & oldCap) == 0) {
if (loTail == null)
loHead = e;
else
loTail.next = e;
loTail = e;
} else {
//扩容后余数与之前不一致,需要移动的节点。
if (hiTail == null)
hiHead = e;
else
hiTail.next = e;
hiTail = e;
}
} while ((e = next) != null);
//将链表重新放入table数组中
if (loTail != null) {
loTail.next = null;
newTab[j] = loHead;
}
if (hiTail != null) {
hiTail.next = null;
newTab[j + oldCap] = hiHead;
}
}
}
}
}
return newTab;
}
这里主要分析一下拆分的依据。
当要将链表中的数据进行拆分,并且分配到不同的table下标中。可以明确的是,不能因为扩容影响到get方法,所以根据get方法key的hash取余容量可以得到如下两张图片。
未拆之前
拆之后
扩容中读懂一行代码
(e.hash & oldCap) == 0
当元素的hash &oldCap(前文提到过容量为2^n,其二进制为1000…)。
看几个例子
5&16 ==0
21&16 !=0
69&16 ==0
Hash值的结构以红色框为中心:可以看成 左边Y+table容量+右边X,Y是容量的偶数倍数,X小于容量值,从上述例子中可以看出来结果是否为0取决于红色框处是0还是1。
- 为0结果恒为0
Y是容量的偶数倍数扩容后取余为依旧0,余数为X,余数与扩容之前一致,不需要移动。 - 为1时结果不为0
Y是容量的偶数倍数扩容后取余为依旧0,余数为容量值+X,扩容后余数与之前不一致,需要移动,移动后的位置为容量+X(之前所在位置的值)。
最后
欢迎关注公众号:前程有光,领取一线大厂Java面试题总结+各知识点学习思维导+一份300页pdf文档的Java核心知识点总结!
来看看面试必问的HashMap,一次彻底帮你搞定HashMap源码的更多相关文章
- Java面试必问之Hashmap底层实现原理(JDK1.7)
1. 前言 Hashmap可以说是Java面试必问的,一般的面试题会问: Hashmap有哪些特性? Hashmap底层实现原理(get\put\resize) Hashmap怎么解决hash冲突? ...
- linux驱动工程面试必问知识点
linux内核原理面试必问(由易到难) 简单型 1:linux中内核空间及用户空间的区别?用户空间与内核通信方式有哪些? 2:linux中内存划分及如何使用?虚拟地址及物理地址的概念及彼此之间的转化, ...
- 互联网公司面试必问的Redis题目
Redis是一个非常火的非关系型数据库,火到什么程度呢?只要是一个互联网公司都会使用到.Redis相关的问题可以说是面试必问的,下面我从个人当面试官的经验,总结几个必须要掌握的知识点. 介绍:Redi ...
- 【面试必问】python实例方法、类方法@classmethod、静态方法@staticmethod和属性方法@property区别
[面试必问]python实例方法.类方法@classmethod.静态方法@staticmethod和属性方法@property区别 1.#类方法@classmethod,只能访问类变量,不能访问实例 ...
- 互联网公司面试必问的mysql题目(下)
这是mysql系列的下篇,上篇文章地址我附在文末. 什么是数据库索引?索引有哪几种类型?什么是最左前缀原则?索引算法有哪些?有什么区别? 索引是对数据库表中一列或多列的值进行排序的一种结构.一个非常恰 ...
- 互联网公司面试必问的mysql题目(上)
又到了招聘的旺季,被要求准备些社招.校招的题库.(如果你是应届生,尤其是东北的某大学,绝对福利哦) 介绍:MySQL是一个关系型数据库管理系统,目前属于 Oracle 旗下产品.虽然单机性能比不上or ...
- 面试必问:JVM类加载机制详细解析
前言 在Java面试中,简历上有写JVM(Java虚拟机)相关的东西,JVM的类加载机制基本是面试必问的知识点. 类的加载和卸载 JVM是虚拟机的一种,它的指令集语言是字节码,字节码构成的文件是cla ...
- 一线大厂Java面试必问的2大类Tomcat调优
一.前言 最近整理了 Tomcat 调优这块,基本上面试必问,于是就花了点时间去搜集一下 Tomcat 调优都调了些什么,先记录一下调优手段,更多详细的原理和实现以后用到时候再来补充记录,下面就来介绍 ...
- python笔记39-unittest框架如何将上个接口的返回结果给下个接口适用(面试必问)
前言 面试必问:如何将上个接口的返回结果,作为下个接口的请求入参?使用unittest框架写用例时,如何将用例a的结果,给用例b使用. unittest框架的每个用例都是独立的,测试数据共享的话,需设 ...
随机推荐
- Redis五种常用数据类型
string 字符串常用操作 1.存入字符串键值对 SET key value 2.批量存储字符串键值对 MSET key value [key value ...] 3.获取一个字符串键值 G ...
- .gdbinit文件配置
.gdbinit文件配置 #打印数组的索引下标 set print array-indexes on #每行打印一个结构体成员 set print pretty on #除了断点有关的线程会被停下来, ...
- elasticsearch mysql配置
1,开启bin-log 2,binglog_foramt格式必须为row 3,配置server_id为1001 4,binlog-row-image 必须为full log-bin=mysql-bin ...
- docker compose 用法
目录 docker compose的使用场景 一个基本的demo演示 找一个目录,在其中创建一个python文件app.py 在相同的文件夹下,创建requirements.txt文件 在相同的文件夹 ...
- Java:基于TCP协议网络socket编程(实现C/S通信)
目录 一.前言:TCP原理简介 二.Socket编程通信 三.TCP服务器端(具体代码) 四.TCP客户端(具体代码) 五.通信效果演示 六."创意"机器人:价值一个亿的AI核心代 ...
- Redis学习笔记(六)——数据结构之Set
一.介绍 Redis的Set是string类型的无序集合.集合成员是唯一的,这就意味着集合中不能出现重复的数据. Redis中集合是通过哈希表实现的,所以添加.删除.查找的复杂度都是O(1). 集合中 ...
- 应该怎么提升4G工业路由器的无线信号?
4G工业路由器如今应用的范围非常的广泛,在实际使用中也遇到了很多的问题,其中经常被问到的一个问题就是我们怎么保证4G工业路由器的良好信号强度.在互联网上也有很多关于如何找到最佳信号的方法,但对于固定和 ...
- java中常见的六种线程池详解
之前我们介绍了线程池的四种拒绝策略,了解了线程池参数的含义,那么今天我们来聊聊Java 中常见的几种线程池,以及在jdk7 加入的 ForkJoin 新型线程池 首先我们列出Java 中的六种线程池如 ...
- Django之简易用户系统(3)
目录 1. 总体设计思路 2. 搭建简易用户系统 2.1 配置模型Model 2. 2 写入数据库: 2.3 数据库验证表: 2.4 路由URL配置: 2.5 用户增加 后台执行脚本配置: 视图模板配 ...
- Efficient Estimation of Word Representations in Vector Space 论文笔记
Mikolov T , Chen K , Corrado G , et al. Efficient Estimation of Word Representations in Vector Space ...