Java中的容器(集合)之HashMap源码解析
1、HashMap源码解析(JDK8)
基础原理:
- 对比上一篇《Java中的容器(集合)之ArrayList源码解析》而言,本篇只解析HashMap常用的核心方法的源码。
- HashMap是一个以键值对存储的容器。
- hashMap底层实现为数组+链表+红黑树(链表超过8时转为红黑树,JDK7为数组+链表)。
- HashMap会根据key的hashCode得到对应的hash值,再去数组中找寻对应的数组位置(下标)。
- hash方法如下:
static final int hash(Object key) {
int h;
//hashCode()返回散列值,这是Object中的一个方法
// ^ 按位异或,& 按位与,|按位或;&&逻辑与,||逻辑或
// >>> 无符号右移
return (key == null) ? 0 : (h = key.hashCode()) ^ (h >>> 16);
}
HashMap的一些属性:
- 关于其中加载因子属性(DEFAULT_LOAD_FACTOR ,loadFactor),主要是针对元素量而言,越大元素放的越多,空间利用率高,不过容易碰撞,查找时间多;越小元素放的越少,不容易碰撞,不过浪费空间,查找时间少。
- 关于threshold属性,它是HashMap的扩容标准,计算规则为容量*加载因子,比如默认情况为16*0.75=12,达到这个值的时候就会进行扩容(扩容操作比较耗费性能)。
- 源码及释义如下:
public class HashMap<K,V> extends AbstractMap<K,V> implements Map<K,V>, Cloneable, Serializable {
// 序列号
private static final long serialVersionUID = 362498820763181265L;
// 默认的初始容量,需为2的幂次方(为了减少哈希碰撞),<< 表示左移,运算规则为乘以2的n次方,1<<4=16
static final int DEFAULT_INITIAL_CAPACITY = 1 << 4;
// 最大容量,如果由某个带参构造函数隐式的指定了更高的值,需为2的幂次方且小于1 << 30
static final int MAXIMUM_CAPACITY = 1 << 30;
// 构造函数中未指定时使用的加载因子,即默认加载因子
static final float DEFAULT_LOAD_FACTOR = 0.75f;
// 当传入的节点大于2且至少为8的时候,链表节点转为红黑树
static final int TREEIFY_THRESHOLD = 8;
// 当节点小于为6的时候,红黑树退化为链表
static final int UNTREEIFY_THRESHOLD = 6;
// 红黑树中对应的最小表容量应该最少为4*TREEIFY_THRESHOLD,以避免在调整大小和红黑树阈值之间的冲突。
static final int MIN_TREEIFY_CAPACITY = 64;
// 在第一次使用的时候初始化表,且根据需要设置大小,分配的大小总是2的幂次方
transient Node<k,v>[] table;
// 保存元素的集,需要注意的是,它使用的AbstractMap字段是keySet()和values()。
transient Set<map.entry<k,v>> entrySet;
// 此映射中包含的键值映射数,键值是一个整体,不等于数组的长度(因为存在哈希碰撞之后的链表和红黑树)
transient int size;
// 每次扩容和更改map结构的计数器
transient int modCount;
// 下一个要调整大小的大小值(容量*加载因子)
int threshold;
// hash表的加载因子
final float loadFactor;
}
静态内部类Node:
- 源码及释义如下:
//静态内部类,实现了Map.Entry<K,V>接口
static class Node<K,V> implements Map.Entry<K,V> {
final int hash;//哈希值,用于与其他元素的哈希值进行比较
final K key;//键
V value;//值
Node<K,V> next;//下一个节点 //构造器
Node(int hash, K key, V value, Node<K,V> next) {
this.hash = hash;
this.key = key;
this.value = value;
this.next = next;
} public final K getKey() { return key; }
public final V getValue() { return value; }
public final String toString() { return key + "=" + value; } public final int hashCode() {
return Objects.hashCode(key) ^ Objects.hashCode(value);
} public final V setValue(V newValue) {
V oldValue = value;
value = newValue;
return oldValue;
} public final boolean equals(Object o) {
if (o == this)
return true;
if (o instanceof Map.Entry) {
Map.Entry<?,?> e = (Map.Entry<?,?>)o;
if (Objects.equals(key, e.getKey()) &&
Objects.equals(value, e.getValue()))
return true;
}
return false;
}
}
JDK8增加了树节点静态内部类用于红黑树:
- 部分源码及释义如下:
static final class TreeNode<K,V> extends LinkedHashMap.Entry<K,V> {
TreeNode<K, V> parent; // red-black tree links
TreeNode<K, V> left;
TreeNode<K, V> right;
TreeNode<K, V> prev; // needed to unlink next upon deletion
boolean red; //判断是否为红 TreeNode(int hash, K key, V val, Node<K, V> next) {
super(hash, key, val, next);
} /**
* 返回包含此节点的树的根节点
*/
final TreeNode<K, V> root() {
for (TreeNode<K, V> r = this, p; ; ) {
if ((p = r.parent) == null)
return r;
r = p;
}
}
}
HashMap的构造器:
- 主要有四个,源码及释义如下:
/**
* 指定容量以及加载因子构造一个空的HashMap
*/
public HashMap(int initialCapacity, float loadFactor) {
if (initialCapacity < 0)
throw new IllegalArgumentException("Illegal initial capacity: " +
initialCapacity);
if (initialCapacity > MAXIMUM_CAPACITY)
initialCapacity = MAXIMUM_CAPACITY;
if (loadFactor <= 0 || Float.isNaN(loadFactor))
throw new IllegalArgumentException("Illegal load factor: " +
loadFactor);
this.loadFactor = loadFactor;
this.threshold = tableSizeFor(initialCapacity);
} /**
* 指定容量以及默认加载因子0.75构造一个空的HashMap
*/
public HashMap(int initialCapacity) {
this(initialCapacity, DEFAULT_LOAD_FACTOR);
} /**
* 以默认容量16以及默认加载因子0.75构造一个空的HashMap
*/
public HashMap() {
this.loadFactor = DEFAULT_LOAD_FACTOR; // all other fields defaulted
} /**
* 以另一个Map的键值对构造一个新的HashMap。新HashMap的容量最少足够存储旧HashMap的键值对数,加载因子为默认加载因子0.75
*/
public HashMap(Map<? extends K, ? extends V> m) {
this.loadFactor = DEFAULT_LOAD_FACTOR;
putMapEntries(m, false);
}
- 其中第四个构造函数有用到putMapEntries()这个方法,其源码如下:
/**
* 实现map.putall和map构造函数
*/
final void putMapEntries(Map<? extends K, ? extends V> m, boolean evict) {
int s = m.size();
//判断m是否为空
if (s > 0) {
//判断table是否初始化
if (table == null) { // pre-size
//计算m的总容量,计算规则为使用容量/加载因子+1
float ft = ((float)s / loadFactor) + 1.0F;
//将m总容量与HashMap规定的最大容量相比得到最终容量
int t = ((ft < (float)MAXIMUM_CAPACITY) ?
(int)ft : MAXIMUM_CAPACITY);
//判断最终容量是否大于扩容阈值(扩容阈值计算规则:容量*加载因子)
if (t > threshold)
threshold = tableSizeFor(t);
}
//如果m的键值对数大于扩容阈值,则进行扩容
else if (s > threshold)
resize();
//将m中的键值对添加到新HashMap中
for (Map.Entry<? extends K, ? extends V> e : m.entrySet()) {
K key = e.getKey();
V value = e.getValue();
putVal(hash(key), key, value, false, evict);
}
}
}
- 针对putMapEntries()方法中的扩容操作,可以查看resize()方法,源码及释义如下:
/**
* 初始化表或者将表容量翻倍,如果为空则分配初始容量,否则以2的幂次方扩容,需要保持索引一致
* @return
*/
final Node<K,V>[] resize() {
//得到表
Node<K,V>[] oldTab = table;
//判断表是否初始化
int oldCap = (oldTab == null) ? 0 : oldTab.length;
int oldThr = threshold;
int newCap, newThr = 0;
if (oldCap > 0) {
//如果旧容量大于最大值,则不扩容
if (oldCap >= MAXIMUM_CAPACITY) {
threshold = Integer.MAX_VALUE;
return oldTab;
}
//判断旧容量的两倍容量(左移表示乘以2的n次方)是否小于最大容量,且旧容量是否大于等于默认容量
else if ((newCap = oldCap << 1) < MAXIMUM_CAPACITY &&
oldCap >= DEFAULT_INITIAL_CAPACITY)
//扩容两倍
newThr = oldThr << 1; // double threshold
}
//否则如果旧阈值大于0,则初始化容量设置为旧阈值
else if (oldThr > 0) // initial capacity was placed in threshold
newCap = oldThr;
else { // zero initial threshold signifies using defaults
//否则新容量设置为默认容量(因为旧容量小于0)
newCap = DEFAULT_INITIAL_CAPACITY;
//新阈值设置为默认容量乘以默认加载因子,即16*0.75
newThr = (int)(DEFAULT_LOAD_FACTOR * DEFAULT_INITIAL_CAPACITY);
}
//如果新阈值为0,则重新计算新阈值
if (newThr == 0) {
float ft = (float)newCap * loadFactor;
newThr = (newCap < MAXIMUM_CAPACITY && ft < (float)MAXIMUM_CAPACITY ?
(int)ft : Integer.MAX_VALUE);
}
threshold = newThr;
@SuppressWarnings({"rawtypes","unchecked"})
Node<K,V>[] newTab = (Node<K,V>[])new Node[newCap]; //此方法返回的新table
//如果旧table为空,则初始化
table = newTab;
//否则将旧table的值放入新table
if (oldTab != null) {
//旧table的值循环放入新table
for (int j = 0; j < oldCap; ++j) {
Node<K,V> e;
//判断当前节点是否有值
if ((e = oldTab[j]) != null) {
//旧table节点置为空
oldTab[j] = null;
//如果该节点没有子节点,则返回新table,元素放入的位置为e的哈希值按位与(新容量-1)
if (e.next == null)
newTab[e.hash & (newCap - 1)] = e;
//否则如果该节点属于红黑树节点,将其切割赋给新红黑树
else if (e instanceof TreeNode)
((TreeNode<K,V>)e).split(this, newTab, j, oldCap);
//保持索引一致
else { // preserve order
Node<K,V> loHead = null, loTail = null;
Node<K,V> hiHead = null, hiTail = null;
Node<K,V> next;
do {
next = e.next;
//旧索引
if ((e.hash & oldCap) == 0) {
if (loTail == null)
loHead = e;
else
loTail.next = e;
loTail = e;
}
//新索引
else {
if (hiTail == null)
hiHead = e;
else
hiTail.next = e;
hiTail = e;
}
} while ((e = next) != null);
//旧索引放入table
if (loTail != null) {
loTail.next = null;
newTab[j] = loHead;
}
//新索引放入table
if (hiTail != null) {
hiTail.next = null;
newTab[j + oldCap] = hiHead;
}
}
}
}
}
return newTab;
}
- 关于put的源码及释义如下(对应原理可以查看《Java中的容器(集合)》第七条):
//put元素到map中
public V put(K key, V value) {
//实际调用的是putVal()方法
return putVal(hash(key), key, value, false, true);
} //putVal()方法用于实际操作插入元素
final V putVal(int hash, K key, V value, boolean onlyIfAbsent,
boolean evict) {
Node<K,V>[] tab; Node<K,V> p; int n, i;
//table未初始化,调用resize()进行扩容(使用的都是默认值)
if ((tab = table) == null || (n = tab.length) == 0)
n = (tab = resize()).length;
//判断(n - 1) & hash]索引处的table是否为空,为空,则插入新节点(table为空,此时插入的节点是在数组中)
if ((p = tab[i = (n - 1) & hash]) == null)
tab[i] = newNode(hash, key, value, null);
//table不为空
else {
Node<K,V> e; K k;
//判断节点的hash以及key是否相等,是则覆盖。
if (p.hash == hash &&
((k = p.key) == key || (key != null && key.equals(k))))
e = p;
//否则如果属于树节点,使用putTreeVal插入节点数据(putTreeVal是针对红黑树的putVal方法),有兴趣的可以看一下putTreeVal方法
else if (p instanceof TreeNode)
e = ((TreeNode<K,V>)p).putTreeVal(this, tab, hash, key, value);
else {
//是一个链表
for (int binCount = 0; ; ++binCount) {
//判断是否到达链表末尾
if ((e = p.next) == null) {
//在链表末尾插入数据
p.next = newNode(hash, key, value, null);
//如果大于规则节点数(8),则转为红黑树存储
if (binCount >= TREEIFY_THRESHOLD - 1) // -1 for 1st
treeifyBin(tab, hash);
//跳出循环
break;
}
//判断插入元素与链表中原有元素的hash以及key是否相等
if (e.hash == hash &&
((k = e.key) == key || (key != null && key.equals(k))))
//相等,跳出循环
break;
//循环链表
p = e;
}
}
//存在键值对的key
if (e != null) { // existing mapping for key
//存储旧值
V oldValue = e.value;
if (!onlyIfAbsent || oldValue == null)
//替换为新值
e.value = value;
//访问后回调
afterNodeAccess(e);
//返回旧值
return oldValue;
}
}
++modCount;
//插入的时候,判断容量是否大于阈值
if (++size > threshold)
//是,则进行扩容
resize();
//插入后回调
afterNodeInsertion(evict);
return null;
}
- 关于get的源码及释义如下:
//通过指定key从map中get值
public V get(Object key) {
Node<K,V> e;
//实际调用的是getNode()方法
return (e = getNode(hash(key), key)) == null ? null : e.value;
} //getNode()方法用于实际操作查询元素值
final Node<K,V> getNode(int hash, Object key) {
Node<K,V>[] tab; Node<K,V> first, e; int n; K k;
//判断存在table是否初始化
if ((tab = table) != null && (n = tab.length) > 0 &&
(first = tab[(n - 1) & hash]) != null) {
//总是检查第一个节点,如果第一个节点与需要查询的节点的hash以及key相等,则返回第一个节点
if (first.hash == hash && // always check first node
((k = first.key) == key || (key != null && key.equals(k))))
return first;
//如果存在多个节点
if ((e = first.next) != null) {
//如果属于红黑树,则调用红黑树中的getTreeNode方法查询,有兴趣的可以看一下getTreeNode方法
if (first instanceof TreeNode)
return ((TreeNode<K,V>)first).getTreeNode(hash, key);
//否则在链表中查询
do {
//如果链表节点与需要查询的节点的hash以及key相等,则返回链表节点
if (e.hash == hash &&
((k = e.key) == key || (key != null && key.equals(k))))
return e;
} while ((e = e.next) != null);
}
}
return null;
}
(以上所有内容皆为个人笔记,如有错误之处还望指正。)
Java中的容器(集合)之HashMap源码解析的更多相关文章
- java容器三:HashMap源码解析
前言:Map接口 map是一个存储键值对的集合,实现了Map接口的主要类有以下几种 TreeMap:用红黑树实现 HashMap:数组和链表实现 HashTable:与HashMap类似,但是线程安全 ...
- 【Java深入研究】9、HashMap源码解析(jdk 1.8)
一.HashMap概述 HashMap是常用的Java集合之一,是基于哈希表的Map接口的实现.与HashTable主要区别为不支持同步和允许null作为key和value.由于HashMap不是线程 ...
- java集合之HashMap源码解析
Map是java中的一种数据结构,围绕着Map接口,有一系列的实现类如Hashtable.HashMap.LinkedHashMap和TreeMap.而其中HashMap和Hashtable我们平常使 ...
- 【Java深入研究】3、HashMap源码解析(jdk 1.7)
1. HashMap的数据结构 数据结构中有数组和链表来实现对数据的存储,但这两者基本上是两个极端. 数组 数组存储区间是连续的,占用内存严重,故空间复杂的很大.但数组的二分查找时间复杂度小,为O(1 ...
- 【转】Java集合:HashMap源码剖析
Java集合:HashMap源码剖析 一.HashMap概述二.HashMap的数据结构三.HashMap源码分析 1.关键属性 2.构造方法 3.存储数据 4.调 ...
- 【转】Java HashMap 源码解析(好文章)
.fluid-width-video-wrapper { width: 100%; position: relative; padding: 0; } .fluid-width-video-wra ...
- Java集合---Array类源码解析
Java集合---Array类源码解析 ---转自:牛奶.不加糖 一.Arrays.sort()数组排序 Java Arrays中提供了对所有类型的排序.其中主要分为Prim ...
- java中的==、equals()、hashCode()源码分析(转载)
在java编程或者面试中经常会遇到 == .equals()的比较.自己看了看源码,结合实际的编程总结一下. 1. == java中的==是比较两个对象在JVM中的地址.比较好理解.看下面的代码: ...
- Java生鲜电商平台-SpringCloud微服务架构中网络请求性能优化与源码解析
Java生鲜电商平台-SpringCloud微服务架构中网络请求性能优化与源码解析 说明:Java生鲜电商平台中,由于服务进行了拆分,很多的业务服务导致了请求的网络延迟与性能消耗,对应的这些问题,我们 ...
随机推荐
- js—input框中输入数字,动态生成内容的方法
项目中需要在前端实现: 用户输入数字n,动态生成n个元素,删除n,自动清空n个元素(如图一): 用户输入数字n,失焦生成n个元素,再聚焦修改n,自动清空n个元素(如图二): 图一: 图二: 需求一实现 ...
- vue中的scope
在vue文件中的style标签上,有一个特殊的属性:scoped. 当一个style标签拥有scoped属性时,它的CSS样式就只能作用于当前的组件,也就是说,该样式只能适用于当前组件元素. 通过该属 ...
- 2018-2-13-win10-uwp-读写csv-
title author date CreateTime categories win10 uwp 读写csv lindexi 2018-2-13 17:23:3 +0800 2018-2-13 17 ...
- [NOI2015]程序自动分析(并查集,离散化)
[NOI2015]程序自动分析 Description 在实现程序自动分析的过程中,常常需要判定一些约束条件是否能被同时满足. 考虑一个约束满足问题的简化版本:假设x1,x2,x3,-代表程序中出现的 ...
- sqlmap POST注入
带表单的页面: 1.sqlmap.py -u "http://mysqli/Less-11/" --forms 2.python sqlmap.py -r d:\test.txt ...
- 修改编码为utf8mb4 以支持emoji表情
环境: 项目db的所有字符集都已经初始化为utf-8,如 status命令显示如下: Server characterset: utf8Db characterset: utf8Client char ...
- R reticulate 设置 python 环境
library("reticulate") use_python("/usr/bin/python", required = T) py_config() 注意 ...
- JVM内存分配调优
Reference: https://time.geekbang.org/column/article/108139 参考指标 GC频率:⾼频的FullGC会给系统带来⾮常⼤的性能消耗,虽然Minor ...
- maven编译问题之 -The POM for XXX is invalid, transitive dependencies (if any) will not be available
问题一: 把父工程tao-parent install 到maven本地仓后,接着install tao-common工程,然后报错 报错信息如下: [WARNING] The POM for com ...
- 理解性能的奥秘——应用程序中慢,SSMS中快(4)收集解决参数嗅探问题的信息
---从计划缓存中直接获取查询计划和参数: ), ) SELECT @dbname = 'hydee_连锁', @procname = 'dbo.p_select_ware'; WITH baseda ...