HashMap源代码阅读
Map类结构
Java的集合类主要由两个接口派生出来,Collection
和Map
,上一节我们讨论过Collection
接口结构,如今来看下Map
接口。
HashMap | 一种存储键/值关联的数据结构 |
Hashtable | 一种用synchronized包裹其内部方法的映射表。保证线程安全 |
TreeMap | 一种有序排列的映射表 |
EnumMap | 一种属于枚举类型的映射表,枚举类型元素集的高效实现,採用位序列实现 |
LinkedHashMap | 一种能够记住键/值加入顺序的映射表 |
WeakHashMap | 一种其值无用武之地能够被垃圾回收器回收的映射表 |
IdentityHashMap | 一种用==而不是equals比較键值的映射表 |
HashMap
HashMap
中get和put操作平均是常数时间,元素能平均的映射到每个桶中。遍历映射表的性能和其容量成正相关。若须要保证遍历的高性能,映射表的初始大小不能太大以及装填因子不能设置太小。
HashMap
有两个因素影响其性能:初始容量和装填因子,容量指的是映射表中桶的数量,装填因子用于衡量映射表装满的程度。当映射表中元素数量超过装填因子和当前容量的乘积时,映射表将会加倍其容量,并对元素进化重hash操作。
默认装填因子是0.75。能在时间和空间上保持一个较好的平衡。
若有大量元素须要增加HashMap
,初始化一个足够大的映射表来容纳这些元素,其性能比让HashMap
自己主动扩容和重哈希效率要高。
HashMap
的实现是非synchronized
。其相应同步版本号是Hashtable
,多线程环境下须要保证映射表没有产生并发的结构改动(包含加入和删除元素)。若须要并发改动容器结构。须要保证同步改动散列表的结构,或者能够採用Collections.synchronizedMap(new
。
HashMap(...))
HashMap的实现
类定义
public class HashMap<K,V>
extends AbstractMap<K,V>
implements Map<K,V>, Cloneable, Serializable
成员
HashMap实际是一个数组,数组中每一个元素都是一个链表。
static final float DEFAULT_LOAD_FACTOR = 0.75f; //默认装填因子
/**
* The table, resized as necessary. Length MUST Always be a power of two.
*/
transient Entry[] table;
transient int size;
/**
* The next size value at which to resize (capacity * load factor).
*/
int threshold;
final float loadFactor;
- 哈希表table,注意其长度必须是2的幂,这和採用hash算法有关系。
一般採用取模运算
index
保证元素在合理范围,可是取模运算效率不高。JDK採用了更快的算法,这个更快的算法源于一个数学规律,size是2的N次方,那么数X对size的模运算结果等价于X和size-1的按位与运算。也就是
= hash_code % sizeX
。
% size <=> X & (size -1) threshold
阈值等于capacity
,超过阈值时须要加倍扩容并重哈希,注意
* load factorloadFactor
声明为final设置以后不能改动。
内部类Entry实际是一个链表,定义例如以下。
static class Entry<K,V> implements Map.Entry<K,V> {
final K key;
V value;
Entry<K,V> next;
final int hash;
}
方法
构造方法,能够看到数组的大小保证为2的幂且不小于initialCapacity
public HashMap(int initialCapacity, float loadFactor) {
if (initialCapacity < 0)
throw new IllegalArgumentException("Illegal initial capacity: " +
initialCapacity);
if (initialCapacity > MAXIMUM_CAPACITY)
initialCapacity = MAXIMUM_CAPACITY;
if (loadFactor <= 0 || Float.isNaN(loadFactor))
throw new IllegalArgumentException("Illegal load factor: " +
loadFactor);
// Find a power of 2 >= initialCapacity
int capacity = 1;
while (capacity < initialCapacity) //保证capacity为2的幂。且不小于initialCapacity
capacity <<= 1;
this.loadFactor = loadFactor;
threshold = (int)(capacity * loadFactor);
table = new Entry[capacity];
init(); //empty function
}
put方法。JDK中没有直接用key的hash code而是再对其进行一次hash计算保证值尽可能分散,通过取模运算找到table中相应的位置,并加入该位置的链表头部。若存在同样元素(hash code相等、equals为true),则直接替换原来值。
public V put(K key, V value) {
if (key == null)
return putForNullKey(value); //key为null元素放在table[0]位置
int hash = hash(key.hashCode()); //对key的hash code再进行hash计算
int i = indexFor(hash, table.length); //找到table中应当加入的位置[0,length)
for (Entry<K,V> e = table[i]; e != null; e = e.next) {
Object k;
if (e.hash == hash && ((k = e.key) == key || key.equals(k))) {//替换同样元素
V oldValue = e.value;
e.value = value;
e.recordAccess(this);
return oldValue;
}
}
modCount++;
addEntry(hash, key, value, i); //都是加入加在头部
return null;
}
static int indexFor(int h, int length) {
return h & (length-1); //高效的hash取代h % length
}
void addEntry(int hash, K key, V value, int bucketIndex) {
Entry<K,V> e = table[bucketIndex];
table[bucketIndex] = new Entry<K,V>(hash, key, value, e);
if (size++ >= threshold)
resize(2 * table.length);
}
加入元素后size++。并推断是否须要扩容,每次扩容都是原来大小的两倍(扩容后大小相同也是2的幂)。扩容以后元素转移到新的table中。table中每一个链表元素实际被逆置了。
void resize(int newCapacity) {
Entry[] oldTable = table;
int oldCapacity = oldTable.length;
if (oldCapacity == MAXIMUM_CAPACITY) {
threshold = Integer.MAX_VALUE;
return;
}
Entry[] newTable = new Entry[newCapacity];
transfer(newTable);
table = newTable;
threshold = (int)(newCapacity * loadFactor);
}
/**
* Transfers all entries from current table to newTable.
*/
void transfer(Entry[] newTable) {
Entry[] src = table;
int newCapacity = newTable.length;
for (int j = 0; j < src.length; j++) {
Entry<K,V> e = src[j];
if (e != null) {
src[j] = null;
do {
Entry<K,V> next = e.next;
int i = indexFor(e.hash, newCapacity);
e.next = newTable[i];
newTable[i] = e; //e总是加在头部
e = next;
} while (e != null);
}
}
}
get方法,事实上put方法中也有get的逻辑,先通过hash找到在table中位置,然后再在链表中查找。
public V get(Object key) {
if (key == null)
return getForNullKey();
int hash = hash(key.hashCode());
for (Entry<K,V> e = table[indexFor(hash, table.length)];
e != null; e = e.next) {
Object k;
if (e.hash == hash && ((k = e.key) == key || key.equals(k)))
return e.value;
}
return null;
}
remove方法,也是先通过hash找到table中位置。然后在链表中删除对应元素。
public V remove(Object key) {
Entry<K,V> e = removeEntryForKey(key);
return (e == null ? null : e.value);
}
final Entry<K,V> removeEntryForKey(Object key) {
int hash = (key == null) ? 0 : hash(key.hashCode());
int i = indexFor(hash, table.length);
Entry<K,V> prev = table[i];
Entry<K,V> e = prev;
while (e != null) {
Entry<K,V> next = e.next;
Object k;
if (e.hash == hash &&
((k = e.key) == key || (key != null && key.equals(k)))) {
modCount++;
size--;
if (prev == e) //删除链表头
table[i] = next;
else
prev.next = next;
e.recordRemoval(this);
return e;
}
prev = e;
e = next;
}
return e;
}
HashMap的视图
集合框架并没有把散列表当作一个集合。Map
本身是一个顶层接口。只是提供了3个集合类视图:键集合、值集合、键值对集合。分别相应keySet()
、values()
、entrySet()
三个方法的返回值。
在抽象父类AbstractMap
中定义了键集和值集的引用。因为这些视图是无状态的。不是必需每次都又一次创建。
ketSet方法返回一个内部类HashMap$KeySet
实例。其本身并没有不论什么成员和数据结构。都是直接引用外部类的属性和方法来完毕相关操作(因此是stateless)。
transient volatile Set<K> keySet = null;
transient volatile Collection<V> values = null; //define in AbstractMap
private transient Set<Map.Entry<K,V>> entrySet = null; //define in HashMap
public Set<K> keySet() {
Set<K> ks = keySet;
return (ks != null ?
ks : (keySet = new KeySet()));
}
private final class KeySet extends AbstractSet<K> {
public Iterator<K> iterator() {
return newKeyIterator();
}
public int size() {
return size;
}
public boolean contains(Object o) {
return containsKey(o);
}
public boolean remove(Object o) {
return HashMap.this.removeEntryForKey(o) != null;
}
public void clear() {
HashMap.this.clear();
}
}
KeySet的迭代器返回内部类KeyIterator
实例,其继承自HashIterator
,实际HashIterator
实现了整个Entry
的迭代,首先找到table中第一个不为空的元素。遍历下一个元素的时候,先推断当前位置所在链表有没有后继节点。有的话往后遍历。否则继续到table中找下一个非空元素。
实际三个视图的迭代器都是其子类,仅仅是next返回值不同,可能是key、value或entry。
Iterator<K> newKeyIterator() {
return new KeyIterator();
}
private final class KeyIterator extends HashIterator<K> {
public K next() {
return nextEntry().getKey();
}
}
private final class ValueIterator extends HashIterator<V> {
public V next() {
return nextEntry().value;
}
}
private final class EntryIterator extends HashIterator<Map.Entry<K,V>> {
public Map.Entry<K,V> next() {
return nextEntry();
}
}
private abstract class HashIterator<E> implements Iterator<E> {
Entry<K,V> next; // next entry to return
int expectedModCount; // For fast-fail
int index; // current slot
Entry<K,V> current; // current entry
HashIterator() {
expectedModCount = modCount;
if (size > 0) { // advance to first entry
Entry[] t = table;
while (index < t.length && (next = t[index++]) == null)
;
}
}
public final boolean hasNext() {
return next != null;
}
final Entry<K,V> nextEntry() {
if (modCount != expectedModCount)
throw new ConcurrentModificationException();
Entry<K,V> e = next;
if (e == null)
throw new NoSuchElementException();
if ((next = e.next) == null) { //table[index]链表下一个为空
Entry[] t = table;
while (index < t.length && (next = t[index++]) == null) //table中循环找下一个不为空
;
}
current = e;
return e;
}
}
两位两个视图值集合values()
和键值对集合entrySet()
不一一介绍,注意一点值集合是Collectiont<V>
对象。键值对集合是Set<Map.Entry<K,V>>
对象。
private final class Values extends AbstractCollection<V> {
...
}
private final class EntrySet extends AbstractSet<Map.Entry<K,V>> {
...
}
总结
HashMap
本身是一个有数组和链表组成的数据结构,其插入和查找元素的消耗能够看成O(1)。默认散列表内部数组大小保证为2的幂次,因为内部採用了位运算取代了传统取模运算来确定元素插入位置。HashMap
性能由散列表的容量和装填因子两部分决定,当中装填因子默认是0.75。容量默认是16。Map
是独立接口,并不是Collection
子接口。可是提供三个集合类视图:键集合、值集合、键值对集合。分别相应keySet()
、values()
、entrySet()
三个方法的返回值,这三个集合视图是无状态的,本身依赖Map
实例本身。遍历元素能够依据须要採用集合类相应的迭代器进行迭代。迭代支持fail-fast
。
HashMap源代码阅读的更多相关文章
- Java Jdk1.8 HashMap源代码阅读笔记二
三.源代码阅读 3.元素包括containsKey(Object key) /** * Returns <tt>true</tt> if this map contains a ...
- Java 推荐读物与源代码阅读
Java 推荐读物与源代码阅读 江苏无锡 缪小东 1. Java语言基础 谈到Java ...
- Mongodb源代码阅读笔记:Journal机制
Mongodb源代码阅读笔记:Journal机制 Mongodb源代码阅读笔记:Journal机制 涉及的文件 一些说明 PREPLOGBUFFER WRITETOJOURNAL WRITETODAT ...
- 【转】Tomcat总体结构(Tomcat源代码阅读系列之二)
本文是Tomcat源代码阅读系列的第二篇文章,我们在本系列的第一篇文章:在IntelliJ IDEA 和 Eclipse运行tomcat 7源代码一文中介绍了如何在intelliJ IDEA 和 Ec ...
- 利用doxygen提高源代码阅读效率
阅读开源项目的源代码是提高自己编程能力的好方法,而有一个好的源代码阅读工具无疑能够让你在阅读源代码时事半功倍.之前找过不少源代码阅读工具,像SourceInsight.sourcenav.scitoo ...
- CI框架源代码阅读笔记5 基准測试 BenchMark.php
上一篇博客(CI框架源代码阅读笔记4 引导文件CodeIgniter.php)中.我们已经看到:CI中核心流程的核心功能都是由不同的组件来完毕的.这些组件类似于一个一个单独的模块,不同的模块完毕不同的 ...
- 淘宝数据库OceanBase SQL编译器部分 源代码阅读--Schema模式
淘宝数据库OceanBase SQL编译器部分 源代码阅读--Schema模式 什么是Database,什么是Schema,什么是Table,什么是列,什么是行,什么是User?我们能够能够把Data ...
- CI框架源代码阅读笔记3 全局函数Common.php
从本篇開始.将深入CI框架的内部.一步步去探索这个框架的实现.结构和设计. Common.php文件定义了一系列的全局函数(一般来说.全局函数具有最高的载入优先权.因此大多数的框架中BootStrap ...
- [C++ 2011 STL (VS2012 Update4) 源代码阅读系列(2)]熟悉一些宏定义和模版偏特化或叫模版专门化
[C++ 2011 STL (VS2012 Update4) 源代码阅读系列(2)]熟悉一些宏定义和模版偏特化或叫模版专门化 // point_test.cpp : 知识点练习和测试,用于单步调试,跟 ...
随机推荐
- Codeforces 622 F. The Sum of the k-th Powers
\(>Codeforces \space 622\ F. The\ Sum\ of\ the\ k-th\ Powers<\) 题目大意 : 给出 \(n, k\),求 \(\sum_{i ...
- HTTP状态码,400,404,500,503
HTTP状态码(HTTP Status Code) 一些常见的状态码为: 200 - 服务器成功返回网页 400 服务器不理解请求的语法 404 - 请求的网页不存在 503 - 服务不可用 所有状态 ...
- 2349 Arctic Network(中文版)
试题描述: 国防部希望通过无线网络连接几个北方前哨基地. 在建立网络时将使用两种不同的通信技术:每个前哨基站都将拥有无线电收发器,另外还有一些前哨卫星通道. 任何带卫星频道的两个前哨都可以通过卫星进行 ...
- [转]Eclipse 的快捷键以及文档注释、多行注释的快捷键
一.多行注释快捷键 1.选中你要加注释的区域,用ctrl+shift+C 或者ctrl+/ 会加上//注释 2.先把你要注释的东西选中,用shit+ctrl+/ 会加上/* */注释 3.以上快 ...
- Codeforces Round #304 (Div. 2) Break the Chocolate 水题
Break the Chocolate Time Limit: 20 Sec Memory Limit: 256 MB 题目连接 http://codeforces.com/contest/546/ ...
- pom通用依赖
<dependencies><!--common--><dependency><groupId>com.google.guava</groupId ...
- 01-03-01【Nhibernate (版本3.3.1.4000) 出入江湖】id标签的unsaved-value属性
父表 <class name="Model.Customer, Model" discriminator-value="0"> <!--uns ...
- 移动端 关于 键盘将input 框 顶上去的解决思路---个人见解
在移动端,经常会遇到input获得焦点时候弹出的虚拟键盘将整体页面布局打乱的情况. 比如说是这种 输入框未获得焦点键盘未抬起的时候: 输入框获得焦点键盘抬起的时候 这种情况下,不管是上面的textar ...
- Ext面板
<HTML> <HEAD> <TITLE>面板</TITLE> <link rel="stylesheet" type=&qu ...
- 第一篇 对Javascript中原型的深入理解
理解原型对象 在Javascript中不管什么时候,仅仅要创建一个新的函数,就会依据一组特定的规则为该函数创建一个prototype属性,这个属性指向函数的原型对象(这个对象的用途是包括能够有特定 ...