【Java基础】HashMap工作原理

HashMap

Hash table based implementation of the Map interface. This

implementation provides all of the optional map operations, and permits

null values and the null key. (The HashMap class is roughly equivalent

to Hashtable, except that it is unsynchronized and permits nulls.)

This class makes no guarantees as to the order of the map; in particular,

it does not guarantee that the order will remain constant over time.

官方文档描述信息：基于Map接口实现，键值都允许null，非线程同步的，不按插入顺序排，也不保证不随时间变化。

HashMap底层的数据结构实现是数组加链表，数组的每一项都是链。
构造函数

HashMap提供了四个构造函数：
- HashMap(int initialCapacity, float loadFactor)：构造一个带有指定容量和加载因子的空的HashMap。
- HashMap(int initialCapacity)：构造一个指定容量和默认加载因子为0.75的空的HashMap
- HashMap()：构造一个默认容量为16和默认加载因子为0.75的空的HashMap。
- HashMap(Map<? extends K, ? extends V> m)：构造一个匹配所有map中所有的元素并且加载因子是0.75的空HashMap。
初始容量和加载因子是影响HashMap性能的重要参数。
- 初始容量：创建哈希表时的容量(bucket)
- 加载因子：哈希表在其容量自动增加之前可以达到多满的一个尺度。
put()的实现

put()大致的思路：
1. 对key的hashCode()做hash，然后再计算index
2. 如果没碰到直接放到bucket里
3. 如果碰撞了，以链表的形式存在buckets后
4. 如果碰撞导致链表过长(大于等于TREEIFY_THRESHOLD)，就把链接表转换成红黑树
5. 如果节点已经存在就替换old value(保证key的唯一性)
6. 如果bucket满了(超过加载因子 * 当前容量)，就要resize

    public V put(K key, V value) {

        // 对key的hashCode()做hash()

        return putVal(hash(key), key, value, false, true);

    }

    final V putVal(int hash, K key, V value, boolean onlyIfAbsent, boolean evict) {

        Node<K,V>[] tab; Node<K,V> p; int n, i;

        // table为空则创建

        if ((tab = table) == null || (n = tab.length) == 0)

            n = (tab = resize()).length;

        // 计算index并做特殊处理

        if ((p = tab[i = (n - 1) & hash]) == null)

            tab[i] = newNode(hash, key, value, null);

        else {

            Node<K,V> e; K k;

            // 如果hash和key都相同

            if (p.hash == hash && ((k = p.key) == key || (key != null && key.equals(k))))

                e = p;

            // 如果该链为树

            else if (p instanceof TreeNode)

                e = ((TreeNode<K,V>)p).putTreeVal(this, tab, hash, key, value);

            // 如果该链为链表

            else {

                for (int binCount = 0; ; ++binCount) {

                    if ((e = p.next) == null) {

                        p.next = newNode(hash, key, value, null);

                        // 如果链表的长度超过了这个阈值，

                        if (binCount >= TREEIFY_THRESHOLD - 1) // -1 for 1st

                            treeifyBin(tab, hash);

                        break;

                    }

                    if (e.hash == hash && ((k = e.key) == key || (key != null && key.equals(k))))

                        break;

                    p = e;

                }

            }

            // 如果节点存在的话，就替换新值返回旧值

            if (e != null) { // existing mapping for key

                V oldValue = e.value;

                if (!onlyIfAbsent || oldValue == null)

                    e.value = value;

                afterNodeAccess(e);

                return oldValue;

            }

        }

        ++modCount;

        // 如果大小超过了 加载因子*当前容量，就进行扩容

        if (++size > threshold)

            resize();

        afterNodeInsertion(evict);

        return null;

    }

get()的实现

get()的大致思路：
1. bucket里的第一个节点，直接命中；
2. 如果有冲突，则通过key.equals(k)去查找对应的entry
  
  若为树，则在树中通过key.equals(k)查找
  
  若为链表，则在链表中通过key.equals(k)查找

    public V get(Object key) {

        Node<K,V> e;

        return (e = getNode(hash(key), key)) == null ? null : e.value;

    }

    final Node<K,V> getNode(int hash, Object key) {

        Node<K,V>[] tab; Node<K,V> first, e; int n; K k;

        // table不为空才进行以下操作，table为null的话直接返回null

        if ((tab = table) != null && (n = tab.length) > 0 && (first = tab[(n - 1) & hash]) != null) {

            // 直接命中

            if (first.hash == hash && // always check first node ((k = first.key) == key || (key != null && key.equals(k))))

                return first;

            if ((e = first.next) != null) {

                // 在树中命中

                if (first instanceof TreeNode)

                    return ((TreeNode<K,V>)first).getTreeNode(hash, key);

                // 在链表中命中

                do {

                    if (e.hash == hash && ((k = e.key) == key || (key != null && key.equals(k))))

                        return e;

                } while ((e = e.next) != null);

            }

        }

        return null;

    }

hash()的实现

    static final int hash(Object key) {

        int h;

        // 使用key的hashCode进行hash计算

        return (key == null) ? 0 : (h = key.hashCode()) ^ (h >>> 16);

    }

这个函数的作用是：高16bit不变，低16bit和高16bit做了一个异或。

在计算下标的时候是这样实现的：

    tab[i = (n - 1) & hash] // 使用&操作，而非%操作

resize()的实现

当put时，当超过限制的时候会resize，然而又因为我们使用的2次幂的扩展(指长度扩展为原来的2倍)，所以，元素的位置要么是在原位置，要么是在原位置再移动2次幂的位置。
面试题
1. HashMap有什么特点？
  
  基于Map接口实现，存储键值对时，他可以接受null的键值，是非同步的，HashMap存储着Entry对象
2. 你知道HashMap的工作原理么？
  
  通过hash的方法，通过put和get存储获取对象。存储时，我们将k/v传给put方法时，通过获取k的hashCode并计算hash值从而获取到bucket的位置，进一步存储，HashMap会根据当前bucket的占用情况自动扩容(当超出加载因子 * 当前容量时扩容到当前容量的两倍)。获取对象时，我们将k传给get方法，通过获取k的hashCode并计算hash值获取到在bucket中的位置，并进一步调用获取equals()获取键值对。如果发生碰撞时，HashMap通过链表将产生碰撞冲突的元素组织起来，在Java8中，当一个bucket的存储容量超过某个限制(默认是8)时就会用红黑树来代替链表，从而提高速度。
3. 你知道get和put的原理么？equals()和hashCode都有什么用？
  
  通过对key的hashCode()进行hashing，通过(n - 1 & hash)计算下标，当发生碰撞时，则利用key.equals()方法去链表或者树中查找对应的键值对。
4. 你知道hash的实现么？为什么要这样的实现？
```
     (h = key.hashCode()) ^ (h >>> 16)
```
  这么做可以在bucket的n比较小的时候，也能保证考虑到高地bit都参与到hash的计算中，同时不会有太大的开销
5. 如果HashMap的大小超过了负载因子(load factor)定义的容量，怎么办？
  
  当超过了负载因子，会重新resize一个原来长度两倍的HashMap，并重新调用hash方法

参考文章：

【Java基础】HashMap工作原理的更多相关文章

Java HashMap工作原理及实现
Java HashMap工作原理及实现 2016/03/20 | 分类: 基础技术 | 0 条评论 | 标签: HASHMAP 分享到:3 原文出处: Yikun 1. 概述从本文你可以学习到: 什 ...
Java基础-hashMap原理剖析
Java基础-hashMap原理剖析作者:尹正杰版权声明:原创作品,谢绝转载!否则将追究法律责任. 一.什么是哈希(Hash) 答:Hash就是散列,即把对象打散.举个例子,有100000条数 ...
HTTPS那些事用java实现HTTPS工作原理
HTTPS那些事用java实现HTTPS工作原理博客分类: java历险今天被问到关于https原理的问题,结果由于知识掌握不牢靠,停留于表面,很多细节都无法回答清楚,于是决定把https的 ...
详解Java GC的工作原理+Minor GC、FullGC
详解Java GC的工作原理+Minor GC.FullGC 引用地址:http://www.blogjava.net/ldwblog/archive/2013/07/24/401919.html J ...
java gc的工作原理、如何优化GC的性能、如何和GC进行有效的交互
java gc的工作原理.如何优化GC的性能.如何和GC进行有效的交互一个优秀的Java 程序员必须了解GC 的工作原理.如何优化GC的性能.如何和GC进行有效的交互,因为有一些应用程序对性能要求较 ...
Java Web程序工作原理
Web开发的最重要的基本功能是HTTP:Java Web开发的最重要的基本功是Servlet Specification.HTTP和Servlet Specitication对于Web Server和 ...
[翻译]Java HashMap工作原理
大部分Java开发者都在使用Map,特别是HashMap.HashMap是一种简单但强大的方式去存储和获取数据.但有多少开发者知道HashMap内部如何工作呢?几天前,我阅读了java.util.Ha ...
【转】Java HashMap工作原理（好文章）
大部分Java开发者都在使用Map,特别是HashMap.HashMap是一种简单但强大的方式去存储和获取数据.但有多少开发者知道HashMap内部如何工作呢?几天前,我阅读了java.util.Ha ...
Java HashMap工作原理及实现[转]
原文:http://yikun.github.io/2015/04/01/Java-HashMap%E5%B7%A5%E4%BD%9C%E5%8E%9F%E7%90%86%E5%8F%8A%E5%AE ...

随机推荐

用js给html控件赋值
用js给html控件赋值 <script> window.onload=function setValue()//在页面加载时赋值 { document.getElementById( ...
bzoj 3572世界树虚树+dp
题目大意: 给一棵树,每次给出一些关键点,对于树上每个点,被离它最近的关键点(距离相同被标号最小的)控制求每个关键点控制多少个点分析: 虚树+dp dp过程如下: 第一次dp,递归求出每个点子树中 ...
Centos5.5系统备份
使用root用户切换到根目录然后,使用下面的命令备份完整的系统: tar cvpzf backup.tgz / --exclude=/proc --exclude=/lost+found --exc ...
关于js中window.location.href,location.href,parent.location.href,top.location.href用法
"window.location.href"."location.href"是本页面跳转 "parent.location.href"是上一 ...
eQTL
首先QTL是数量性状位点,比如身高是一个数量性状,其对应的控制基因的位点就是一个数量性状位点,而eQTL就是控制数量性状表达位点,即能控制数量性状基因(如身高基因)表达水平高低的那些基因的位点. 数量 ...
启动子&外显子&内含子
启动子 http://baike.baidu.com/link?url=HMqaMY4mXusH--4hMu1p6P_XUzEve9lZhFGtxScnbb8Z9HaLYJ981eWxAuZt2iAP ...
TCMalloc
一. 原理 tcmalloc就是一个内存分配器,管理堆内存,主要影响malloc和free,用于降低频繁分配.释放内存造成的性能损耗,并且有效地控制内存碎片.glibc中的内存分配器是ptmalloc ...
关于如何正确地在android项目中添加第三方jar包
在android项目中添加第三方jar包虽然不是一个很复杂的问题,但是确实给很多开发者带来了不小的困扰.我自己就曾经碰到过calss not found exception.error inflati ...
Canvas贝塞尔二级曲线
当前点到控制点,控制点到末尾点的两个连线,与这两个连线相切:<!DOCTYPE html> <html lang="en"> <head> &l ...
Canvas createRadialGradient API
Canvas createRadialGradient API <!DOCTYPE html> <html lang="en"> <head> ...

【Java基础】HashMap工作原理

【Java基础】HashMap工作原理的更多相关文章

随机推荐

热门专题