[java源码解析]对HashMap源码的分析（二）

上文我们讲了HashMap那骚骚的逻辑结构，这一篇我们来吹吹它的实现思想，也就是算法层面。有兴趣看下或者回顾上一篇HashMap逻辑层面的，可以看下HashMap源码解析（一）。
使用了哈希表得“拉链法”.

我打算按这个顺序来讲HashMap：几个关键属性 -> 构造方法-> 存取元素方法 ->解决hash冲突方法->HashMap扩容问题。

4个关键属性：

  /**

     *HashMap的存储大小

     */

    transient int size;

    /**

     * HashMap的大小临界值，如果达到这个值就需要重新分配大小

     */

    int threshold;

    /**

     * 负载因子(默认值一般是0.75)，哈希表在其容量自动增加之前可以达到多满的一种尺度。

     *当哈希表中的条目数超出了 负载因子与当前容量的乘积时，

     *则要对该哈希表进行 rehash 操作（即重建内部数据结构），从而哈希表将具有大约两倍的桶数。

     *负载因子过高虽然减少了空间开销，但同时也增加了查询成本

     *    static final float DEFAULT_LOAD_FACTOR = 0.75f;

     * @serial

     */

    final float loadFactor;

    /**

     * HashMap修改总数（修改数+删除数）

     */

    transient int modCount;

构造方法：

   /**对四个构造函数的简单描述 **/

    // 默认构造函数

    public HashMap();

    // 指定“容量大小”的构造函数

    public HashMap(int initialCapacity);

    //  指定“容量大小”和“负载因子’‘的构造函数

    public HashMap(int initialCapacity, float loadFactor) ;

    // 包含”子Map的构造函数’

    public HashMap(Map<? extends K, ? extends V> m);

详细描述：

  *默认构造

     *使用默认负载因子DEFAULT_LOAD_FACTOR（0.75）以及

     *默认容量大小  DEFAULT_INITIAL_CAPACITY

     */

    public HashMap() {

        this(DEFAULT_INITIAL_CAPACITY, DEFAULT_LOAD_FACTOR);

    }

    /**

     *指定负载因子以及容量大小构造函数（前三个构造函数以这个构造函数为核心对‘容量大小’和‘负载因子’进行不同的赋值，来达到不同构造函数的效果)

     * @param  initialCapacity the initial capacity 容量大小

     * @param  loadFactor      the load factor 负载因子值

     * @throws IllegalArgumentException if the initial capacity is negative

     * or the load factor is nonpositive

     */

    public HashMap(int initialCapacity, float loadFactor) {

        // 容量大小不能小于0

        if (initialCapacity < 0)

            throw new IllegalArgumentException("Illegal initial capacity: " +

                                               initialCapacity);

        //HashMap最大容量不能超过MAXIMUM_CAPACITY

        if (initialCapacity > MAXIMUM_CAPACITY)

            initialCapacity = MAXIMUM_CAPACITY;

        if (loadFactor <= 0 || Float.isNaN(loadFactor))

            throw new IllegalArgumentException("Illegal load factor: " +

                                               loadFactor);

        this.loadFactor = loadFactor;

        threshold = initialCapacity;

        init();

    }

    /** 包含子Map的构造函数

     * 主要对通过对子Map的容量大小的处理给本HashMap的容量大小赋值

     *以及clone子Map给本HashMap

     */

    public HashMap(Map<? extends K, ? extends V> m) {

        //子Map的条目数/负载因子+1会大致等于子 Map的容量大小，通过比较当前子Map的容量大小和

        //默认容易大小对比，找出最大的那个作为该HashMap的容量大小

        this(Math.max((int) (m.size() / DEFAULT_LOAD_FACTOR) + 1,

                      DEFAULT_INITIAL_CAPACITY), DEFAULT_LOAD_FACTOR);

        //不让容量大小超过MAXIMUM_CAPACITY ，让容量大小一直保持为2的幂次方

        inflateTable(threshold);

        //将子Map的元素全部添加到本HashMap中。

        putAllForCreate(m);

    }

HashMap的存取方法：

　　既然是线性数组，为什么能随机存取？这里HashMap用了一个小算法，大致是这样实现：

　　// 存储时:
　　int hash = key.hashCode(); // 这个hashCode方法这里不详述,只要理解每个key的hash是一个固定的int值
　　int index = hash % Entry[].length;
　　Entry[index] = value;

　　// 取值时:
　　int hash = key.hashCode();
　　int index = hash % Entry[].length;
　　return Entry[index];

一些工具方法的解析：

  /**

     *计算hash值

     */

    final int hash(Object k) {

        //hashSeed表示一个与当前实例关联并且可以减少哈希碰撞概率应用于键的哈希码计算的随机种子。

        int h = hashSeed;

        if (0 != h && k instanceof String) {

            return sun.misc.Hashing.stringHash32((String) k);

        }

        //对h和键的哈希码进行‘异或’并赋值运算

        h ^= k.hashCode();

        //h右移20位 异或 h右移12位  ，下一行同理。运算过程看下图2

        h ^= (h >>> 20) ^ (h >>> 12);

        return h ^ (h >>> 7) ^ (h >>> 4);

    }

    /**返回索引值

     * @param  h 通过hash(Object k)方法计算得来的哈希码

     * @param  length     表示桶的数量（即数组的长度）

     *

     */

    static int indexFor(int h, int length) {

        // assert Integer.bitCount(length) == 1 : "length must be a non-zero power of 2";

        // 将哈希码和length进行按位与运算

        return h & (length-1);

    }

图2：

取元素：

//通过key获取value

public V get(Object key) {

        如果key为null，则返回null键的值

        if (key == null)

            return getForNullKey();

        //获取键为key的实体类

        Entry<K,V> entry = getEntry(key);

        return null == entry ? null : entry.getValue();

    }

    /**

     * 根据键找到对应的实体类

     * 实现思路：①：通过计算key的hash值，用indexFor(key，table.length)获取所在数组位置的下标。

     *          ②：通过寻找处于该下标位置链表”上查找“键值等于key”的元素。

     */

    final Entry<K,V> getEntry(Object key) {

        if (size == 0) {

            return null;

        }

        //计算key的hash值

        int hash = (key == null) ? 0 : hash(key);

        for (Entry<K,V> e = table[indexFor(hash, table.length)];

             e != null;

             e = e.next) {

            Object k;

            if (e.hash == hash &&

                ((k = e.key) == key || (key != null && key.equals(k))))

                return e;

        }

        //找不到则返回null

        return null;

    }

    /**

     * 获取null键的值

     */

    private V getForNullKey() {

        if (size == 0) {

            return null;

        }

        //null键一般在table下标为0的位置

        for (Entry<K,V> e = table[0]; e != null; e = e.next) {

            if (e.key == null)

                return e.value;

        }

        return null;

    }

存元素：

   /**往HashMap存储元素

     *

     * @param key 键

     * @param value 值

     * @return

     *

     */

    public V put(K key, V value) {

        //防止table的容量为0；

        if (table == EMPTY_TABLE) {

            inflateTable(threshold);

        }

        //如果key为null，则判断该hashMap的null键是否有值，

        //如果有，则将这个新value存入覆盖老的value，返回老的value

        if (key == null)

            return putForNullKey(value);

        //计算key的哈希值

        int hash = hash(key);

        //通过key的哈希值以及数组的长度计算索引

        int i = indexFor(hash, table.length);

        找到数组此索引下的链表，一个一个得找，看有没有找到键值==该key的元素

        for (Entry<K,V> e = table[i]; e != null; e = e.next) {

            Object k;

            //如果有，则用新value覆盖老的value  oldValue，并返回oldValue;

            if (e.hash == hash && ((k = e.key) == key || key.equals(k))) {

                V oldValue = e.value;

                e.value = value;

                e.recordAccess(this);

                return oldValue;

            }

        }

        //如果没有，则modCount++，并添加新元素

        modCount++;

        //添加新元素，具体实现思路，看下面该函数得定义

        addEntry(hash, key, value, i);

        return null;

    }

    /**

      * 新增Entry

     */

    void addEntry(int hash, K key, V value, int bucketIndex) {

        //如果size比临界值大，而且该下标元素不为空，则对HashMap进行扩容，然后新增一个Entry实例

        if ((size >= threshold) && (null != table[bucketIndex])) {

            resize(2 * table.length);

            hash = (null != key) ? hash(key) : 0;

            bucketIndex = indexFor(hash, table.length);

        }

        createEntry(hash, key, value, bucketIndex);

    }

    /**

     *

     *新增一个Entry实例，并将该实例得next指向原来得table[bucketIndex];

     */

    void createEntry(int hash, K key, V value, int bucketIndex) {

        // 设置“e”为“新Entry的下一个节点”

        Entry<K,V> e = table[bucketIndex];

        table[bucketIndex] = new Entry<>(hash, key, value, e);

        size++;

    }

解决hash冲突方法：下面只具体讲了拉链法，其它有兴趣可自行了解~

开放定址法（线性探测再散列，二次探测再散列，伪随机探测再散列）
再哈希法
链地址法：就是在冲突的位置上简历一个链表，然后将冲突的元素插入到链表尾端。
建立一个公共溢出区

HashMap扩容：resize方法

  /** 重新调整HashMap中桶的数量

     *

     *通过判断新容量大小值，

     *如果 oldCapacity 超过Entty数量的最大值，则将Integer.MAX_VALUE赋给临界值（阀值），

     *直接返回不进行扩容（这样以后都不会扩容）

     *如果 oldCapacity 不超过Entty数量的最大值，则创建一个新的数组，将数据转移到新的数组里

     *并重新修改阀值

     * @param newCapacity the new capacity, 新容量大小值

     */

    void resize(int newCapacity) {

        //引用扩容前的Entry数组

        Entry[] oldTable = table;

        int oldCapacity = oldTable.length;

        // 扩容前的数组大小如果已经达到最大(2^30)了

        if (oldCapacity == MAXIMUM_CAPACITY) {

            //修改阈值为int的最大值(2^31-1)，这样以后就不会扩容了

            threshold = Integer.MAX_VALUE;

            return;

        }

        Entry[] newTable = new Entry[newCapacity];

        //将原有Entry数组的元素拷贝到新的Entry数组里

        transfer(newTable, initHashSeedAsNeeded(newCapacity));

        //HashMap的table属性引用新的Entry数组

        table = newTable;

        //修改阈值

        threshold = (int)Math.min(newCapacity * loadFactor, MAXIMUM_CAPACITY + 1);

    }

    /**

     * 将原有Entry数组的元素拷贝到新的Entry数组里

     */

    void transfer(Entry[] newTable, boolean rehash) {

        int newCapacity = newTable.length;

        for (Entry<K,V> e : table) {

            while(null != e) {

                Entry<K,V> next = e.next;

                if (rehash) {

                    e.hash = null == e.key ? 0 : hash(e.key);

                }

                //重新计算每个元素在数组中的位置

                int i = indexFor(e.hash, newCapacity);

                //标记[1]

                e.next = newTable[i];

                //将元素放在数组上

                newTable[i] = e;

                ////访问下一个Entry链上的元素

                e = next;

            }

        }

    }

这是对HashMap的实现思路的基本分析。HashMap能讲的太多了。比如*线程，遍历迭代，红黑树*......每一部分都能独立开篇来讲。以后有机会出

以上是本人对HashMap的一点理解，有什么理解不当欢迎指出~

[java源码解析]对HashMap源码的分析（二）的更多相关文章

源码解析之HashMap源码
关于HashMap的源码分析,网上已经有很多写的非常好的文章了,虽然多是基于java1.8版本以下的.Java1.8版本的HashMap源码做了些改进,理解起来更复杂点,但也不脱离其桶+链表或树的重心 ...
[java源码解析]对HashMap源码的分析（一）
最近有空的时候研究了下HashMap的源码,平时我用HashMap主要拿来当业务数据整理后的容器,一直觉得它比较灵活和好用, 这样的便利性跟它的组成结构有很大的关系. 直接开门见山,先简要说明一下H ...
springboot源码解析-管中窥豹系列之BeanPostProcessor（十二）
一.前言 Springboot源码解析是一件大工程,逐行逐句的去研究代码,会很枯燥,也不容易坚持下去. 我们不追求大而全,而是试着每次去研究一个小知识点,最终聚沙成塔,这就是我们的springboot ...
Java集合类源码解析：HashMap (基于JDK1.8)
目录前言 HashMap的数据结构深入源码两个参数成员变量四个构造方法插入数据的方法:put() 哈希函数:hash() 动态扩容:resize() 节点树化.红黑树的拆分节点树化红黑 ...
JAVA常用集合源码解析系列-ArrayList源码解析（基于JDK8）
文章系作者原创,如有转载请注明出处,如有雷同,那就雷同吧~(who care!) 一.写在前面这是源码分析计划的第一篇,博主准备把一些常用的集合源码过一遍,比如:ArrayList.HashMap及 ...
深入理解JAVA集合系列一：HashMap源码解读
初认HashMap 基于哈希表(即散列表)的Map接口的实现,此实现提供所有可选的映射操作,并允许使用null值和null键. HashMap继承于AbstractMap,实现了Map.Cloneab ...
转：【Java集合源码剖析】HashMap源码剖析
转载请注明出处:http://blog.csdn.net/ns_code/article/details/36034955 您好,我正在参加CSDN博文大赛,如果您喜欢我的文章,希望您能帮我投一票 ...
【Java集合源码剖析】HashMap源码剖析
转载出处:http://blog.csdn.net/ns_code/article/details/36034955 HashMap简介 HashMap是基于哈希表实现的,每一个元素是一个key-va ...
jdk1.8源码解析：HashMap底层数据结构之链表转红黑树的具体时机
本文从三个部分去探究HashMap的链表转红黑树的具体时机: 一.从HashMap中有关“链表转红黑树”阈值的声明: 二.[重点]解析HashMap.put(K key, V value)的源码: 三 ...

随机推荐

docker-compose 命令
docker-compose初试及命令基础以一个简单的lnmp.yaml的配置文件进行讲解docker-compose命令的基础讲解,熟练掌握命令 [root@docker lnmp]# cat l ...
Delphi编程中使用回车键不换行处理方法！！
我以前遇到过Delphi编程中使用回车键不换行的问题,一直没有找到正确处理方法,以至于每次都重新安装Delphi,今天在XE8中再次遇到这样问题,万幸找到了正确的解决方法: 可能使用过程中不小心按了i ...
JQuery的基本用法总结
1.jquery概念是js的一个类库 (对js中某些功能的封装) 用jq实现的功能一定能用js实现反过来不一定 ,js实现的功能jq不一定能实现 2.jquery好处 1.代码简洁 2. ...
PHP中预定义超全局数组（变量）
PHP中许多预定义变量都是“超全局的”,这意味着它们在一个脚本的全部作用域中都可用.超全局变量除了具有全局变量特点外,在函数或方法中无需执行global $variable:就可以访问它们. 提供超全 ...
XMPP后台搭建
XMPP的环境搭建 1.下载MySQL 登录myql官网,点击页面下面的按钮然后安装. 2.安装MySQL图形化管理工具mysql-workbench 同样进入mysql的官网, 下载 http:/ ...
vue中vueRouter使用
首先需要安装依赖:
stark - 3 ⇲自动生成URL及视图
以往建立了一张表,需要 1.为每张表创建4个url 2.为每张表创建4个视图函数 urlpatterns = [ url('^role/list/$',role.role_list,name='rol ...
爱漂泊人生 30个php操作redis常用方法代码例子
http://www.justwinit.cn/post/8789/ 背景:redis这个新产品在sns时很火,而memcache早就存在, 但redis提供出来的功能,好多网站均把它当memcach ...
json操作相关记录
json是javascript衍生的数据表示法,现在许多数据的处理都使用json. 平时用到的与json结构相似的有很多,如mongodb数据库,python的字典等.核心思想就是键值对. json的 ...
PIE SDK加载自定义服务数据
1.功能简介自定义服务数据,将符合要求的矢量数据和栅格数据集等数据以服务的方式发布,将数据存储在某服务器中,在有网络的情况下可以根据URL就可以访问,比较常见的服务数据类型的有ArcGIS Serv ...

[java源码解析]对HashMap源码的分析（二）

[java源码解析]对HashMap源码的分析（二）的更多相关文章

随机推荐

热门专题