开心一刻

  一天,楼主在路上碰到了一个很久没见的朋友,找了个餐馆,坐下聊了起来

  楼主:在哪上班了 ?

  朋友:火葬场啊

  楼主:在那上班,一个月多少钱啊 ?

  朋友:两万多啊

  楼主(不可思议):多少 ?

  朋友(非常淡定):两万多

  楼主:你们那还要人吗 ?

  朋友:要啊,24小时都要

  楼主:不是,我的意思是你们那还收人吗

  朋友:收,天天都收

  楼主:我是说,我能进去不 ?

  朋友:那200多斤的胖子都能进去,你进不去 ?

  楼主:不是,你是非要把我给炼了是咋地 ? 我能进去不,我能自己进去不 ?

  朋友:那有点悬,都是推进去的

  楼主:我是说,你们那还招工吗

  朋友:招,不分公母,都招

  楼主:老板,买单

  老板:你还没点菜了

  楼主:不点了,再不走就要被炼了

数据结构

  对 HashMap 的底层数据结构,相信大家都有所了解,不同的版本,底层数据结构会有所不同

  1.7 的底层数据结构

  1. /**
  2. * An empty table instance to share when the table is not inflated.
  3. */
  4. static final Entry<?,?>[] EMPTY_TABLE = {};
  5.  
  6. /**
  7. * The table, resized as necessary. Length MUST Always be a power of two.
  8. */
  9. transient Entry<K,V>[] table = (Entry<K,V>[]) EMPTY_TABLE;
  10.  
  11. static class Entry<K,V> implements Map.Entry<K,V> {
  12. final K key;
  13. V value;
  14. Entry<K,V> next;
  15. int hash;
  16.  
  17. ...
  18. }

  1.8 的底层数据结构

  1. /**
  2. * The table, initialized on first use, and resized as
  3. * necessary. When allocated, length is always a power of two.
  4. * (We also tolerate length zero in some operations to allow
  5. * bootstrapping mechanics that are currently not needed.)
  6. */
  7. transient Node<K,V>[] table;
  8.  
  9. static class Node<K,V> implements Map.Entry<K,V> {
  10. final int hash;
  11. final K key;
  12. V value;
  13. Node<K,V> next;
  14.  
  15. ...
  16. }
  17.  
  18. /**
  19. * Entry for Tree bins. Extends LinkedHashMap.Entry (which in turn
  20. * extends Node) so can be used as extension of either regular or
  21. * linked node.
  22. */
  23. static final class TreeNode<K,V> extends LinkedHashMap.Entry<K,V> {
  24. TreeNode<K,V> parent; // red-black tree links
  25. TreeNode<K,V> left;
  26. TreeNode<K,V> right;
  27. TreeNode<K,V> prev; // needed to unlink next upon deletion
  28. boolean red;
  29.  
  30. ...
  31. }

  但基础结构还是: 数组 + 链表 ,称作 哈希表 或 散列表

  只是 1.8 做了优化,引进了 红黑树 ,来提升链表中元素获取的速度

JDK1.7 头插

  只有元素添加的时候,才会出现链表元素的插入,那么我们先来看看 put 方法

  put - 添加元素

    源码如下

  1. /**
  2. * Associates the specified value with the specified key in this map.
  3. * If the map previously contained a mapping for the key, the old
  4. * value is replaced.
  5. *
  6. * @param key key with which the specified value is to be associated
  7. * @param value value to be associated with the specified key
  8. * @return the previous value associated with <tt>key</tt>, or
  9. * <tt>null</tt> if there was no mapping for <tt>key</tt>.
  10. * (A <tt>null</tt> return can also indicate that the map
  11. * previously associated <tt>null</tt> with <tt>key</tt>.)
  12. */
  13. public V put(K key, V value) {
  14. if (table == EMPTY_TABLE) {
  15. inflateTable(threshold);
  16. }
  17. if (key == null)
  18. return putForNullKey(value);
  19. int hash = hash(key);
  20. int i = indexFor(hash, table.length);
  21. for (Entry<K,V> e = table[i]; e != null; e = e.next) {
  22. Object k;
  23. if (e.hash == hash && ((k = e.key) == key || key.equals(k))) {
  24. V oldValue = e.value;
  25. e.value = value;
  26. e.recordAccess(this);
  27. return oldValue;
  28. }
  29. }
  30.  
  31. modCount++;
  32. addEntry(hash, key, value, i);
  33. return null;
  34. }

    直接看代码可能不够直观,我们结合流程图来看

    什么? 还是不够直观? (楼主也这么觉得)

    那我们就结合具体案例来看下这个流程

    假设 HashMap 初始状态

    然后依次往里面添加元素:(2,b), (3,w), (5,e), (9,t), (16,p)

    再利用断点调试,我们来看看真实情况

    一切都对得上,进展的也挺顺利

  resize - 数组扩容

    上述提到了扩容,但是没细讲,我们来看看扩容的实现

    关键代码如下

  1. /**
  2. * Rehashes the contents of this map into a new array with a
  3. * larger capacity. This method is called automatically when the
  4. * number of keys in this map reaches its threshold.
  5. *
  6. * If current capacity is MAXIMUM_CAPACITY, this method does not
  7. * resize the map, but sets threshold to Integer.MAX_VALUE.
  8. * This has the effect of preventing future calls.
  9. *
  10. * @param newCapacity the new capacity, MUST be a power of two;
  11. * must be greater than current capacity unless current
  12. * capacity is MAXIMUM_CAPACITY (in which case value
  13. * is irrelevant).
  14. */
  15. void resize(int newCapacity) {
  16. Entry[] oldTable = table;
  17. int oldCapacity = oldTable.length;
  18. if (oldCapacity == MAXIMUM_CAPACITY) {
  19. threshold = Integer.MAX_VALUE;
  20. return;
  21. }
  22.  
  23. Entry[] newTable = new Entry[newCapacity];
  24. transfer(newTable, initHashSeedAsNeeded(newCapacity));
  25. table = newTable;
  26. threshold = (int)Math.min(newCapacity * loadFactor, MAXIMUM_CAPACITY + 1);
  27. }
  28.  
  29. /**
  30. * Transfers all entries from current table to newTable.
  31. */
  32. void transfer(Entry[] newTable, boolean rehash) {
  33. int newCapacity = newTable.length;
  34. for (Entry<K,V> e : table) {
  35. while(null != e) {
  36. Entry<K,V> next = e.next;
  37. if (rehash) {
  38. e.hash = null == e.key ? 0 : hash(e.key);
  39. }
  40. int i = indexFor(e.hash, newCapacity);
  41. e.next = newTable[i];
  42. newTable[i] = e;
  43. e = next;
  44. }
  45. }
  46. }

    主要做了两件事:1、创建一个新的 Entry 空数组,长度是原数组的 2 倍,2、遍历原数组,对每个元素重新计算新数组的索引值,然后放入到新数组的对应位置

    有意思的是这个转移方法:transfer,我们结合案例来仔细看看

    假设扩容之前的状态如下图所示

    扩容过程如下

    利用断点调试,我们来看看真实情况

    链表元素的转移,还是采用的头插法

  链表成环

    不管是元素的添加,还是数组扩容,只要涉及到 hash 冲突,就会采用头插法将元素添加到链表中

    上面讲了那么多,看似风平浪静,实则暗流涌动;单线程下,确实不会有什么问题,那多线程下呢 ? 我们接着往下看

    将设扩容之前的的状态如下所示

    然后,线程 1 添加 (1,a) ,线程 2 添加 (19,n),线程 1 会进行扩容,线程 2 也进行扩容,那么 transfer 的时候就可能出现如下情况

    哦豁,链表成环了,这就会导致:Infinite Loop

JDK1.8 尾插

  1.8就不讲那么详细了,我们主要来看看 resize 中的元素转移部分

  1. if (oldTab != null) {
  2. // 从索引 0 开始逐个遍历旧 table
  3. for (int j = 0; j < oldCap; ++j) {
  4. Node<K,V> e;
  5. if ((e = oldTab[j]) != null) {
  6. oldTab[j] = null;
  7. if (e.next == null) // 链表只有一个元素
  8. newTab[e.hash & (newCap - 1)] = e;
  9. else if (e instanceof TreeNode) // 红黑树,先不管
  10. ((TreeNode<K,V>)e).split(this, newTab, j, oldCap);
  11. else { // preserve order
  12. // 拆链表,拆成两个子链表:索引不变的元素链表和有相同偏移量的元素链表
  13. // 每个链表都保持原有顺序
  14. Node<K,V> loHead = null, loTail = null;
  15. Node<K,V> hiHead = null, hiTail = null;
  16. Node<K,V> next;
  17. do {
  18. next = e.next;
  19. if ((e.hash & oldCap) == 0) {
  20. // 索引不变的元素链表
  21. if (loTail == null)
  22. loHead = e;
  23. else // 通过尾部去关联 next,维持了元素原有顺序
  24. loTail.next = e;
  25. loTail = e;
  26. }
  27. else {
  28. // 相同偏移量的元素链表
  29. if (hiTail == null)
  30. hiHead = e;
  31. else // 通过尾部去关联 next,维持了元素原有顺序
  32. hiTail.next = e;
  33. hiTail = e;
  34. }
  35. } while ((e = next) != null);
  36. if (loTail != null) {
  37. loTail.next = null;
  38. newTab[j] = loHead;
  39. }
  40. if (hiTail != null) {
  41. hiTail.next = null;
  42. newTab[j + oldCap] = hiHead;
  43. }
  44. }
  45. }
  46. }
  47. }

  通过尾插法,维护了链表元素的原有顺序

  在扩容时,头插法会改变链表中元素原本的顺序,以至于在并发场景下导致链表成环的问题,而尾插法,在扩容时会保持链表元素原本的顺序,就不会出现链表成环的问题

相关疑惑

  1、JDK 1.7及之前,为什么采用尾插法

    呃... 这个可能需要问头插法的实现者了;

    但有种说法,我觉得挺有道理:缓存的时间局部性原则,最近访问过的数据下次大概率会再次访问,把刚访问过的元素放在链表最前面可以直接被查询到,减少查找次数

  2、既然头插法有链表成环的问题,为什么直到 1.8 才采用尾插法来替代头插法

    只有在并发情况下,头插法才会出现链表成环的问题,多线程情况下,HashMap 本就非线程安全,这就相当于你在它的规则之外出了问题,那能怪谁?

    1.8 采用尾插,是对 1.7 的优化

  3、既然 1.8 没有链表成环的问题,那是不是说明可以把 1.8 中的 HashMap 用在多线程中

    链表成环只是并发问题中的一种,1.8 虽然解决了此问题,但是还是会有很多其他的并发问题,比如:上秒 put 的值,下秒 get 的时候却不是刚 put 的值;因为操作都没有加锁,不是线程安全的

总结

  1、JDK 1.7 采用头插法来添加链表元素,存在链表成环的问题,1.8 中做了优化,采用尾插法来添加链表元素

  2、HashMap 不管在哪个版本都不是线程安全的,出了并发问题不要怪 HashMap,从自己身上找原因

参考

  HashMap为何从头插入改为尾插入

  HashMap 中的容量与扩容实现,细致入微,值的一品!

HashMap 链表插入方式 → 头插为何改成尾插 ?的更多相关文章

  1. Java解释单链表中的头插法以及尾插法

    单链表属于数据结构中的一种基本结构,是一种线性结构,在此使用Java对其中的头插法以及尾插法进行解释. 首先定义好链表中的节点类: 其中,data代表节点所存放的数据,next代表指向下一节点 对于单 ...

  2. 将html页改成jsp的两种方式

    将html页改成jsp的两种方式 作者: 字体:[增加 减小] 类型:转载 时间:2013-08-13 将html页改成jsp有两种方法,第一种是直接修改html文件,另一种是新建jsp文件.下面为大 ...

  3. ASP.NET 使用mode=”InProc”方式保存Session老是丢失,无奈改成StateServer 模式。

    http://blog.csdn.net/fox123871/article/details/8165431 session是工作在你的应用程序进程中的.asp.net进程.iis往往会在20分钟之后 ...

  4. iOS9 http不能访问网络——在Xcode中将https改成http方式

    =====================2016-01-29更新=========================== 最近做demo时,发现将https改成http方式略有小变 1. 没有改成ht ...

  5. SQLyog软件里无法插入中文(即由默认的latin1改成UTF8编码格式)

    问题详情: 无法插入中文? 解决办法: 需要修改编码格式,由默认的latin1改为utf8. 改成, 成功!

  6. 关于富文本编辑器—UEditor(java版)的使用,以及如何将UEditor的文件/图片上传路径改成绝对路径

    突然发现好久没写博客了,感觉变懒了,是要让自己养成经常写文章的习惯才行.既可以分享自己的所学,和所想,和大家一起讨论,发现自己的不足的问题. 大家可能经常会用到富文本编辑器,今天我要说的是UEdito ...

  7. HashMap 链表和红黑树的转换

    HashMap在jdk1.8之后引入了红黑树的概念,表示若桶中链表元素超过8时,会自动转化成红黑树:若桶中元素小于等于6时,树结构还原成链表形式. 原因: 红黑树的平均查找长度是log(n),长度为8 ...

  8. direct-path插入方式提升性能的分析

    1.传统串行insert方式 常见的insert方式有两种: (1)      insert into table_name values(....) (2)      insert into tar ...

  9. Go 语言接口及使用接口实现链表插入

    @ 目录 1. 接口定义 1.1 空接口 1.2 实现单一接口 1.3 接口多方法实现 2. 多态 2.1 为不同数据类型的实体提供统一的接口 2.2 多接口的实现 3. 系统接口调用 4. 接口嵌套 ...

随机推荐

  1. c3算法

    # L(G) = [G] + [O] # G = [O] # = GO # L[E] = EO # L[F] = [F] + [GO] # F = [GO] # = FGO # L[B] = [B] ...

  2. python知识点整理一

    1.数组元素之和 解法一 from functools import reduce list=[1,3,5,7,9,34] print(reduce(lambda x,y:x+y,list)) 解法二 ...

  3. vue知识点12

    知识点归纳整理如下: 1. 数组用下标改变,或者对象增加属性,这样的改变数据   是不能触发视图更新的,要用 Vue.set(对象,属性,值) 或this.$set(对象,属性,值) 2. this. ...

  4. 51nod1548 欧姆诺姆和糖果

    思路: 只有兩種糖果,枚舉其中一種糖果的數量就可以得到一個可行解: 但總有一種糖果的數量是較少的,並且該數量小於sqrt(C): 簡單證明: 1.若有任一糖果的質量大於sqrt(C),則必定有一糖果的 ...

  5. C#番外篇-SpinWait

    SpinWait封装常见旋转逻辑.在单处理器计算机上,始终使用 "生成" 而不是 "繁忙等待",在装有超线程技术的 Intel 处理器的计算机上,这有助于防止硬 ...

  6. 如何按名称或PID查找一个进程?如何按端口号查找一个进程?如何查看一个进程的CPU和内存、文件句柄使用情况?如何查看CPU利用率高的TOP10进程清单?如何根据PID强制终止进程?

    如何按名称或PID查找一个进程?如何按端口号查找一个进程?如何查看一个进程的CPU和内存.文件句柄使用情况?如何查看CPU利用率高的TOP10进程清单? 目录 如何按名称或PID查找一个进程?如何按端 ...

  7. 4G DTU的应用场景介绍

    4G DTU因为信号要比传统的gprs网络要好,目前已经被广泛应用于物联网产业链中的M2M行业,以远向4G DTU LTE-520为例,它的应用场景如智能电网.智能交通.智能家居.金融.移动 POS ...

  8. eyoucms破解授权/去版权插件

    插件描述:eyoucms内容管理系统的授权破解,可以去版权的插件,需要请自行关注. https://hbh.cool/find/136.html

  9. 300万运算/秒 :VoltDB在电信行业基准测试上可线性扩展性能

    01 总 体 概 述 VoltDB受到全球电信软件解决方案提供商的信赖,后者将其作为首选内存数据库来驱动他们部署在全球100多家运营商处的任务关键型应用.VoltDB受到青睐的原因在于其性能和功能不仅 ...

  10. 对于button元素的理解

    button有四种常用的类型: submit:  此按钮将表单数据提交给服务器.如果未指定属性,或者属性动态更改为空值或无效值,则此值为默认值. reset:  此按钮重置所有组件为初始值. butt ...