大多数人应该会同意HashMap是现在面试最喜欢问的主题之一。我和同事常常进行讨论,并很有帮助。现在,我继续和大家讨论。

我假设你对HashMap的内部工作原理感兴趣,并且你已经知道了基本的HashMap使用,所以我跳过这部分。但如果HashMap的概念你觉得很新,那么参考官方 Java docs

在继续之前,我强烈建议你阅读我以前的帖子:使用hashCode()和equals()方法 - Java

本文包括如下内容:

1)一句话回答

2)什么是Hashing?

3)关于Entry类

4)put()方法到底干了什么

5)get()方法内部是如何工作的

6)注意事项

7)[更新 ] Java8改进

一句话回答

如果有人问我“描述下HashMap怎么工作的?我会简单地回答:“按Hash原理”,如此简单而已。但要详细回答这个问题,那么你必须非常清楚地知道Hash的基本知识,对吗??

什么是Hashing

最简单形式的散列(Hashing)是一种根据任何变量/对象对其属性,应用任何公式/算法后分配一个独特的数字的方法。一个真正的散列函数必须遵循以下规则:

当函数在相同或相等的对象上应用时,哈希函数应该每次返回相同的哈希码。换句话说,两个相等的对象必须一致地生成相同的哈希码。

所有Java中的对象都从Object类继承一个默认得hashCode()方法实现。这个函数通过将对象的内部地址转换成整数来产生哈希码,从而为所有不同的对象生成不同的哈希码。

关于Entry类

Map的定义是:“一个将key映射到value的对象”。很容易..对吗?

因此,必然在HashMap类中有一些机制存储键值对。回答是肯定的,HashMap有一个内部类Entry,它看起来像这样:

  1. static class Entry<K ,V> implements Map.Entry<K ,V>
  2. {
  3. final K key;
  4. V value;
  5. Entry<K ,V> next;
  6. final int hash;
  7. ...//More code goes here
  8. }

Entry类具有key和value的映射,并作为字段存储。key已被标记为final,另外它还有两个别的字段:next和hash。在下面,我们将努力理解为什么需要这些字段。

put()方法到底干了什么

理解put()方法的实现之前,先需要知道Entry类型的对象存储在一个Entry类型数组中。HashMap类如下定义这个数组:

  1. /**
  2. * The table, resized as necessary. Length MUST Always be a power of two.
  3. */
  4. transient Entry[] table;

现在看put()方法的代码实现:

  1. /**
  2. * Associates the specified value with the specified key in this map. If the
  3. * map previously contained a mapping for the key, the old value is
  4. * replaced.
  5. *
  6. * @param key
  7. * key with which the specified value is to be associated
  8. * @param value
  9. * value to be associated with the specified key
  10. * @return the previous value associated with <tt>key</tt>, or <tt>null</tt>
  11. * if there was no mapping for <tt>key</tt>. (A <tt>null</tt> return
  12. * can also indicate that the map previously associated
  13. * <tt>null</tt> with <tt>key</tt>.)
  14. */
  15. public V put(K key, V value) {
  16. if (key == null)
  17. return putForNullKey(value);
  18. int hash = hash(key.hashCode());
  19. int i = indexFor(hash, table.length);
  20. for (Entry<K , V> e = table[i]; e != null; e = e.next) {
  21. Object k;
  22. if (e.hash == hash && ((k = e.key) == key || key.equals(k))) {
  23. V oldValue = e.value;
  24. e.value = value;
  25. e.recordAccess(this);
  26. return oldValue;
  27. }
  28. }
  29.  
  30. modCount++;
  31. addEntry(hash, key, value, i);
  32. return null;
  33. }

让我们逐一解释以上步骤:

1)  首先,检查key是否为null。如果key为null,则将value存储在table[0]。因为null的哈希码总是0。

2)  然后,通过调用key的hashCode()方法得到一个哈希码。此哈希码用于计算Entry对象存储在Entry[]数组中的索引。JDK的设计师认为,可能有一些写得不好的hashCode()函数可以返回非常高或低的哈希码。为了解决这个问题,他们推出了另一hash()函数,并通过将key对象的哈希码传给这个hash()函数,从而在数组索引的大小范围获得哈希码。

3)现在,indexFor(hash, table.length)函数被用来计算存储Entry对象的准确索引位置。

4)现在,来到for循环部分。正如我们所知道的,两个不等的对象可以有相同的哈希码,两个不同的对象如何存储在同一个数组位置(称为桶)。

答案是LinkedList。如果您记得,Entry类有一个属性“next”。这个属性总是指向链中的下一个对象。这正是链表的行为。

因此,在发生碰撞的时候,Entry对象以链表的形式存储。当一个Entry对象需要存储在特定的索引位置,HashMap检查是否已经有一个Entry了?如果没有存在,那么Entry对象存储在这个位置。

如果已经有一个Entry对象存储在所计算的索引位置上,那么它的next属性就被检查了。如果它为null,那么当这个Entry对象成为LinkedList的下一个节点。如果下一个变量不是null,则继续执行该过程,直到下一个位置的值为null为止。

如果我们增加一个key和value到和之前Entry对象相同的对象呢?从逻辑上说,它会取代旧value。它是怎么做的?好了,首先确定Entry对象的储存的索引位置后,对在链表中的每个对象,调用它们的equal()方法。LinkedList上的所有这些Entry对象将有类似的哈希码,但equals()方法将测试它们是否真的相等。如果key.equals(k)为真,则这两个键被视为同一个键对象。这将导致只替换Entry对象中的value对象。

也就说hashCode()方法在名叫table的Entry数组上找位置,equal()方法在桶链表上找位置

通过这样,HashMap保证了所有键的唯一性。

get()方法内部是如何工作的

现在我们知道了键值对(key-value pairs)怎么存储在HashMap中的。接下来的问题是:当一个对象被传递给HashMap的get方法发生了什么?值对象是如何确定返回的?

答案我们已经知道,正如在put()法中唯一键的确定的方式,同样的逻辑应用于get()方法中。HashMap根据传递的对象作作为键,精确匹配,它只是返回存储于当前Entry对象中的值。

如果没有发现匹配,get()方法返回null。

让我们看看代码:

  1. /**
  2. * Returns the value to which the specified key is mapped, or {@code null}
  3. * if this map contains no mapping for the key.
  4. *
  5. * <p>
  6. * More formally, if this map contains a mapping from a key {@code k} to a
  7. * value {@code v} such that {@code (key==null ? k==null :
  8. * key.equals(k))}, then this method returns {@code v}; otherwise it returns
  9. * {@code null}. (There can be at most one such mapping.)
  10. *
  11. * </p><p>
  12. * A return value of {@code null} does not <i>necessarily</i> indicate that
  13. * the map contains no mapping for the key; it's also possible that the map
  14. * explicitly maps the key to {@code null}. The {@link #containsKey
  15. * containsKey} operation may be used to distinguish these two cases.
  16. *
  17. * @see #put(Object, Object)
  18. */
  19. public V get(Object key) {
  20. if (key == null)
  21. return getForNullKey();
  22. int hash = hash(key.hashCode());
  23. for (Entry<K , V> e = table[indexFor(hash, table.length)]; e != null; e = e.next) {
  24. Object k;
  25. if (e.hash == hash && ((k = e.key) == key || key.equals(k)))
  26. return e.value;
  27. }
  28. return null;
  29. }

注意事项

  1. 存储Entry对象的数据结构是一个名为table的Entry类型数组。
  2. 数组在特定位置的索引被称为桶,因为它可以保存一个Entry类型对象链表的第一个元素。
  3. Key对象需要hashCode()方法,用于计算Entry对象的存放索引位置。
  4. Key对象的equals()法用来确保key在Map中的唯一性。
  5. Value对象的的hashCode()和equals()方法在HashMap的get()和put()方法中不会被使用。
  6. null键的哈希代码总是0,而对应的Entry对象总是存储在Entry数组的零索引位置。

[更新]Java 8改进

作为JEP 180的一部分,有一个对HashMap的性能改进,假如key对象有许多碰撞,则使用平衡树而不是链表来存储Entry对象。其主要思想是,一旦哈希桶中的项目数量超出某个阈值时,该桶将从使用链接切换到使用平衡树。在hash高碰撞的情况下,这将把最坏情况下的性能从O(n)改善到O(log n)。

基本上,当一桶太大(目前:treeify_threshold = 8),HashMap用tree map动态替换它。这样就不再是O(n),到是更好的O(log n)。

我希望通过这篇文章我能正确地表达我的想法。如果您发现有任何差异或需要任何帮助,请发表评论。

Happy Learning !!

HashMap如何工作 - Java的更多相关文章

  1. 【转】Java学习---HashMap的工作原理

    [原文]https://www.toutiao.com/i6592560649652404744/ HashMap的工作原理是近年来常见的Java面试题.几乎每个Java程序员都知道HashMap,都 ...

  2. Java中的HashMap的工作原理是什么?

    问答题23 /120 Java中的HashMap的工作原理是什么? 参考答案 Java中的HashMap是以键值对(key-value)的形式存储元素的.HashMap需要一个hash函数,它使用ha ...

  3. Java中的数据结构有哪些?HashMap的工作原理是什么?

    Java中常用数据结构 常用的数据结构有哈希表,线性表,链表,java.util包中有三个重要的接口:List,Set,Map常用来实现基本的数据结构 HashMap的工作原理 HashMap基于ha ...

  4. HashMap的工作原理

    HashMap的工作原理   HashMap的工作原理是近年来常见的Java面试题.几乎每个Java程序员都知道HashMap,都知道哪里要用HashMap,知道HashTable和HashMap之间 ...

  5. HashMap的工作原理深入再深入

    前言 首先再次强调hashcode (==)和equals的真正含义(我记得以前有人会说,equals是判断对象内容,hashcode是判断是否相等之类): equals:是否同一个对象实例.注意,是 ...

  6. [转] HashMap的工作原理

    HashMap的工作原理是近年来常见的Java面试题.几乎每个Java程序员都知道HashMap,都知道哪里要用HashMap,知道Hashtable和HashMap之间的区别,那么为何这道面试题如此 ...

  7. 【转】HashMap的工作原理

    很好的文章,推荐Java的一个好网站:ImportNew HashMap的工作原理是近年来常见的Java面试题.几乎每个Java程序员都知道HashMap,都知道哪里要用HashMap,知道Hasht ...

  8. 转:HashMap的工作原理,及笔记

    HashMap的工作原理是近年来常见的Java面试题.几乎每个Java程序员都知道HashMap,都知道哪里要用HashMap,知道Hashtable和HashMap之间的区别,那么为何这道面试题如此 ...

  9. HashMap的工作原理(转)

    HashMap的工作原理是近年来常见的Java面试题.几乎每个Java程序员都知道HashMap,都知道哪里要用HashMap,知道Hashtable和HashMap之间的区别,那么为何这道面试题如此 ...

随机推荐

  1. 修改maven本地仓库的默认地址

    由于maven默认仓库地址为C盘,所以缓存jar文件多了会占用掉C盘很多空间,鉴于此可更改maven仓库地址来避免.   1. 打开maven解压后目录,找到conf文件夹中的settion.xml文 ...

  2. 蓝桥杯-有奖猜谜-java

    /* (程序头部注释开始) * 程序的版权和版本声明部分 * Copyright (c) 2016, 广州科技贸易职业学院信息工程系学生 * All rights reserved. * 文件名称: ...

  3. 2017TSC世界大脑与科技峰会,多角度深入探讨关于大脑意识

    TSC·世界大脑与科技峰会是全世界范围内的集会,多角度深入探讨关于大脑意识体验来源这一根本话题,我们是谁,现实的本质是什么,我们所处宇宙空间的本质为何.该峰会由亚利桑那大学意识研究中心主办. 会议时间 ...

  4. (原创)性能测试中,Oracle服务器定位CPU使用率高的瓶颈(SQL)

    本篇博客记录一次性能测试过程中,定位对CPU使用率高的瓶颈问题,主要定位SQL为准 一.用SQL命令定位1.首先用TOP命令监控系统资源,如果是AIX系统,就用topas,进入TOP命令的滚动刷新数据 ...

  5. vue.js 初体验— Chrome 插件开发实录

    欢迎大家关注腾讯云技术社区-博客园官方主页,我们将持续在博客园为大家推荐技术精品文章哦~ 作者:陈纬杰 背景 对于经常和动画开发打交道的开发者对于Animate.css这个动画库不会陌生,它把一些常见 ...

  6. 深入理解Java常用类----String(二)

    上篇介绍了String类的构造器,获取内部属性等方法,最后留下了最常用的局部操作函数没有介绍,本篇将接着上篇内容,从这些最常见的函数的操作说起,看看我们日常经常使用的这些方法的内部是怎么实现的.第一个 ...

  7. Facade模式——设计模式学习(转载)

    Facade模式 一 意图 为子系统中的一组接口提供一个一致的界面,Facade模式定义了一个高层接口,这个接口使得这一子系统更加容易使用. 二 动机 将一个系统划分成为若干个子系统有利于降低系统的复 ...

  8. python django 实现验证码的功能

    我也是刚学Python  Django不久很多都不懂,所以我现在想一边学习一边记录下来然后大家一起讨论! 验证码功能一开始我在网上找了很多的demo但是我在模仿他们写的时候,发现在我的版本上根本就不能 ...

  9. Mongodb密码安全设置

    先从官网下载mongo安装包(建议安装3.0之后的版本)版本选择下载链接: https://www.mongodb.org/dl/win32/x86_64-2008plus-ssl?_ga=2.210 ...

  10. Java基础知识二次学习-- 第一章 java基础

    基础知识有时候感觉时间长似乎有点生疏,正好这几天有时间有机会,就决定重新做一轮二次学习,挑重避轻 回过头来重新整理基础知识,能收获到之前不少遗漏的,所以这一次就称作查漏补缺吧!废话不多说,开始! 第一 ...