HashMap详谈以及实现原理

（一）.HashMap

基于哈希表的 Map 接口的实现
允许使用 null 值和 null 键
HashMap不是线程安全，想要线程安全，Collections类的静态方法synchronizedMap获得线程安全的HashMap

1 Map map = Collections.synchronizedMap(new HashMap());

底层基于数组和链表实现
相当快的查询速度主要是因为它是通过计算散列码来决定存储的位置
HashMap中主要是通过key的hashCode来计算hash值的，只要hashCode相同，计算出来的hash值就一样。如果存储的对象对多了，就有可能不同的对象所算出来的hash值是相同的，这就出现了所谓的hash冲突。解决hash冲突的方法有很多，HashMap底层是通过链表来解决hash冲突的
紫色部分即代表哈希表，也称为哈希数组，数组的每个元素都是一个单链表的头节点，链表是用来解决冲突的，如果不同的key映射到了数组的同一位置处，就将其放入单链表中
HashMap 中Entry（1.8以下）的代码

 /**    Entry是单向链表。

      * 它是 “HashMap链式存储法”对应的链表。

      * 它实现了Map.Entry 接口，即实现getKey(), getValue(), setValue(V value), equals(Object o),  hashCode()这些函数

  **/

     static class Entry<K,V> implements Map.Entry<K,V> {

         final K key;

         V value;

         // 指向下一个节点

         Entry<K,V> next;

         final int hash;    

         // 构造函数。

         // 输入参数包括"哈希值(h)", "键(k)", "值(v)", "下一节点(n)"

         Entry(int h, K k, V v, Entry<K,V> n) {

             value = v;

             next = n;

             key = k;

             hash = h;

         }    

         public final K getKey() {

             return key;

         }    

         public final V getValue() {

             return value;

         }    

         public final V setValue(V newValue) {

             V oldValue = value;

             value = newValue;

             return oldValue;

         }    

         // 判断两个Entry是否相等

         // 若两个Entry的“key”和“value”都相等，则返回true。

         // 否则，返回false

         public final boolean equals(Object o) {

             if (!(o instanceof Map.Entry))

                 return false;

             Map.Entry e = (Map.Entry)o;

             Object k1 = getKey();

             Object k2 = e.getKey();

             if (k1 == k2 || (k1 != null && k1.equals(k2))) {

                 Object v1 = getValue();

                 Object v2 = e.getValue();

                 if (v1 == v2 || (v1 != null && v1.equals(v2)))

                     return true;

             }

             return false;

         }    

         // 实现hashCode()

         public final int hashCode() {

             return (key==null   ? 0 : key.hashCode()) ^

                    (value==null ? 0 : value.hashCode());

         }    

         public final String toString() {

             return getKey() + "=" + getValue();

         }    

         // 当向HashMap中添加元素时，绘调用recordAccess()。

         // 这里不做任何处理

         void recordAccess(HashMap<K,V> m) {

         }    

         // 当从HashMap中删除元素时，绘调用recordRemoval()。

         // 这里不做任何处理

         void recordRemoval(HashMap<K,V> m) {

         }

     }

HashMap 中Entry（jdk1.8）的代碼

/**

     * Basic hash bin node, used for most entries.  (See below for

     * TreeNode subclass, and in LinkedHashMap for its Entry subclass.)

     */

    static class Node<K,V> implements Map.Entry<K,V> {

        final int hash;

        final K key;

        V value;

        Node<K,V> next;

        Node(int hash, K key, V value, Node<K,V> next) {

            this.hash = hash;

            this.key = key;

            this.value = value;

            this.next = next;

        }

        public final K getKey()        { return key; }

        public final V getValue()      { return value; }

        public final String toString() { return key + "=" + value; }

        public final int hashCode() {

            return Objects.hashCode(key) ^ Objects.hashCode(value);

        }

        public final V setValue(V newValue) {

            V oldValue = value;

            value = newValue;

            return oldValue;

        }

        public final boolean equals(Object o) {

            if (o == this)

                return true;

            if (o instanceof Map.Entry) {

                Map.Entry<?,?> e = (Map.Entry<?,?>)o;

                if (Objects.equals(key, e.getKey()) &&

                    Objects.equals(value, e.getValue()))

                    return true;

            }

            return false;

        }

    }

HashMap其实就是一个Entry（Node）数组，Entry（Node）对象中包含了键和值，其中next也是一个Entry（Node）对象，它就是用来处理hash冲突的，形成一个链表
HashMap源码分析
一些重要属性

transient Entry[] table;//存储元素的实体数组

transient int size;//存放元素的个数

int threshold; //临界值   当实际大小超过临界值时，会进行扩容threshold = 加载因子*容量

final float loadFactor; //加载因子

transient int modCount;//被修改的次数

loadFactor加载因子是表示Hsah表中元素的填满的程度.若:加载因子越大,填满的元素越多,好处是,空间利用率高了,但:冲突的机会加大了.链表长度会越来越长,查找效率降低反之,加载因子越小,填满的元素越少,好处是:冲突的机会减小了,但:空间浪费多了.表中的数据将过于稀疏（很多空间还没用，就开始扩容了）冲突的机会越大,则查找的成本越高.因此,必须在 "冲突的机会"与"空间利用率"之间寻找一种平衡与折衷. 这种平衡与折衷本质上是数据结构中有名的"时-空"矛盾的平衡与折衷.如果机器内存足够，并且想要提高查询速度的话可以将加载因子设置小一点；相反如果机器内存紧张，并且对查询速度没有什么要求的话可以将加载因子设置大一点。不过一般我们都不用去设置它，让它取默认值0.75就好了。
常用的构造方法

public HashMap(int initialCapacity, float loadFactor) {

        //确保数字合法

        if (initialCapacity < 0)

            throw new IllegalArgumentException("Illegal initial capacity: " +

                                              initialCapacity);

        if (initialCapacity > MAXIMUM_CAPACITY)

            initialCapacity = MAXIMUM_CAPACITY;

        if (loadFactor <= 0 || Float.isNaN(loadFactor))

            throw new IllegalArgumentException("Illegal load factor: " +

                                              loadFactor);

        // Find a power of 2 >= initialCapacity

        int capacity = 1;   //初始容量

        while (capacity < initialCapacity)   //确保容量为2的n次幂，使capacity为大于initialCapacity的最小的2的n次幂

            capacity <<= 1;

        this.loadFactor = loadFactor;

        threshold = (int)(capacity * loadFactor);

        table = new Entry[capacity];

       init();

   }

    public HashMap(int initialCapacity) {

        this(initialCapacity, DEFAULT_LOAD_FACTOR);

   }

    public HashMap() {

        this.loadFactor = DEFAULT_LOAD_FACTOR;

        threshold = (int)(DEFAULT_INITIAL_CAPACITY * DEFAULT_LOAD_FACTOR);

        table = new Entry[DEFAULT_INITIAL_CAPACITY];

       init();

    }

默认初始容量为16，默认加载因子为0.75。我们可以看到上面代码中13-15行，这段代码的作用是确保容量为2的n次幂，使capacity为大于initialCapacity的最小的2的n次幂，至于为什么要把容量设置为2的n次幂，我们等下再看。

put方法
- ```
 public V put(K key, V value) {

      // 若“key为null”，则将该键值对添加到table[0]中。

          if (key == null)

             return putForNullKey(value);

      // 若“key不为null”，则计算该key的哈希值，然后将其添加到该哈希值对应的链表中。

          int hash = hash(key.hashCode());

      //搜索指定hash值在对应table中的索引

          int i = indexFor(hash, table.length);

      // 循环遍历Entry数组,若“该key”对应的键值对已经存在，则用新的value取代旧的value。然后退出！

          for (Entry<K,V> e = table[i]; e != null; e = e.next) {

               Object k;

               if (e.hash == hash && ((k = e.key) == key || key.equals(k))) {  //如果key相同则覆盖并返回旧值

                  V oldValue = e.value;

                  e.value = value;

                  e.recordAccess(this);

                  return oldValue;

               }

          }

      //修改次数+1

          modCount++;

      //将key-value添加到table[i]处

      addEntry(hash, key, value, i);

      return null;

 }    
```
```
 /**上面程序中用到了一个重要的内部接口：Map.Entry，每个 Map.Entry 其实就是一个 key-value 对。从上面程序中可以看出：当系统决定存储 HashMap 中的 key-value 对时，完全没有考虑 Entry 中的 value，仅仅只是根据 key 来计算并决定每个 Entry 的存储位置。这也说明了前面的结论：我们完全可以把 Map 集合中的 value 当成 key 的附属，当系统决定了 key 的存储位置之后，value 随之保存在那里即可。我们慢慢的来分析这个函数，第2和3行的作用就是处理key值为null的情况，我们看看

 */

 private V putForNullKey(V value) {

         for (Entry<K,V> e = table[0]; e != null; e = e.next) {

             if (e.key == null) {   //如果有key为null的对象存在，则覆盖掉

                 V oldValue = e.value;

                 e.value = value;

                 e.recordAccess(this);

                 return oldValue;

            }

        }

         modCount++;

         addEntry(0, null, value, 0); //如果键为null的话，则hash值为0

         return null;

     }

 /**

 如果key为null的话，hash值为0，对象存储在数组中索引为0的位置。即table[0]我们再回去看看put方法中第4行，它是通过key的hashCode值计算hash码，下面是计算hash码的函数：

 */

 //计算hash值的方法 通过键的hashCode来计算

     static int hash(int h) {

         // This function ensures that hashCodes that differ only by

         // constant multiples at each bit position have a bounded

         // number of collisions (approximately 8 at default load factor).

         h ^= (h >>> 20) ^ (h >>> 12);

         return h ^ (h >>> 7) ^ (h >>> 4);

     }

 /**

 得到hash码之后就会通过hash码去计算出应该存储在数组中的索引，计算索引的函数如下：

 */

   static int indexFor(int h, int length) { //根据hash值和数组长度算出索引值

      return h & (length-1);  //这里不能随便算取，用hash&(length-1)是有原因的，这样可以确保算出来的索引是在数组大小范围内，不会超出

   }
```
  　　这个我们要重点说下，我们一般对哈希表的散列很自然地会想到用hash值对length取模（即除法散列法），Hashtable中也是这样实现的，这种方法基本能保证元素在哈希表中散列的比较均匀，但取模会用到除法运算，效率很低，HashMap中则通过h&(length-1)的方法来代替取模，同样实现了均匀的散列，但效率要高很多，这也是HashMap对Hashtable的一个改进。
  
  接下来，我们分析下为什么哈希表的容量一定要是2的整数次幂。首先，length为2的整数次幂的话，h&(length-1)就相当于对length取模，这样便保证了散列的均匀，同时也提升了效率；其次，length为2的整数次幂的话，为偶数，这样length-1为奇数，奇数的最后一位是1，这样便保证了h&(length-1)的最后一位可能为0，也可能为1（这取决于h的值），即与后的结果可能为偶数，也可能为奇数，这样便可以保证散列的均匀性，而如果length为奇数的话，很明显length-1为偶数，它的最后一位是0，这样h&(length-1)的最后一位肯定为0，即只能为偶数，这样任何hash值都只会被散列到数组的偶数下标位置上，这便浪费了近一半的空间，因此，length取2的整数次幂，是为了使不同hash值发生碰撞的概率较小，这样就能使元素在哈希表中均匀地散列。

　　　　　　　　参考：Java集合---HashMap源码剖析

HashMap详谈以及实现原理的更多相关文章

详解HashMap的内部工作原理
本文将用一个简单的例子来解释下HashMap内部的工作原理.首先我们从一个例子开始,而不仅仅是从理论上,这样,有助于更好地理解,然后,我们来看下get和put到底是怎样工作的. 我们来看个非常简单的例 ...
关于HashMap put元素的原理
HashMap集合put元素的原理:(1)计算key的hashCode(2)将key的hashCode作为计算因子,通过哈希算法计算HashMap的数组下标index(3)如果index下标的数组元素 ...
HashMap的底层实现原理
HashMap的底层实现原理1,属性static final int MAX_CAPACITY = 1 << 30;//1073741824(十进制)0100000000000000000 ...
HashMap底层实现及原理
注意:文章的内容基于JDK1.7进行分析.1.8做的改动文章末尾进行讲解. 一.先来熟悉一下我们常用的HashMap: 1.HashSet和HashMap概述对于HashSst及其子类而 ...
Map实现之HashMap（结构及原理）(转)
java.util包中的集合类包含 Java 中某些最常用的类.最常用的集合类是 List 和 Map.List 的具体实现包括 ArrayList 和 Vector,它们是可变大小的列表,比较适合构 ...
HashMap和ConcurrentHashMap实现原理及源码分析
HashMap实现原理及源码分析哈希表(hash table)也叫散列表,是一种非常重要的数据结构,应用场景及其丰富,许多缓存技术(比如memcached)的核心其实就是在内存中维护一张大的哈希表, ...
Java集合：HashMap底层实现和原理（源码解析）
Note:文章的内容基于JDK1.7进行分析.1.8做的改动文章末尾进行讲解. 一.先来熟悉一下我们常用的HashMap: 1.概述 HashMap基于Map接口实现,元素以键值对的方式存储,并且允许 ...
HashMap底层结构、原理、扩容机制
https://www.jianshu.com/p/c1b616ff1130 http://youzhixueyuan.com/the-underlying-structure-and-princip ...
HashMap内部结构及实现原理
简单介绍在研究HashMap之前,我们先大概了解下其他数据结构在新增,查找等基础操作执行性能数组:采用一段连续的存储单元来存储数据.对于指定下标的查找,时间复杂度为O(1):通过给定值进行查找,需 ...

随机推荐

共识算法 pos，Dpos
在之前讲解了比特币中的共识算法pow(proot of work),我们先来简单的回顾一下. 新的交易将会广播给所有节点. 每个节点将都会讲新的交易收集到一个区块中. 每个节点都在为其区块收集困难的工 ...
leetcode个人题解——two sum
这是leetcode第一题,通过较为简单. 第一题用来测试的,用的c,直接暴力法过, /** * Note: The returned array must be malloced, assume c ...
使用树莓派实现(山寨)高清视频叠加(HDMI OSD)
项目需要在HDMI上叠加一些字符包括汉字和数值,要求不能使用台式机,本身也没有HDMI采集卡驱动开发能力,所以通过海思的HDMI编码器将HDMI编码为h.264网络视频流,然后通过树莓派解码显示,做字 ...
default & delete
一.使用“=default” 1. 显式生成拷贝控制成员的合成版本 class A { public: A() = default; A(const A &) = default; A& ...
11.22Daily Scrum
人员任务分配完成情况明天任务分配王皓南实现网页上视频浏览的功能.研究相关的代码和功能.979 数据库测试申开亮实现网页上视频浏览的功能.研究相关的代码和功能.978 实现视频浏览的功能王 ...
FZU.Software Engineering1816 · First Homework -Preparation
Introduction 041602204 : 我是喜欢狗狗(particularly Corgi & Shiba Inu.)的丁水源 : 我的爱好是音乐.电影.英语(100%!!!!).吉 ...
向redis插入数据时，返回值问题
向redis插入数据时,如果redis没有要插入的key,插入成功之后返回值为1 如果redis有这个key,插入成功之后返回值是0
lintcode-182-删除数字
182-删除数字给出一个字符串 A, 表示一个 n 位正整数, 删除其中 k 位数字, 使得剩余的数字仍然按照原来的顺序排列产生一个新的正整数. 找到删除 k 个数字之后的最小正整数. N < ...
Python 零碎信息-基础 01
1. """ 可以插入多行文字. print """ abC 123' 456''" #单引号, 双引号, 也没有关系 " ...
osg::Vec2 Vec3 Vec4
osg::Vec2可以用于保存2D纹理坐标. osg::Vec3是一个三维浮点数数组. osg::Vec4用于保存颜色数据.

HashMap详谈以及实现原理

（一）.HashMap

HashMap详谈以及实现原理的更多相关文章

随机推荐

热门专题