[Java]HashMap实现与哈希冲突，与HashTable的区别

对于 Map ，最直观就是理解就是键值对，映射，key-value 形式。一个映射不能包含重复的键，一个键只能有一个值。平常我们使用的时候，最常用的无非就是 HashMap。

HashMap 实现了 Map 接口，允许使用 null 值和 null 键，并且不保证映射顺序。

HashMap 有两个参数影响性能：

初始容量：表示哈希表在其容量自动增加之前可以达到多满的一种尺度

加载因子：当哈希表中的条目超过了容量和加载因子的乘积的时候，就会进行重哈希操作。

如下成员变量源码：

static final float DEFAULT_LOAD_FACTOR = 0.75f;

static final int DEFAULT_INITIAL_CAPACITY = 1 << 4;

transient Node<K,V>[] table;

可以看到，默认加载因子为 0.75，默认容量为 1 << 4，也就是 16。加载因子过高，容易产生哈希冲突，加载因子过小，容易浪费空间，0.75是一种折中。

另外，整个 HashMap 的实现原理可以简单的理解成：当我们 put 的时候，首先根据 key 算出一个数值 x，然后在 table[x] 中存放我们的值。这样有一个好处是，以后的 get 等操作的时间复杂度直接就是O(1)，因为 HashMap 内部就是基于数组的一个实现。

put 方法的实现与哈希冲突

下面再结合代码重点分析下 HashMap 的 put 方法的内部实现和哈希冲突的解决办法：

public V put(K key, V value) {

    return putVal(hash(key), key, value, false, true);

}

final V putVal(int hash, K key, V value, boolean onlyIfAbsent,

                   boolean evict) {

    Node<K,V>[] tab; Node<K,V> p; int n, i;

    if ((tab = table) == null || (n = tab.length) == 0)

        n = (tab = resize()).length;

    if ((p = tab[i = (n - 1) & hash]) == null)

        tab[i] = newNode(hash, key, value, null);

    else {

        Node<K,V> e; K k;

        if (p.hash == hash &&

            ((k = p.key) == key || (key != null && key.equals(k))))

            e = p;

        else if (p instanceof TreeNode)

            e = ((TreeNode<K,V>)p).putTreeVal(this, tab, hash, key, value);

        else {

            for (int binCount = 0; ; ++binCount) {

                if ((e = p.next) == null) {

                    p.next = newNode(hash, key, value, null);

                    if (binCount >= TREEIFY_THRESHOLD - 1) // -1 for 1st

                        treeifyBin(tab, hash);

                        break;

                    }

                if (e.hash == hash &&

                        ((k = e.key) == key || (key != null && key.equals(k))))

                    break;

                p = e;

            }

        }

        if (e != null) { // existing mapping for key

            V oldValue = e.value;

            if (!onlyIfAbsent || oldValue == null)

                e.value = value;

            afterNodeAccess(e);

            return oldValue;

        }

    }

    ++modCount;

    if (++size > threshold)

        resize();

    afterNodeInsertion(evict);

    return null;

}

首先我们看到 hash(key) 这个就是表示要根据 key 值算出一个数值，以此来决定在 table 数组的哪一个位置存放我们的数值。（Ps：这个 hash(key) 方法也是大有讲究的，会严重影响性能，实现得不好会让 HashMap 的 O(1) 时间复杂度降到 O(n)，在JDK8以下的版本中带来灾难性影响。它需要保证得出的数在哈希表中的均匀分布，目的就是要减少哈希冲突）

重要说明一下：

**JDK8 中哈希冲突过多，链表会转红黑树，时间复杂度是O(logn)，不会是O(n) **

**JDK8 中哈希冲突过多，链表会转红黑树，时间复杂度是O(logn)，不会是O(n) **

**JDK8 中哈希冲突过多，链表会转红黑树，时间复杂度是O(logn)，不会是O(n) **

然后，我们再看到：

if ((p = tab[i = (n - 1) & hash]) == null)

    tab[i] = newNode(hash, key, value, null);

else {

    ......

这就表示，如果没有哈希冲突，那么就可以放入数据 tab[i] = newNode(hash, key, value, null); 如果有哈希冲突，那么就执行 else 需要解决哈希冲突。

那么放入数据其实就是建立一个 Node 节点，该 Node节点有属性 key，value，分别保存我们的 key 值和 value 值，然后再把这个 Node 节点放入到 table 数组中，并没有什么神秘的地方。

static class Node<K,V> implements Map.Entry<K,V> {

    final int hash;

    final K key;

    V value;

    Node<K,V> next;

    Node(int hash, K key, V value, Node<K,V> next) {

        this.hash = hash;

        this.key = key;

        this.value = value;

        this.next = next;

    }

}

上述可以看到 Node 节点中有一个 Node<K,V> next; ，其实仔细思考下就应该知道这个是用来解决哈希冲突的。下面再看看是如何解决哈希冲突的：

哈希冲突：通俗的讲就是首先我们进行一次 put 操作，算出了我们要在 table 数组的 x 位置放入这个值。那么下次再进行一个 put 操作的时候，又算出了我们要在 table 数组的 x 位置放入这个值，那之前已经放入过值了，那现在怎么处理呢？

其实就是通过链表法进行解决。

首先，如果有哈希冲突，那么：

if (p.hash == hash &&

    ((k = p.key) == key || (key != null && key.equals(k))))

e = p;

需要判断两者的 key 是否一样的，因为 HashMap 不能加入重复的键。如果一样，那么就覆盖，如果不一样，那么就先判断是不是 TreeNode 类型的：

 else if (p instanceof TreeNode)

    e = ((TreeNode<K,V>)p).putTreeVal(this, tab, hash, key, value);

这里表示是不是现在已经转红黑树了（在大量哈希冲突的情况下，链表会转红黑树），一般我们小数据的情况下，是不会转的，所以这里暂时不考虑这种情况（Ps：本人也没太深入研究红黑树，所以就不说这个了）。

如果是正常情况下，会执行下面的语句来解决哈希冲突：

for (int binCount = 0; ; ++binCount) {

    if ((e = p.next) == null) {

        p.next = newNode(hash, key, value, null);

        if (binCount >= TREEIFY_THRESHOLD - 1) // -1 for 1st

            treeifyBin(tab, hash);

        break;

    }

    if (e.hash == hash &&

            ((k = e.key) == key || (key != null && key.equals(k))))

        break;

    p = e;

}

这里其实就是用链表法来解决。并且：

冲突的节点放在链表的最下面。

冲突的节点放在链表的最下面。

冲突的节点放在链表的最下面。

因为首先有：p = tab[i = (n - 1) & hash] ，再 for 循环，然后有 if ((e = p.next) == null) { ,并且如果当前节点的下一个节点有值的话，那么就 p = e;，这就说明了放在最下面。

强烈建议自己拿笔拿纸画画。

总结

一个映射不能包含重复的键，一个键只能有一个值。允许使用 null 值和 null 键，并且不保证映射顺序。

HashMap 解决冲突的办法先是使用链表法，然后如果哈希冲突过多，那么会把链表转换成红黑树，以此来保证效率。

如果出现了哈希冲突，那么新加入的节点放在链表的最后面。

参考

强烈建议看一下：

Java HashMap工作原理及实现

 Java 8：HashMap的性能提升

HashTable

HashTable 是 HashMap 的线程安全版本。内部的实现几乎和 HashMap 一模一样。例如：

同样的有一个数组：

private transient Entry<?,?>[] table;

对于 put 方法：

public synchronized V put(K key, V value) {

    ......

    // Makes sure the key is not already in the hashtable.

    Entry<?,?> tab[] = table;

    int hash = key.hashCode();

    int index = (hash & 0x7FFFFFFF) % tab.length;

    @SuppressWarnings("unchecked")

    Entry<K,V> entry = (Entry<K,V>)tab[index];

    for(; entry != null ; entry = entry.next) {

        if ((entry.hash == hash) && entry.key.equals(key)) {

            V old = entry.value;

            entry.value = value;

            return old;

        }

    }

    addEntry(hash, key, value, index);

    return null;

}

这里可以看到， for 循环表示如果出现了哈希冲突，那么就放在最后一位。因为不断的进行 entry = entry.next，直到 entry != null。需要注意的是，JDK8 中的 HashMap 如果有很多哈希冲突的话，那么是可能会把链表变成红黑树以此来提高效率。但是这里 HashTable 并没有这样做。

另外，从这里也可以看出，HashTable 实现多线程同步的主要方式是通过加 synchronized 关键字。

另外，对于 get 方法：

@SuppressWarnings("unchecked")

public synchronized V get(Object key) {

    Entry<?,?> tab[] = table;

    int hash = key.hashCode();

    int index = (hash & 0x7FFFFFFF) % tab.length;

    for (Entry<?,?> e = tab[index] ; e != null ; e = e.next) {

        if ((e.hash == hash) && e.key.equals(key)) {

            return (V)e.value;

        }

    }

    return null;

}

这里最明显的就是 synchronized，其实还有很多其他的方法用的也是 synchronized。get 方法的处理也是先根据 key 定位到 table 的某一个位置，最后再 for 循环拿到该值（因为可能出现了哈希冲突，所以要 for 循环）。

总结

Hashtable的方法是同步的，HashMap则是非同步的，所以在多线程场合要手动同步HashMap，这个区别就像Vector和ArrayList一样。
Hashtable不允许null值（key和value都不可以），HashMap允许null值（key和value都可以）。
Hashtable比HashMap多一个elements方法用于遍历。
Hashtable使用Enumeration，HashMap使用Iterator。
哈希值的使用不同，Hashtable直接使用对象的hashCode，而HashMap重新计算hash值，而且用与代替求模。
Hashtable中hash数组默认大小是11，增加的方式是 old*2+1。HashMap中hash数组的默认大小是16，而且一定是2的指数。

[Java]HashMap实现与哈希冲突，与HashTable的区别的更多相关文章

hashmap实现及哈希冲突
原文: https://www.cnblogs.com/peizhe123/p/5790252.html HashMap 采用一种所谓的“Hash 算法”来决定每个元素的存储位置.当程序执行 map. ...
一次电话Java面试的问题总结（JDK8新特性、哈希冲突、HashMap原理、线程安全、Linux查询命令、Hadoop节点）
面试涉及问题含有: Java JDK8新特性集合(哈希冲突.HashMap的原理.自动排序的集合TreeSet) 多线程安全问题 String和StringBuffer JVM 原理.运行流程.内部 ...
【面试普通人VS高手系列】HashMap是怎么解决哈希冲突的？
常用数据结构基本上是面试必问的问题,比如HashMap.LinkList.ConcurrentHashMap等. 关于HashMap,有个学员私信了我一个面试题说: "HashMap是怎么解 ...
Java集合（九）哈希冲突及解决哈希冲突的4种方式
Java集合(九)哈希冲突及解决哈希冲突的4种方式一.哈希冲突 (一).产生的原因哈希是通过对数据进行再压缩,提高效率的一种解决方法.但由于通过哈希函数产生的哈希值是有限的,而数据可能比较多,导致 ...
[翻译]Java HashMap工作原理
大部分Java开发者都在使用Map,特别是HashMap.HashMap是一种简单但强大的方式去存储和获取数据.但有多少开发者知道HashMap内部如何工作呢?几天前,我阅读了java.util.Ha ...
Java集合类中的哈希总结
JAVA集合类中的哈希总结目录 1.哈希表 2.Hashtable.HashMap.ConcurrentHashMap.LinkedHashMap.TreeMap区别 3.Hashtable.Ha ...
Java学习笔记（二二）——Java HashMap
[前面的话] 早上起来好瞌睡哈,最近要注意一样作息状态. HashMap好好学习一下. [定义] Hashmap:是一个散列表,它存储的内容是键值对(key——value)映射.允许nul ...
java集合框架之java HashMap代码解析
java集合框架之java HashMap代码解析文章Java集合框架综述后,具体集合类的代码,首先以既熟悉又陌生的HashMap开始. 源自http://www.codeceo.com/arti ...
【转】Java HashMap工作原理（好文章）
大部分Java开发者都在使用Map,特别是HashMap.HashMap是一种简单但强大的方式去存储和获取数据.但有多少开发者知道HashMap内部如何工作呢?几天前,我阅读了java.util.Ha ...

随机推荐

HTML5响应式导航
HTML5响应式导航HTML5,响应式,jQuery特效,HTML5导航,HTML5响应式导航是一款基于HTML5实现的深灰色响应式导航菜单. 地址:http://www.huiyi8.com/sc/ ...
codeforces 660C C. Hard Process(二分)
题目链接: C. Hard Process time limit per test 1 second memory limit per test 256 megabytes input standar ...
网络编程学习笔记-MAC地址和IP地址的关系
简单地说:ip地址是服务商给你的,mac地址是你的网卡物理地址. 一.IP地址对于IP地址,相信大家都很熟悉,即指使用TCP/IP协议指定给主机的32位地址.IP地址由用点分隔开的4个8八位组构成, ...
Gym-101630C：Connections（生成树&构造）
题意:给定N点,M条有向边,满足任意点可以到达任意点.现在叫你保留2*N边,任然满足任意点可以到达任意点,输出删除的边. 思路:从1出发,DFS,得到一颗生成树,有N-1条边.反向建题.还是从1出发, ...
Android的appium实例
1.查看Android的应用包名和activity的方法 (网上有很多种方法,这里应用的是查看日志的方法) CMD中输入>adb logcat -c &g ...
如何加快建 index 索引的时间
朋友在500w的表上建索引,半个小时都没有结束.所以就讨论如何提速. 一．先来看一下创建索引要做哪些操作:1. 把index key的data 读到内存==>如果data 没在db_cache ...
[转]BX9054: 各浏览器对 document.execCommand 方法的首参数可选值范围存在差异
作者:钱宝坤标准参考无. 问题描述 execCommand 方法通常用于控制可编辑的 IFRAME 内容,制作富文本编辑器. 但他现在为止还是非标准的,方法的首参数 Commmands 的可选值由 ...
MFS安装配置使用
MFS server:192.168.209.18groupadd mfsuseradd -g mfs mfscd /usr/srctar xzvf mfs-1.6.27-5.tar.gzcd mfs ...
SQL一次性插入大量数据【转载】
在SQL Server 中插入一条数据使用Insert语句,但是如果想要批量插入一堆数据的话,循环使用Insert不仅效率低,而且会导致SQL一系统性能问题.下面介绍SQL Server支持的两种批量 ...
angular学习的一些Mark
http://www.cnblogs.com/xianrongbin/p/4104596.html http://angular-ui.github.io/

[Java]HashMap实现与哈希冲突，与HashTable的区别

总结

HashTable

总结

[Java]HashMap实现与哈希冲突，与HashTable的区别的更多相关文章

随机推荐

热门专题