转载请注明出处：jiq•钦's technical Blog

一、HashMap

HashMap，基于散列(哈希表)存储“Key-Value”对象引用的数据结构。

存入的键必须具备两个关键函数：

（1）equals(): 推断两个Key是否同样，用来保证存入的Key的唯一性。

（2）hashCode(): 依据k-v对象的Key来计算其引用在散列表中存放的位置；

HashMap底层结构是一个数组：

transientEntry<K,V>[] table

而当中Entry<K,V>定义例如以下：

static classEntry<K,V> implements Map.Entry<K,V> {

final K key;

V value;

Entry<K,V> next;

int hash;

}

包括了key，value以及hash值。更重要的是另一个指向下一个节点的next指针。

结合以下将要介绍的put方法可知HashMap底层是一个哈希表。以链接法解决冲突。

在网上找到一张画的比較好的图片：

watermark/2/text/aHR0cDovL2Jsb2cuY3Nkbi5uZXQvaml5aXFpbmxvdmV4eA==/font/5a6L5L2T/fontsize/400/fill/I0JBQkFCMA==/dissolve/70/gravity/Center" alt="" />

1、public V put(K key, V value)

直接看代码：

public V put(K key,V value) {

        if (table == EMPTY_TABLE) {

            inflateTable(threshold);

        }

        //key为null时的插入

        if (key == null)

            return putForNullKey(value);

        //依据key计算hash值

        int hash = hash(key);

        //返回哈希表索引位置

        int i = indexFor(hash, table.length);

        //在哈希表中该索引处的链表中查找同样key的Entry<K,V>

        //注意table[i]是指向Entry<K,V>链表头结点的指针

        for (Entry<K,V> e = table[i]; e!= null; e = e.next) {

            Object k;

            if (e.hash == hash && ((k =e.key) == key || key.equals(k))) {

                   //通过equals方法推断找到同样key的节点，用新value覆盖旧value并返回旧value

                V oldValue = e.value;

                e.value = value;

                e.recordAccess(this);

                return oldValue;

            }

        }

        modCount++;

        //创建一个新的Entry<K,V>实体。头插法插入到位置i处

        addEntry(hash, key, value, i);

        return null;

    }

当中针对key为null的处理例如以下：

private V putForNullKey(V value) {

//在hash表的第0个位置開始找是否已经有了key为null的节点

        for (Entry<K,V> e = table[0]; e!= null; e = e.next) {

            if (e.key == null) {

                V oldValue = e.value;

                e.value = value;

                e.recordAccess(this);

                return oldValue;

            }

        }

        modCount++;

        //在hash表的第0个位置用头插法插入key为null的这个节点

        addEntry(0, null, value, 0);

        return null;

    }

当中通过key计算hash值方法例如以下：

final inthash(Object k) {

        int h = hashSeed;

        if (0 != h && k instanceofString) {

            returnsun.misc.Hashing.stringHash32((String) k);

        }

        //调用Key的hashCode()方法计算hash值

        h ^= k.hashCode();

        // This function ensures that hashCodesthat differ only by

        // constant multiples at each bitposition have a bounded

        // number of collisions (approximately8 at default load factor).

        h ^= (h >>> 20) ^ (h>>> 12);

        return h ^ (h >>> 7) ^ (h>>> 4);

    }

由此能够得出下面结论：

（1）当插入一个<Key, Value>，发现此Key已经存在时，将用新的value覆盖旧的value。

（2）当插入的<Key, Value>key为null时，将插入到hash表的位置0处，而且仅仅会有一个key为null的节点；

（3）当插入一个<Key, Value>时通过Key的hashCode()方法计算在hash表中的索引。通过Key的equals()方法推断两个Entry<K,V>的Key是否同样，同样会覆盖。所以说插入的<Key, Value>中的Key必须实现这两个方法。

2、public V get(Object key)

依据Key返回Value方法就相对简单：

public V get(Objectkey) {

        if (key == null)

            return getForNullKey();

        Entry<K,V> entry = getEntry(key);

        return null == entry ? null :entry.getValue();

    }

当中getEntry(key)方法为主要实现：

final Entry<K,V> getEntry(Object key) {

        if (size == 0) {

            return null;

        }

        //依据Key计算hash值

        int hash = (key == null) ? 0 :hash(key);

        //indexFor(hash,table.length)依据hash值返回其在hash表中索引位置

        //在该索引位置指向的链表中查找Key同样的节点并返回其Value

        for (Entry<K,V> e =table[indexFor(hash, table.length)];

             e != null;

             e = e.next) {

            Object k;

            if (e.hash == hash &&

                ((k = e.key) == key || (key !=null && key.equals(k))))

                return e;

        }

        return null;

    }

3、散列表容量

HashMap有默认的装载因子loadFactor=0.75，默认的entry数组的长度为16。装载因子的意义在于使得entry数组有冗余，默认即同意25%的冗余，当HashMap的数据的个数超过12（16*0.75）时即会对entry数组进行第一次扩容，后面的再次扩容依次类推。

HashMap每次扩容一倍，resize时会将已存在的值从新进行数组下标的计算，这个是比較浪费时间的。在平时使用中，假设能预计出大概的HashMap的容量。能够合理的设置装载因子loadFactor和entry数组初始长度即能够避免resize操作，提高put的效率。

以下看看resize操作时怎样进行的：

void resize(intnewCapacity) {

        Entry[] oldTable = table;

        int oldCapacity = oldTable.length;

        if (oldCapacity == MAXIMUM_CAPACITY) {

            threshold = Integer.MAX_VALUE;

            return;

        }

        //依据新的容量又一次创建hash表

        Entry[] newTable = newEntry[newCapacity];

        //逐个将节点拷贝至新hash表，较为耗时

        transfer(newTable,initHashSeedAsNeeded(newCapacity));

        table = newTable;

        threshold = (int)Math.min(newCapacity *loadFactor, MAXIMUM_CAPACITY + 1);

    }

4、相似结构

（1）Hashtable：

HashMap的早期版本号，底层和HashMap相似，也是hash表存储，链接法解决冲突，通过synchronizedkeyword保证线程安全，以下看看其put方法，和HashMap的put方法非常像：

public synchronizedV put(K key, V value) {

        //不同意Key为null的情况

        if (value == null) {

            throw new NullPointerException();

        }

        Entry tab[] = table;

        //利用key的hashCode()方法计算hash值

        int hash = hash(key);

        //除留余数法计算索引

        int index = (hash & 0x7FFFFFFF) %tab.length;

        //通过equals()方法找到key同样的节点覆盖

        for (Entry<K,V> e = tab[index] ;e != null ; e = e.next) {

            if ((e.hash == hash) &&e.key.equals(key)) {

                V old = e.value;

                e.value = value;

                return old;

            }

        }

        modCount++;

        if (count >= threshold) {

            // Rehash the table if thethreshold is exceeded

            rehash();

            tab = table;

            hash = hash(key);

            index = (hash & 0x7FFFFFFF) %tab.length;

        }

        //插入新节点

        Entry<K,V> e = tab[index];

        tab[index] = new Entry<>(hash,key, value, e);

        count++;

        return null;

    }

（2）ConcurrentHashMap

HashMap的线程安全版本号，底层和HashMap差点儿相似。也是採用hash表存储。链接法解决冲突，通过Key的hashCode()方法计算hash表索引。通过key的equals()方法推断两个Key是否同样。

不同点在于。ConcurrentHashMap针对hash表提出了一个“分段”的概念。每次插入一个<Key。Value>的时候，都先逐个分段请求获取锁。获取成功之后再运行在该hash表分段的插入操作。

总结：三者底层实现都是一样，可是不同之处在于是否线程安全，以及实现线程安全的方式。

HashMap不支持线程安全，是一个简单高效的版本号。Hashtable通过synchronizedkeyword简单粗暴地实现了一个线程安全的HashMap。而新的ConcurrentHashMap通过一种叫做分段的灵活的方式实现了线程安全的HashMap。

所以不管出于什么原因，旧的Hashtable不建议再使用。若没有并发訪问需求，推荐HashMap，否则推荐线程安全的ConcurrentHashMap。

二、HashSet

HashSet是为独立元素的存放而设计的哈希存储。长处是高速存取。

HashSet的设计较为“偷懒”。其直接在HashMap上封装而成：

public classHashSet<E>

    extends AbstractSet<E>

    implements Set<E>, Cloneable,java.io.Serializable

{

    static final long serialVersionUID =-5024744406713321676L;

    private transient HashMap<E,Object>map;

    // Dummy value to associate with an Objectin the backing Map

    private static final Object PRESENT = newObject();

能够看究竟层就是一个HashMap。Key存放放入集合的元素。而相应的Value则是一个随意对象PRESENT 。

以下是其Put方法：

public boolean add(Ee) {

        return map.put(e, PRESENT)==null;

    }

以下是返回迭代器的方法：

publicIterator<E> iterator() {

        return map.keySet().iterator();

    }

Java容器：HashMap和HashSet解析的更多相关文章

【转】Java学习---HashMap和HashSet的内部工作机制
[原文]https://www.toutiao.com/i6593863882484220430/ HashMap和HashSet的内部工作机制 HashMap 和 HashSet 内部是如何工作的? ...
深入理解Java容器——HashMap
目录存储结构初始化 put resize 树化 get 为什么equals和hashCode要同时重写? 为何HashMap的数组长度一定是2的次幂? 线程安全参考存储结构 JDK1.8前是数 ...
[Java语言] HashMap，HashSet，Hashtable，Vector，ArrayList 的关系 <转>
这么几个比较常用的但是比较容易混淆的概念同出于 java.util 包.本文仅作几个类的浅度解析. (本文基于JDK1.7,源码来自openjdk1.7.) ├── Collection │ ├── ...
基于Java的HashMap和HashSet实现
一.Map接口类: import java.util.Iterator; public interface IMap<K, V> { /* 清除所有键值对 */ void clear(); ...
刷题upupup【Java中HashMap、HashSet用法总结】
HashMap: 常用操作 1. containsKey() 判断HashMap是否包含key 2. containsValue() 判断HashMap是否包含“值为value”的元素 3. get( ...
java容器HashMap原理
1.为什么需要HashMap 前面我们说了ArrayList和LinkedList,它们对容器内的对象都能实现增.删.改.查.遍历等操作, 并且对应不同的情况,我们可以选择不同的List,用以提高效率 ...
java遍历hashMap、hashSet、Hashtable
一.遍历HashMap Map<Integer, String> map = new HashMap<Integer, String>(); 方法一:效率高 for(Entry ...
java集合-HashMap源码解析
HashMap 键值对集合实现原理: HashMap 是基于数组 + 链表实现的. 通过hash值计算数组索引,将键值对存到该数组中. 如果多个元素hash值相同,通过链表关联,再头部插入新添加的 ...
Java容器深入浅出之HashSet、TreeSet和EnumSet
Java集合中的Set接口,定义的是一类无顺序的.不可重复的对象集合.如果尝试添加相同的元素,add()方法会返回false,同时添加失败.Set接口包括3个主要的实现类:HashSet.TreeSe ...

随机推荐

tomcat中server.xml配置详解(转载)（三）
转载自:https://www.cnblogs.com/starhu/p/5599773.html 一. <Engine>元素每个Service元素只能有一个Engine元素.处理在同 ...
iOS mac添加证书不能修改“System Roots”钥匙串错误
iOS mac添加证书不能修改“System Roots”钥匙串错误如图: 解决方式: 打开钥匙串---登录---,直接把证书拖过来然后,查看--我的证书,里面,找到证书,即可
嵌入web字体
@font-face模块可以帮助我们轻松解决Web页面中使用优雅字体的方式,而且我们可以根据需要自定义多种字体,但是每个@font-face只能定义一种,若需要多个字体就启用多个@f ...
【Linux】行首、行尾添加字符串
在行首或者行尾添加字符串的方式有以下2种环境描述 test.txt文件内容如下: hello world Qinys 要求:在每一行的行首添加AAA,行尾添加666 VIM编辑状态添加首先使用命令 ...
python处理xls、xlsx格式excle
一.windows下读取xls格式文件,所需模块xlrd.xlw 1.下载安装包 xlrd地址:https://pypi.org/project/xlrd/#files xlwt地址:https:// ...
oracle 数据导入和导出(原创)
oracle的数据导入导出必须是在两个地方建立相同的用户才能完整导入(本地导入新的数据库需重建权限).所以导入就得按以下步骤进行: 假定服务器端用户为puser 服务器端导出可以这样做: 导出数据:e ...
idea lib下有jar包但是仍然报错找不到类
现象: idea lib下有jar包但是仍然报错找不到类但是有个奇怪现象同样的配置下项目在eclipse中可以正常编译启动. package com.puhui.car.aspect; imp ...
HDU 5303 Delicious Apples（思维题）
Delicious Apples Time Limit: 5000/3000 MS (Java/Others) Memory Limit: 524288/524288 K (Java/Other ...
点滴积累【JS】---JS小功能(checkbox实现全选和全取消)
效果: 代码: <head runat="server"> <title></title> <script type="text ...
django的html模板中获取字典的值
在django的html模板中获取字典中的值应当直接使用字典.[key] 的方式 {% for i in lists %} <li id="{{i.id}}" class ...

Java容器：HashMap和HashSet解析

转载请注明出处：jiq•钦's technical Blog

Java容器：HashMap和HashSet解析的更多相关文章

随机推荐

热门专题