Map实现之HashMap(结构及原理)(转)
java.util包中的集合类包含 Java 中某些最常用的类。最常用的集合类是 List 和 Map。List 的具体实现包括 ArrayList 和 Vector,它们是可变大小的列表,比较适合构建、存储和操作任何类型对象元素列表。List 适用于按数值索引访问元素的情形。
Map 则提供了一个更通用的元素存储方法。Map 集合类用于存储元素对(称作“键”和“值”),其中每个键映射到一个值。从概念上而言,您可以将 List 看作是具有数值键的 Map。而实际上,除了 List 和 Map 都在定义 java.util 中外,两者并没有直接的联系。
Map接口的实现类有很多,其中HashMap就是比较重要的一个实现,本文就以HashMap为主重点介绍。
HashMap是基于哈希表的 Map 接口的实现。此实现提供所有可选的映射操作,并允许使用 null 值和 null 键。(除了非同步和允许使用 null 之外,HashMap 类与 Hashtable 大致相同。)此类不保证映射的顺序,特别是它不保证该顺序恒久不变。
HashMap结合了ArrayList与LinkedList两个实现的优点,,虽然HashMap并不会向List的两种实现那样在某项操作上性能较高,但是在基本操作(get 和 put)上具有稳定的性能。
首先从成员变量开始一点点的来了解HashMap和上述几个概念。
1.HashMap的成员变量:
- /**
- * 初始默认容量(必须为2的幂次方)
- */
- static final int DEFAULT_INITIAL_CAPACITY = 16;
- /**
- * 最大容量,如果被指定为一个更高的值必须为2的幂次方,并且小于1073741824.(1<<30)
- */
- static final int MAXIMUM_CAPACITY = 1 << 30;
- /**
- * 默认负载因子/负载系数
- */
- static final float DEFAULT_LOAD_FACTOR = 0.75f;
- /**
- * 内部实现表, 必要时调整大小,其长度亦为2的幂次方
- */
- transient Entry[] table;
- /**
- * map中添加的元素个数
- */
- transient int size;
- /**
- * 扩容临界值,当size达到此值时进行扩容 (容量乘以负载因子).
- */
- int threshold;
- /**
- * 内部实现表的负载因子
- */
- final float loadFactor;
- /**
- * 操作数,可以理解为map实例被操作的次数,包括添加,删除等等
- */
- transient volatile int modCount;
HashMap其内部实现是一个Entry数组table,而Entry就是保存相应键值的实体。table数组默认大小为16,我们也可以在初始化时指定更大的值,但指定值必须为2的幂次方。
通过对ArrayList的学习了解到ArrayList其内部实现也是数组,当被添加的元素超出数组的容纳极限时,ArrayList会对内部数组进行一次“扩容”,从而可以添加新的元素。
在HashMap中也有类似的概念,HashMap并不会像ArrayList一样直到数组都满了的情况下才去“扩容”,而是根据负载因子(load factor)来进行判断。
举例来说:HashMap实例中table数组的默认大小为16,负载因子为0.75,当添加元素个数大于等于12(16*0.75)时就会进行扩容。
所以说容量和负载因子直接影响着table数组是否扩容,什么时机扩容,进而影响这HashMap实例的性能。
当我们在初始化时可以指定HashMap实例的容量大小,当指定大小不为2的幂次方时,如下:
- Map map=new HashMap(131);
请问初始化完成HashMap内table的长度是多少? 答案为:256
其实只要打开HashMap的构造函数源代码就明白为什么了,以下为源代码:
- public HashMap(int initialCapacity, float loadFactor) {
- if (initialCapacity < 0)
- throw new IllegalArgumentException("Illegal initial capacity: "
- + initialCapacity);
- if (initialCapacity > MAXIMUM_CAPACITY)
- initialCapacity = MAXIMUM_CAPACITY;
- if (loadFactor <= 0 || Float.isNaN(loadFactor))
- throw new IllegalArgumentException("Illegal load factor: "
- + loadFactor);
- // Find a power of 2 >= initialCapacity
- int capacity = 1;
- while (capacity < initialCapacity)
- capacity <<= 1;
- this.loadFactor = loadFactor;
- threshold = (int) (capacity * loadFactor);
- table = new Entry[capacity];
- init();
- }
关键在于这两行:
- while (capacity < initialCapacity)
- capacity <<= 1;
如果initialCapacity(指定大小)大于capacity(原或初始化大小)时,就会不断循环进行位移赋值计算,相当于capacity=capacity *2.直至capacity 大于或等于我们指定的大小。如果指定的大小正好为2的N次幂时两个值便会相等,进而终止计算;如果指定大小不符合条件时,capacity 就会是刚好大于指定大小的那个2的N次幂的数。
所以,在上面我们指定大小为131,大于131并且为2的的N次幂的数就为256,所以此时就会按256来初始化table.
2.Entry 元素
与LinkedList类似,HashMap也是采用Entry内部类来存储实际元素信息,以下是Entry的源代码(省略部分代码):
- static class Entry<K, V> implements Map.Entry<K, V> {
- final K key;
- V value;
- Entry<K, V> next;
- final int hash;
- }
Entry中包括4个成员变量,其中key为键,value为值,next指向下一个节点元素,hash为hash值。Entry通过next属性可以寻找到下一个节点的元素,进而通过遍历就可以找到相应key下存储的信息。
3.HashMap设置元素
Map通过put方法来在Map实例中关联指定值与指定键。如果该实例已经包含了一个该键的映射关系,则旧值被替换。
示例如下:
- Map map = new HashMap();
- map.put("user1", "小明");
- map.put("user2", "小强");
- map.put("user3", "小红");
- System.out.println("user1:" + map.get("user1"));
- System.out.println("user2:" + map.get("user2"));
- System.out.println("user3:" + map.get("user3"));
- map.put("user2", "小龙");
- System.out.println("user1:" + map.get("user1"));
- //打印结果
- user1:小明
- user2:小强
- user3:小红
- user1:小明
首先,创建了一个HashMap的实例map,此时map实例中的table数组会默认初始化,创建一个长度为DEFAULT_INITIAL_CAPACITY=16的空数组。
然后,调用put方法将一对键、值(key,value)保存。当已存在Map实例中已存在指定key的映射时,会将新指定的value覆盖原value。
与LIst的相关实现add方法一样,HashMap的put方法是设置元素的入口,在put的过程中会进行一系列的判断与操作,所以只有将put方法理解透彻后HashMap的内部结构与机制才会更加清晰。
HashMap进行put操作时按以下步骤执行:
1)判断key是否为空,如果为空则调用设置null的专有方法。
2)计算key的hash值。
3)通过hash与table数组的长度计算出该元素所要放置的数组下标。
4)遍历该下标下的Entry元素链,如果找到与指定key相同的Entry则直接替换该Entry的value值并返回。
5)如果未找到则添加一个新元素至该下标下的元素链前端。
以下是一张官网上对于put操作流程的描述图片,可以作为参考:
以下是put方法的源代码,其中我已经加入了相关描述便于大家理解:
- /**
- * 设置指定值
- */
- public V put(K key, V value) {
- //1.首先判断key是否为null
- if (key == null)
- //如果为null则调用putForNullKey方法
- return putForNullKey(value);
- //2.计算key的hash值
- int hash = hash(key.hashCode());
- //3.根据计算后的hash值与table数组长度计算该key应放置到table数组的那个下标位置
- int i = indexFor(hash, table.length);
- //4.遍历该下标下的所有Entry,如果key已存在则覆盖该key所在Entry的value值
- for (Entry<K, V> e = table[i]; e != null; e = e.next) {
- Object k;
- if (e.hash == hash && ((k = e.key) == key || key.equals(k))) {
- V oldValue = e.value;
- e.value = value;
- e.recordAccess(this);
- return oldValue;
- }
- }
- modCount++;
- //5.如果该key不存在则新添加Entry元素至数组指定位置,并且该Entry作为此下标元素链的头部
- addEntry(hash, key, value, i);
- return null;
- }
- this.loadFactor = DEFAULT_LOAD_FACTOR;//0.75f
- threshold = (int)(DEFAULT_INITIAL_CAPACITY * DEFAULT_LOAD_FACTOR);//16*0.75=12
- table = new Entry[DEFAULT_INITIAL_CAPACITY];//16
- Entry<K,V> e = table[bucketIndex];
- table[bucketIndex] = new Entry<K,V>(hash, key, value, e);
- for (Entry<K,V> e = table[i]; e != null; e = e.next) {
- Object k;
- if (e.hash == hash && ((k = e.key) == key || key.equals(k))) {
- V oldValue = e.value;
- e.value = value;
- e.recordAccess(this);
- return oldValue;
- }
- }
如果HashMap实例中已经put了该key则只需遍历找到该节点Entry,更新其value并返回,所以更新已有key的操作不会调用addEntry方法。
![](http://dl2.iteye.com/upload/attachment/0105/8034/f6343626-61f9-3c82-baa9-912b160ff6b5.png)
- /**
- * 返回指定key的value
- */
- public V get(Object key) {
- // 1.判断可以是否为null
- if (key == null)
- return getForNullKey();
- // 2.计算key的hash值
- int hash = hash(key.hashCode());
- // 3.遍历table指定下标下的Entry链
- for (Entry<K, V> e = table[indexFor(hash, table.length)]; e != null; e = e.next) {
- Object k;
- // 4.如果找到则返回该Entry的value
- if (e.hash == hash && ((k = e.key) == key || key.equals(k)))
- return e.value;
- }
- // 5.未找到则返回null
- return null;
- }
6.HashMap移除元素
- Map map = new HashMap();
- map.put("user1", "小明");
- map.put("user2", "小强");
- map.put("user3", "小红");
- map.remove("user2");
- System.out.println("user1:" + map.get("user1"));
- System.out.println("user2:" + map.get("user2"));
- System.out.println("user3:" + map.get("user3"));
- //打印结果:
- user1:小明
- user2:null
- user3:小红
当主动调用remove方法时,会根据指定的key删除该节点元素。
- /**
- * 删除指定key下内容
- */
- public V remove(Object key) {
- Entry<K, V> e = removeEntryForKey(key);
- return (e == null ? null : e.value);
- }
- /**
- * 根据指定key删除元素
- */
- final Entry<K, V> removeEntryForKey(Object key) {
- int hash = (key == null) ? 0 : hash(key.hashCode());
- int i = indexFor(hash, table.length);
- Entry<K, V> prev = table[i];
- Entry<K, V> e = prev;
- while (e != null) {
- Entry<K, V> next = e.next;
- Object k;
- if (e.hash == hash && ((k = e.key) == key || (key != null && key.equals(k)))) {
- modCount++;
- size--;
- if (prev == e)
- table[i] = next;
- else
- prev.next = next;
- e.recordRemoval(this);
- return e;
- }
- prev = e;
- e = next;
- }
- return e;
- }
remove方法调用了另一个方法removeEntryForKey,removeEntryForKey方法会循环遍历指定下标下所有Entry节点元素,如果该key存在则修改该节点前一个节点的next指向,从而达到把该Entry节点移除Entry链的目的。
- Map map = new HashMap();
- map.put("user1", "小明");
- map.put("user2", "小强");
- map.put("user3", "小红");
- Iterator iter = map.entrySet().iterator();
- while (iter.hasNext()) {
- Map.Entry entry = (Map.Entry) iter.next();
- Object key = entry.getKey();
- Object value = entry.getValue();
- System.out.println("key:" + key + ";value:" + value);
- // 然后移除元素
- if (key.toString().equals("user1")) {
- iter.remove();
- } else if (key.toString().equals("user2")) {
- entry.setValue("小海");
- }
- }
- System.out.println(map.get("user1"));
- System.out.println(map.get("user2"));
- System.out.println(map.get("user3"));
- // 打印结果:
- key:user2;value:小强
- key:user1;value:小明
- key:user3;value:小红
- null
- 小海
- 小红
此种方式操作简单,代码量少,效率较高,且可以直接操作元素,是常用的手段之一。
- Map map = new HashMap();
- map.put("user1", "小明");
- map.put("user2", "小强");
- map.put("user3", "小红");
- Iterator iter = map.keySet().iterator();
- while (iter.hasNext()) {
- Object key = iter.next();
- Object value = map.get(key);
- System.out.println("key:" + key + ";value:" + value);
- // 然后移除元素
- if (key.toString().equals("user1")) {
- iter.remove();
- }
- }
- System.out.println(map.get("user1"));
- System.out.println(map.get("user2"));
- System.out.println(map.get("user3"));
- // 打印结果:
- key:user2;value:小强
- key:user1;value:小明
- key:user3;value:小红
- null
- 小强
- 小红
此种方式先需要将所有key遍历后返回,再通过get方法来获取元素,如果单纯需要操作Map实例中的个别节点元素时效率尚可,如果需要大规模获取和修改时效率不如第一种。所以两种方式选择那种需要视情况而言,并没有绝对。
- Map map = new HashMap();
- map.put("user1", "小明");
- map.put("user2", "小强");
- map.put("user3", "小红");
- //转换成数组
- String[] names= (String[]) map.values().toArray(new String[map.size()]);
- for (String name : names){
- System.out.println(name);
- }
- //采用迭代
- Collection nameArray = map.values();
- Iterator iter = nameArray.iterator();
- while (iter.hasNext()) {
- String name=iter.next().toString();
- System.out.println(name);
- }
- // 打印结果:
- 小强
- 小明
- 小红
此种方式简单明了,适用于直接获取所有value的情况,可以直接迭代或者转换成数组,当直接显示value的情况下比较适用。
Map实现之HashMap(结构及原理)(转)的更多相关文章
- 走进Java Map家族 (1) - HashMap实现原理分析
在Java世界里,有一个古老而神秘的家族——Map.从底层架构到上层应用,他们活跃于世界的每一个角落.但是,每次出现时,他们都戴着一张冷硬的面具(接口),深深隐藏着自己的内心.所有人都认识他们,却并非 ...
- HashMap底层结构、原理、扩容机制
https://www.jianshu.com/p/c1b616ff1130 http://youzhixueyuan.com/the-underlying-structure-and-princip ...
- 牛客网Java刷题知识点之HashMap的实现原理、HashMap的存储结构、HashMap在JDK1.6、JDK1.7、JDK1.8之间的差异以及带来的性能影响
不多说,直接上干货! 福利 => 每天都推送 欢迎大家,关注微信扫码并加入我的4个微信公众号: 大数据躺过的坑 Java从入门到架构师 人工智能躺过的坑 ...
- HashMap,ConcurrentHashMap原理。Collection(list,set,map集合区别)。和CAS
collection里面有什么子类?(list和set是实现了collection接口的.) List: 1.可以允许重复的对象(可重复,有序集合).2.可以插入多个null元素.3.常用的实现类有 ...
- 从头认识java-15.7 Map(6)-介绍HashMap的工作原理-装载因子与性能
这一章节我们通过讨论装载因子与性能,再来介绍HashMap的工作原理. 1.什么是装载因子?他有什么作用? 以下的代码就是装载因子 /** * The load factor used when no ...
- 从头认识java-15.7 Map(4)-介绍HashMap的工作原理-hash碰撞(常常作为面试题)
这一章节我们来讨论一下hash碰撞. 1.什么是hash碰撞? 就是两个对象的key的hashcode是一样的,这个时候怎么get他的value呢? 答案是通过equals遍历table那个位置上面的 ...
- HashMap底层实现原理/HashMap与HashTable区别/HashMap与HashSet区别
①HashMap的工作原理 HashMap基于hashing原理,我们通过put()和get()方法储存和获取对象.当我们将键值对传递给put()方法时,它调用键对象的hashCode()方法来计算h ...
- HashMap的存储原理
HashMap是java中相当重要的数据结构,使用HashMap的场景非常之多,因此,了解HashMap实现的过程和原理,是非常有必要的,在一些面试中也会经常被问到.好了,我们赶紧来研究java内部是 ...
- Java中HashMap底层实现原理(JDK1.8)源码分析
这几天学习了HashMap的底层实现,但是发现好几个版本的,代码不一,而且看了Android包的HashMap和JDK中的HashMap的也不是一样,原来他们没有指定JDK版本,很多文章都是旧版本JD ...
- HashMap 实现及原理
1.为什么用HashMap? HashMap是一个散列桶(数组和链表),它存储的内容是键值对(key-value)映射HashMap采用了数组和链表的数据结构,能在查询和修改方便继承了数组的线性查找和 ...
随机推荐
- skip32
在某些应用场景下,需要对数字进行加密,skip32无疑是一种很实用的算法,网上有python的源码(https://bitbucket.org/anuraguniyal/skip32.py/src/4 ...
- C语言声明解析方法
1.C语言声明的单独语法成份 声明器是C语言声明的非常重要成份,他是所有声明的核心内容,简单的说:声明器就是标识符以及与它组合在一起的任何指针.函数括号.数组下表等,为了方便起见这里进行分类表 ...
- 【Tesseract-OCR】在VS2012环境下调用API方法---注意避免名字冲突
由于在VS2012中使用OpenCV可以得到插件ImageWatch.vsix的支持,查看图像非常方便,所以一直想在VS2012环境下把Tesseract-OCR融合进来,但是这一错误折腾了我好久: ...
- Win2003 Server磁盘配额揭密之启用篇
Win2003 Server磁盘配额揭密之启用篇 [ 作者:茶乡浪子 转贴自:it168.com 点击数:4973 更新时间:2005-1-17 ] 本文要向大家介绍如何利用W ...
- spring mvc +cookie+拦截器功能 实现系统自动登陆
先看看我遇到的问题: @ResponseBody @RequestMapping("/logout") public Json logout(HttpSession session ...
- C++学习之路—引用(一)—基础知识
(根据<C++程序设计>(谭浩强)整理,整理者:华科小涛,@http://www.cnblogs.com/hust-ghtao转载请注明) 对一个数据可以建立一个“引用”,它的作用是为一个 ...
- clientdataset<---->json
现在,DATASNAP倾向于使用JSON作为统一的数据序列格式,以期达到跨平台的效果.于是使用JSON便成为热点. unit uJSONDB; interface uses SysUtils, C ...
- Thinkphp入门 一 (45)
原文:Thinkphp入门 一 (45) 什么是框架? 就是一堆代码的集合,这些代码可以有变量.常量.函数.类等等.这些代码彼此紧密联系,彼此有合作关系.里边还有设计模式:MVC.单例.工厂等等. 为 ...
- 学习javascript语言精粹的笔记
1.枚举: 用for in 语句来遍历一个对象中所有的属性名,该枚举过程将会列出所有的属性也包括涵数和方法,如果我们想过滤掉那些不想要的值,最为常用的过滤器为hasOwnProperty方法,以及使用 ...
- 免费APP在线測试工具以及其用法
免费APP漏洞安全检測工具:http://safe.ijiami.cn/ 漏洞分析是爱加密推出免费 APP 漏洞分析平台,服务包含一键对APK 进行签名数据信息採集.内部配置信息採集.市场渠道相关信息 ...