【Java】HashMap源码分析—

在JDK1.8后，对HashMap源码进行了更改，引入了红黑树。
在这之前，HashMap实际上就是就是数组+链表的结构，由于HashMap是一张哈希表，其会产生哈希冲突，为了解决哈希冲突，HashMap采用了开链法，即对于用对象hashCode值计算哈希表数组下表时，当出现相同情况时，会在相同的地方追加形成链表的形式。对于分布均匀的情况下，仅仅是一个一维数组，查询时时间复杂度为O(1)，当分布不均匀的时候，在有的地方会形成链表，极端情况下完全退化成一个链表，查询时就需要遍历整个链表，时间复杂度就为O(n)，极为耗时。
在引入红黑树后，当满足一定条件时，链表就会转换成一棵红黑树。红黑树是一种AVL树(自平衡查找二叉树)，相比于链表，其查找时的时间复杂度还是很优秀的(O(logn))！

先了解一下HashMap的模型：

其中的Node结点存放我们的键值对<K, V>;
首先，我们先了解HashMap给出的几个重要指标：

 static final int DEFAULT_INITIAL_CAPACITY = 1 << 4;  // 默认的初始化容量大小为16

 static final int MAXIMUM_CAPACITY = 1 << 30; // HashMap最大容量1G

 static final float DEFAULT_LOAD_FACTOR = 0.75f; // 默认负载因子值0.75，用于扩容时的计算

 static final int TREEIFY_THRESHOLD = 8; // 树的阈值，当链表长度大于等于8时，由链表转换成红黑树

 static final int UNTREEIFY_THRESHOLD = 6; // 链表的阈值，暂时不清楚

 static final int MIN_TREEIFY_CAPACITY = 64; // 最小树容量64

以上就是几个基本指标，其规定了在以后操作中的界限！
其中Node<K, V>是一个内部类，封装了这个结点的所有信息，有如下几个成员

 final int hash;

 final K key;

 V value;

 Node<K,V> next;

key和value不必多说，其中的hash是利用key对象的hashCode计算得到的，具有唯一性：

  static final int hash(Object key) {

         int h;

         // 可以看到hash是根据对象的hashCode值来计算

         // hashCode是一个int值，有32位

         // 最后改变的是其低16位

         return (key == null) ? 0 : (h = key.hashCode()) ^ (h >>> 16);

  }

其中的next就是为了解决哈希冲突，当产生哈希冲突时，next就可以指向一张链表，或者一棵黑树！

接下来是几个重要的成员：

  transient Node<K,V>[] table; // 这就是真正的HashMap，一张哈希表，实际上就是由Node结点组成的一维数组

  transient int size; // 记录table中真正有效的结点个数，也就是键值对的个数

  int threshold;  // 用来记录当前容量下，最适合存放多少键值对(容量*负载因子)

  final float loadFactor; // 负载因子，若在构造方法没有特别设置，都是默认0.75

  transient int modCount;  // 用来记录操作数

看到这，我们先不急着往下进行，先仔细分析下这些成员之间的关系：
table：真正开辟的空间，其length就是真正的容量大小
size: 真正使用的空间，总的键值对的个数
threshold:这个就比较有意思，其决定了是否需要进行扩容的操作，是一个阈值！
比如说，在初始化时，默认的容量是16，那么table的length就是16，其threshold=容量×负载因子=16×0.75=12，这就代表着，当size大于12时，就会进行扩容（容量会×2，threshold会根据新容量重新计算）的操作！
这样做的目的很明确，就是为了减少哈希冲突！有效元素的个数少于哈希表的总大小时，其产生哈希冲突的可能性一定是小于相等情况的！
综上可知，在非极限情况下（容量=threshold=MAXIMUM_CAPACITY=2^30）时，threshold总是小于容量，size总是不大于threshold！
这一切的做法，都是为了能够减少哈希冲突产生的可能性！

说到这里还是不能往下进行，我们需要知道Node中的hash成员是如何与table中的下标产生对应关系的，以及哈希冲突是如何产生的：

首先是关于hash值和table下标的映射：

 index =   hash  & (table.length - 1)

这是一个非常巧妙的运算，当table.length满足二的整数幂时，就满足：
hash & (table.length - 1) == hash % table.length
例如：2%8 = 2 即：
0000 0010 2
&
0000 0111 （8 - 1）
0000 0010
二的整数幂减一得到的二进制数，其有效位全是1，通过&可以直接得到符合条件的有效位的值！
其实就是取余，用余数作为table的下标，而位运算的速度是比其余快的多，所以采用了这种方式！
所以这就是为什么table的大小必须是二的整数幂，以及扩容时都是乘2！

哈希冲突的产生：
以初始table.length = 16为例
对于hash = 1，和 hash = 17来说，其对于16取余的结果都是1，那么这两个不同的hash值对应了同一个table的下标，这就产生了哈希冲突！

先将HashMap简单介绍到这，后续我会继续分析HashMap，若有错误或不足之处，还请指出！

我在CSDN也放了一篇【Java】HashMap源码分析——基本概念

【Java】HashMap源码分析——基本概念的更多相关文章

Java HashMap源码分析（含散列表、红黑树、扰动函数等重点问题分析）
写在最前面这个项目是从20年末就立好的 flag,经过几年的学习,回过头再去看很多知识点又有新的理解.所以趁着找实习的准备,结合以前的学习储备,创建一个主要针对应届生和初学者的 Java 开源知识项 ...
java HashMap源码分析(JDK8)
这两天在复习JAVA的知识点,想更深层次的了解一下JAVA,所以就看了看JAVA的源码,把自己的分析写在这里,也当做是笔记吧,方便记忆.写的不对的地方也请大家多多指教. JDK1.6中HashMap采 ...
Java HashMap源码分析
貌似HashMap跟ConcurrentHashMap是面试经常考的东西,抽空来简单分析下它的源码构造函数 /** * Constructs an empty <tt>HashMap&l ...
【Java】HashMap源码分析——常用方法详解
上一篇介绍了HashMap的基本概念,这一篇着重介绍HasHMap中的一些常用方法:put()get()**resize()** 首先介绍resize()这个方法,在我看来这是HashMap中一个非常 ...
【JAVA集合】HashMap源码分析（转载）
原文出处:http://www.cnblogs.com/chenpi/p/5280304.html 以下内容基于jdk1.7.0_79源码: 什么是HashMap 基于哈希表的一个Map接口实现,存储 ...
Java集合源码分析（四）HashMap
一.HashMap简介 1.1.HashMap概述 HashMap是基于哈希表的Map接口实现的,它存储的是内容是键值对<key,value>映射.此类不保证映射的顺序,假定哈希函数将元素 ...
Java BAT大型公司面试必考技能视频-1.HashMap源码分析与实现
视频通过以下四个方面介绍了HASHMAP的内容一. 什么是HashMap Hash散列将一个任意的长度通过某种算法(Hash函数算法)转换成一个固定的值. MAP:地图 x,y 存储总结:通过HA ...
Java源码解析——集合框架（五）——HashMap源码分析
HashMap源码分析 HashMap的底层实现是面试中问到最多的,其原理也更加复杂,涉及的知识也越多,在项目中的使用也最多.因此清晰分析出其底层源码对于深刻理解其实现有重要的意义,jdk1.8之后其 ...
Java 集合源码分析（一）HashMap
目录 Java 集合源码分析(一)HashMap 1. 概要 2. JDK 7 的 HashMap 3. JDK 1.8 的 HashMap 4. Hashtable 5. JDK 1.7 的 Con ...

随机推荐

zabbix items
zabbixversion:3.2.8 在添加zabbix items的时候,注意store value的设置非常实用,有三种选择: As is:d对接受到的结果不做任何处理 Delta(speed ...
02-jQuery的选择器
我们以前在CSS中学习的选择器有: 今天来学习一下jQuery 选择器. jQuery选择器是jQuery强大的体现,它提供了一组方法,让我们更加方便的获取到页面中的元素. 1.jQuery 的基本选 ...
阅读笔记4 我是一只IT小小鸟
经过一周连续三四天八小时以上坐在电脑前敲代码的“折磨”,去看看其他经受这些折磨的人的感受.这次读书笔记变成了逗比风,因为前几周认认真真记下书里写的重点内容,然后把学习的内容认真的记录下来的笔记被老师助 ...
Hadoop 系列文章(一) Hadoop 的安装,以及 Standalone Operation 的启动模式测试
以前都是玩 java,没搞过 hadoop,所以以此系列文章来记录下学习过程安装的文件版本.操作系统说明 centos-6.5-x86_64 [bamboo@hadoop-senior opt]$ ...
python实战提升--1
#python实战提升 1. 如何在列表.字典.集合中根据条件筛选数据? python中for _ in range(10)与for i in range(10)有何区别下划线表示临时变量, 仅用 ...
nginx并发模型与traffic_server并发模型简单比较
ginx并发模型: nginx 的进程模型采用的是prefork方式,预先分配的worker子进程数量由配置文件指定,默认为1,不超过1024.master主进程创建监听套接口,fork子进程以后,由 ...
python 使用unittest进行单元测试
import unittest import HTMLTestRunner """ Python中有一个自带的单元测试框架是unittest模块,用它来做单元测试,它里面 ...
通过Function Score Query优化Elasticsearch搜索结果(综合排序)
在使用 Elasticsearch 进行全文搜索时,搜索结果默认会以文档的相关度进行排序,如果想要改变默认的排序规则,也可以通过sort指定一个或多个排序字段. 但是使用sort排序过于绝对,它会直接 ...
Linux - 在当前系统内查找信息的方法
查找文本使用grep命令 grep命令 - 示例 grep命令 - 正则表达式 grep命令 - 统计匹配字符串的行数 grep命令 - 搜索多个单词结合正则表达式使用grep命令注意:在搜索指 ...
HttpClient和HttpURLConnection的使用和区别（下）
转自来自点击打开链接接着上一篇,我们继续来分析HttpURLConnection的使用,以及两者的共同点和区别. 目录用法 HttpURLConnection 区别引用资料用法 HttpURL ...

【Java】HashMap源码分析——基本概念

【Java】HashMap源码分析——基本概念的更多相关文章

随机推荐

热门专题