总结HashSet以及分析部分底层源码

1. HashSet继承的抽象类和实现的接口

继承的抽象类：AbstractSet
实现了Set接口
实现了Cloneable接口
实现了Serializable序列化接口：该接口标记此类支持序列化操作

2. HashSet底层数据结构

HashSet底层是基于HashMap实现的，HashMap底层数据结构是基于数组+链表实现的。

1. 特点

既保存了数组查询和修改元素效率快的优点，也保存了链表在添加和删除元素时效率快的特点。
存储的元素是无序的，不允许重复的，存储的元素最多只能有一个为null值，这是因为HashSet底层存储元素时只是利用了HashMap的key来存储元素，而HashMap的value都是存储的一个new Object() 对象。所以说HashSet只是利用了HashMap的key，并没有利用HashMap的value。

2. HashSet的底层结构图

因为HashSet底层是使用的HashMap，所以下图实际上是HashMap的底层数据结构。当存储一个元素时，首先会给这个元素计算一个hash值。然后根据计算出来的hash值决定将元素存储到哈希表中的那个位置。

3. 优点

存取效率高，可以动态扩容

4. 缺点

每次存储新的元素都需要计算一次hashCode值，如果计算hash值的算法设计的不好，哈希碰撞产生过多，就可能造成一个节点小存储了多个元素，而哈希表中相邻的元素的位置没有存储任何元素。
HashSet线程不安全，在多线程情况下会出现线程安全问题。

3. HashSet适用的场景

需要存储不重复的值，要求存取效率高，适合在单线程情况下使用。
如果需要在多线程情况下使用，需要使用Collections集合工具类，创建一个线程安全的HashSet集合
```
Set<Integer> hashSet = Collections.synchronizedSet(new HashSet<Integer>());
```

4. HashSet底层源码分析

1. 构造函数

1. 默认无参构造函数

/**

 * 默认无参构造函数

 */

public HashSet() {

	map = new HashMap<>();

}

2. 传递一个集合的构造函数

/**

 * 可以将集合中的数据全部添加到新创建的HashSet集合中，会去除掉重复的值。

 * @param  c

 */

public HashSet(Collection<? extends E> c) {

    map = new HashMap<>(Math.max((int) (c.size()/.75f) + 1, 16));

    addAll(c);

}

2. 添加一个元素的流程

1. 将数据包装

在每次添加数据时，如果数据是基本数据类型，会先将基本数据类型进行装箱操作，把基本数据类型转换成对应的包装类型（引用数据类型）

// 例如：集合中存放Integer数据类型，在进行add操作时，会先进行装箱操作

/**

 * 将基本数据类转换为引用数据类型

 * @param  i 	传入的参数为一个基本型数据类型

 * @return 		返回的参数是一个基本数据类型的包装类（引用数据类型）

 */

public static Integer valueOf(int i) {

    if (i >= IntegerCache.low && i <= IntegerCache.high)

        return IntegerCache.cache[i + (-IntegerCache.low)];

    return new Integer(i);

}

2. 调用add() 方法

/**

 * HashSet的添加方法

 * @param  i 	传入需要添加的元素

 * @return 		添加成功返回true，失败返回false

 */

public boolean add(E e) {

    // 直接调用已经创建好的HashMap集合，调用HashMap中的put()方法进行添加，key为元素值，value为常量对象

    return map.put(e, PRESENT)==null;

}

常量说明

// 该常量对象将作为HashSet集合的value

private static final Object PRESENT = new Object();

3. HashMap中的put()方法

/**

 * HashMap的put添加方法

 * @param key    对应的是HashSet要添加的元素

 * @param value  对应的是一个常量对象 new Object()

 * @return       添加成功返回null，添加失败返回value值

 */

public V put(K key, V value) {

    // 调用putVal()方法，对元素进行添加

    return putVal(hash(key), key, value, false, true);

}

4. HashMap中的hash()方法

/**

 * HashMap的hash方法，用于计算每个key的hash值，这个hash值将决定key在哈希表中的具体位置

 * @param key    对应的是HashSet要添加的元素

 * @return       返回根据key计算出来的hash值

 */

static final int hash(Object key) {

    // 用于接收计算好的hash值

    int h;

    // 返回根据key计算出来的hash值

    return (key == null) ? 0 : (h = key.hashCode()) ^ (h >>> 16);

}

5. HashMap中putVal()方法

/**

 * HashMap的hash方法，用于计算每个key的hash值，这个hash值将决定key在哈希表中的具体位置

 * @param hash    		计算好的hash值

 * @param value    		需要存储的key值

 * @param onlyIfAbsent   需要存储的value值

 * @param onlyIfAbsent   如果返回true说明添加的key是首次添加，false说明是修改了对应key的value

 * @param evict    		目前HashMap并没有使用改变了，留给了实现HashMap的子类

 * @return

 */

final V putVal(int hash, K key, V value, boolean onlyIfAbsent, boolean evict) {

    // 创建一个类型为Node的数组，其实就是哈希表

    Node<K,V>[] tab;

    //

    Node<K,V> p;

    // 辅助n，记录tab的长度。辅助变量i，存储经过计算得到的tab表的下标值

    int n, i;

    // 判读tab表是否为空，或者长度为0，满足则说明是第一次创建tab表

    if ((tab = table) == null || (n = tab.length) == 0)

        n = (tab = resize()).length;    	      // 为tab表创建初始大小16，赋给辅助变量n

    // 将tab表长度减一在和hash进行按位与运算，得到一个tab表的下标值，赋给i，

    // 再将当前下标所指向的tab表的对象赋给p，判断当前位置上是否存储对象，即是否为null

    if ((p = tab[i = (n - 1) & hash]) == null)

        tab[i] = newNode(hash, key, value, null);  // 如果当前位置为null，直接添加一个新节点 

    // 如果当前位置已经存储过节点

    else {

        // 创建一个节点对象e

        Node<K,V> e;

        // 创建一个与key相同类型的变量k

        K k;	

        /*

        	如果当前索引位置对应的链表的第一个元素和准备添加的key的hash值一样,

        	并且满足下面两个条件之一:

        	(1)准备加入的key和p指向的Node结点的key是同一个对象

        	(2)p指向的Node结点的key的equals()和准备加入的key比较后相同

        */

        if (p.hash == hash && ((k = p.key) == key || (key != null && key.equals(k))))

            e = p;

        // 判断p是不是红黑树的一个节点对象

        else if (p instanceof TreeNode)

            e = ((TreeNode<K,V>)p).putTreeVal(this, tab, hash, key, value);	// 作为节点添加到红黑树

        // 如果table对应索引位置，已经是一个链表,就使用for循环比较

        else {

            /*

            	1. 依次和该链表的每一个元素比较后，都不相同,则加入到该链表的最后

 	               注意在把元素添加到链表后，立即判断该链表是否已经达到8个结点,

 	               达到8个节点数就调用treeifyBin()对当前这个链表进行树化(转成红黑树)

 	               注意：

                       if(tab==null||(n=tab.length)<MIN_TREEIFY_CAPACITY(64))

                            resize();

 	               如果上面条件成立，先table扩容，只有上面条件不成立时，才进行转成红黑树

            */

            for (int binCount = 0; ; ++binCount) {

                if ((e = p.next) == null) {

                    p.next = newNode(hash, key, value, null);

                    if (binCount >= TREEIFY_THRESHOLD - 1)

                        treeifyBin(tab, hash);

                    break;

                }

                // 2. 依次和该链表的每一个元素比较过程中，如果有key相同情况,就直接break

                if (e.hash == hash && ((k = e.key) == key || (key != null && key.equals(k))))

                    break;

                // 将对应位置上的节点

                p = e;

            }

        }

        if (e != null) {

            V oldValue = e.value;

            if (!onlyIfAbsent || oldValue == null)

                e.value = value;

            afterNodeAccess(e);

            return oldValue;

        }

    }

    // 记录集合被修改的次数

    ++modCount;

    // 判断当前哈希表中实际存储的元素个数是否得到扩容条件，threshold的大小为哈希表长度的0.75（默认值）

    if (++size > threshold)

        resize();				// 调用扩容方法

    afterNodeInsertion(evict);   // 该方法在HashMap中没有实际作用，是留给HashMap的子类的

    return null;			    // 添加节点元素成功，返回null

}

总结HashSet以及分析部分底层源码的更多相关文章

List-LinkedList、set集合基础增强底层源码分析
List-LinkedList 作者 : Stanley 罗昊 [转载请注明出处和署名,谢谢!] 继上一章继续讲解,上章内容: List-ArreyLlist集合基础增强底层源码分析:https:// ...
Java泛型底层源码解析-ArrayList,LinkedList,HashSet和HashMap
声明:以下源代码使用的都是基于JDK1.8_112版本 1. ArrayList源码解析 <1. 集合中存放的依然是对象的引用而不是对象本身,且无法放置原生数据类型,我们需要使用原生数据类型的包 ...
List-ArrayList集合基础增强底层源码分析
List集合基础增强底层源码分析作者:Stanley 罗昊 [转载请注明出处和署名,谢谢!] 集合分为三个系列,分别为:List.set.map List系列特点:元素有序可重复有序指的是元素的 ...
2018.11.20 Struts2中对结果处理方式分析&struts2内置的方式底层源码剖析
介绍一下struts2内置帮我们封装好的处理结果方式也就是底层源码分析这是我们的jar包里面找的位置目录打开往下拉看到result-type节点 name那一列就是我们的type类型取值上一篇博 ...
BAT资深工程师由浅入深分析 Tp5&Tp6底层源码 - 分享
BAT资深工程师由浅入深分析Tp5&Tp6底层源码第1章课程简介本章主要让大家知道本套课程的主线, 导学内容,如何学习源码等,看完本章要让小伙伴觉得这个是必须要掌握的,并且对加薪有很大的 ...
BAT资深工程师由浅入深分析Tp5&Tp6底层源码☆
第1章课程简介本章主要让大家知道本套课程的主线, 导学内容,如何学习源码等,看完本章要让小伙伴觉得这个是必须要掌握的,并且对加薪有很大的帮助. 第2章 [TP5灵魂]自动加载Loader 深度分析 ...
LInkedList总结及部分底层源码分析
LInkedList总结及部分底层源码分析 1. LinkedList的实现与继承关系继承:AbstractSequentialList 抽象类实现:List 接口实现:Deque 接口实现: ...
Vector总结及部分底层源码分析
Vector总结及部分底层源码分析 1. Vector继承的抽象类和实现的接口 Vector类实现的接口 List接口:里面定义了List集合的基本接口,Vector进行了实现 RandomAcces ...
从底层源码浅析Mybatis的SqlSessionFactory初始化过程
目录搭建源码环境 POM依赖测试SQL Mybatis全局配置文件 UserMapper接口 UserMapper配置 User实体 Main方法快速进入Debug跟踪源码分析准备源码分析 ...

随机推荐

ShardingSphere-初见
目录概述认识shardingjdbc shardingjdbc功能架构图认识Sharding-Proxy 三个组件的比较 ShardingJdbc混合架构 ShardingShpere的功能清单 ...
Verdi UVM Debug Mode 简单使用
转载:Verdi UVM Debug Mode 简单使用_Holden_Liu的博客-CSDN博客文档与源码: User Guide: UVMDebugUserGuide.pdf in $VERD ...
spring-cloud-square源码速读(spring-cloud-square-okhttp篇)
欢迎访问我的GitHub https://github.com/zq2599/blog_demos 内容:所有原创文章分类汇总及配套源码,涉及Java.Docker.Kubernetes.DevOPS ...
filter tools
// 过滤商品分类 Vue.filter("cateFilter", (data) => { let tmp = ["一级分类", "二级分 ...
JuiceFS CSI Driver 的最佳实践
文章根据 Juicedata 工程师朱唯唯,在云原生 Meetup 杭州站所作主题演讲<JuiceFS CSI Driver 的最佳实践>整理而成. 大家好,我是来自 Juicedata ...
C++ 指针的引用和指向引用的指针
指向引用的指针简单使用指针的一个例子就是: int a = 1; int *p = &a; 预先强调: 没有指向引用的指针原因: 因为引用不是对象,没有地址. 但是指向引用的指针是什么形 ...
Mysql基础教程：（七）MySQL基础练习
MySQL基础练习一.创建student和score表 CREATE TABLE student (id INT(10) NOT NULL PRIMARY KEY ,name VARCHAR(20) ...
Docker学习：起步篇
Docker-概述学习资源最好的资源在官网! Docker官方: Docker 官方主页: https://www.docker.com(opens new window) Docker 官方博客 ...
CommonJS与ES6 Module的使用与区别
CommonJS与ES6 Module的使用与区别 1. CommonJS 1.1 导出 1.2 导入 2. ES6 Module 2.1 导出 2.2 导入 3. CommonJS 与 ES6 Mo ...
SpringCloud升级之路2020.0.x版-32. 改进负载均衡算法
本系列代码地址:https://github.com/JoJoTec/spring-cloud-parent 在前面一节,我们梳理了实现 Feign 断路器以及线程隔离的思路,这一节,我们先不看如何源 ...

总结HashSet以及分析部分底层源码

总结HashSet以及分析部分底层源码

1. HashSet继承的抽象类和实现的接口

2. HashSet底层数据结构

1. 特点

2. HashSet的底层结构图

3. 优点

4. 缺点

3. HashSet适用的场景

4. HashSet底层源码分析

1. 构造函数

1. 默认无参构造函数

2. 传递一个集合的构造函数

2. 添加一个元素的流程

1. 将数据包装

2. 调用add() 方法

3. HashMap中的put()方法

4. HashMap中的hash()方法

5. HashMap中putVal()方法

总结HashSet以及分析部分底层源码的更多相关文章

随机推荐

热门专题