01. 摘要

Set集合的特点主要有:元素不重复、存储无序的特点。

打开 Set 集合,主要实现类有 HashSet、LinkedHashSet 、TreeSet 、EnumSet( RegularEnumSet、JumboEnumSet )等等,总结 Set 接口实现类,图如下:

由图中的继承关系,可以知道,Set 接口主要实现类有 AbstractSet、HashSet、LinkedHashSet 、TreeSet 、EnumSet( RegularEnumSet、JumboEnumSet ),其中 AbstractSet、EnumSet 属于抽象类,EnumSet 是在 jdk1.5 中新增的,不同的是 EnumSet 集合元素必须是枚举类型。

HashSet 是一个输入输出无序的集合,集合中的元素基于 HashMap 的 key 实现,元素不可重复;

LinkedHashSet 是一个输入输出有序的集合,集合中的元素基于 LinkedHashMap 的 key 实现,元素也不可重复;

TreeSet 是一个排序的集合,集合中的元素基于 TreeMap 的 key 实现,同样元素不可重复;

EnumSet 是一个与枚举类型一起使用的专用 Set 集合,其中 RegularEnumSet 和 JumboEnumSet 不能单独实例化,只能由 EnumSet 来生成,同样元素不可重复;

下面咱们来对各个主要实现类进行一一分析!

02. HashSet

HashSet 是一个输入输出无序的集合,底层基于 HashMap 来实现,HashSet 利用 HashMap 中的key元素来存放元素,这一点我们可以从源码上看出来,阅读源码如下:

public class HashSet

extends AbstractSet

implements Set, Cloneable, java.io.Serializable{

// HashMap 变量
private transient HashMap<E,Object> map; /**HashSet 初始化*/
public HashSet() {
//默认实例化一个 HashMap
map = new HashMap<>();
}

}

add方法

打开HashSet的add()方法,源码如下:

public boolean add(E e) {

//向 HashMap 中添加元素

return map.put(e, PRESENT)==null;

}

其中变量PRESENT,是一个非空对象,源码部分如下:

private static final Object PRESENT = new Object();

可以分析出,当进行add()的时候,等价于

HashMap map = new HashMap<>();

map.put(e, new Object());//e 表示要添加的元素

在之前的集合文章中,咱们了解到 HashMap 在添加元素的时候 ,通过equals()和hashCode()方法来判断传入的key是否相同,如果相同,那么 HashMap 认为添加的是同一个元素,反之,则不是。

从源码分析上可以看出,HashSet 正是使用了 HashMap 的这一特性,实现存储元素下标无序、元素不会重复的特点。

remove方法

HashSet 的删除方法,同样如此,也是基于 HashMap 的底层实现,源码如下:

public boolean remove(Object o) {

//调用HashMap 的remove方法,移除元素

return map.remove(o)==PRESENT;

}

查询方法

HashSet 没有像 List、Map 那样提供 get 方法,而是使用迭代器或者 for 循环来遍历元素,方法如下:

public static void main(String[] args) {

Set hashSet = new HashSet();

System.out.println("HashSet初始容量大小:"+hashSet.size());

hashSet.add("1");

hashSet.add("2");

hashSet.add("3");

hashSet.add("3");

hashSet.add("2");

hashSet.add(null);

//相同元素会自动覆盖
System.out.println("HashSet容量大小:"+hashSet.size());
//迭代器遍历
Iterator<String> iterator = hashSet.iterator();
while (iterator.hasNext()){
String str = iterator.next();
System.out.print(str + ",");
} System.out.println("\n===========");
//增强for循环
for (String str : hashSet) {
System.out.print(str + ",");
}

}

输出结果:

HashSet初始容量大小:0

HashSet容量大小:4

null,1,2,3,

null,1,2,3,

需要注意的是,HashSet 允许添加为null的元素。

03. LinkedHashSet

LinkedHashSet 是一个输入输出有序的集合,继承自 HashSet,但是底层基于 LinkedHashMap 来实现。

如果你之前了解过 LinkedHashMap,那么你一定知道,它也继承自 HashMap,唯一有区别的是,LinkedHashMap 底层数据结构基于循环链表实现,并且数组指定了头部和尾部,虽然数组的下标存储无序,但是却可以通过数组的头部和尾部,加上循环链表,依次可以查询到元素存储的过程,从而做到输入输出有序的特点。

如果还不了解 LinkedHashMap 的实现过程,可以参阅集合系列中关于 LinkedHashMap 的实现过程文章。

阅读 LinkedHashSet 的源码,类定义如下:

public class LinkedHashSet

extends HashSet

implements Set, Cloneable, java.io.Serializable {

public LinkedHashSet() {
//调用 HashSet 的方法
super(16, .75f, true);
}

}

查询源码,super调用的方法,源码如下:

HashSet(int initialCapacity, float loadFactor, boolean dummy) {

//初始化一个 LinkedHashMap

map = new LinkedHashMap<>(initialCapacity, loadFactor);

}

add方法

LinkedHshSet没有重写add方法,而是直接调用HashSet的add()方法,因为map的实现类是LinkedHashMap,所以此处是向LinkedHashMap中添加元素,当进行add()的时候,等价于

HashMap map = new LinkedHashMap<>();

map.put(e, new Object());//e 表示要添加的元素

remove方法

LinkedHashSet也没有重写remove方法,而是直接调用HashSet的删除方法,因为LinkedHashMap没有重写remove方法,所以调用的也是HashMap的remove方法,源码如下:

public boolean remove(Object o) {

//调用HashMap 的remove方法,移除元素

return map.remove(o)==PRESENT;

}

查询方法

同样的,LinkedHashSet 没有提供 get 方法,使用迭代器或者 for 循环来遍历元素,方法如下:

public static void main(String[] args) {

Set linkedHashSet = new LinkedHashSet();

System.out.println("linkedHashSet初始容量大小:"+linkedHashSet.size());

linkedHashSet.add("1");

linkedHashSet.add("2");

linkedHashSet.add("3");

linkedHashSet.add("3");

linkedHashSet.add("2");

linkedHashSet.add(null);

linkedHashSet.add(null);

System.out.println("linkedHashSet容量大小:"+linkedHashSet.size());
//迭代器遍历
Iterator<String> iterator = linkedHashSet.iterator();
while (iterator.hasNext()){
String str = iterator.next();
System.out.print(str + ",");
} System.out.println("\n===========");
//增强for循环
for (String str : linkedHashSet) {
System.out.print(str + ",");
}

}

输出结果:

linkedHashSet初始容量大小:0

linkedHashSet容量大小:4

1,2,3,null,

1,2,3,null,

可见,LinkedHashSet 与 HashSet 相比,LinkedHashSet 输入输出有序。

04. TreeSet

TreeSet 是一个排序的集合,实现了NavigableSet、SortedSet、Set接口,底层基于 TreeMap 来实现。TreeSet 利用 TreeMap 中的key元素来存放元素,这一点我们也可以从源码上看出来,阅读源码,类定义如下:

public class TreeSet extends AbstractSet

implements NavigableSet, Cloneable, java.io.Serializable {

//TreeSet 使用NavigableMap接口作为变量
private transient NavigableMap<E,Object> m; /**对象初始化*/
public TreeSet() {
//默认实例化一个 TreeMap 对象
this(new TreeMap<E,Object>());
} //对象初始化调用的方法
TreeSet(NavigableMap<E,Object> m) {
this.m = m;
}

}

new TreeSet<>()对象实例化的时候,表达的意思,可以简化为如下:

NavigableMap<E,Object> m = new TreeMap<E,Object>();

因为TreeMap实现了NavigableMap接口,所以没啥问题。

public class TreeMap<K,V>

extends AbstractMap<K,V>

implements NavigableMap<K,V>, Cloneable, java.io.Serializable{

......

}

add方法

打开TreeSet的add()方法,源码如下:

public boolean add(E e) {

//向 TreeMap 中添加元素

return m.put(e, PRESENT)==null;

}

其中变量PRESENT,也是是一个非空对象,源码部分如下:

private static final Object PRESENT = new Object();

可以分析出,当进行add()的时候,等价于

TreeMap map = new TreeMap<>();

map.put(e, new Object());//e 表示要添加的元素

TreeMap 类主要功能在于,给添加的集合元素,按照一个的规则进行了排序,默认以自然顺序进行排序,当然也可以自定义排序,比如测试方法如下:

public static void main(String[] args) {

Map initMap = new TreeMap();

initMap.put("4", "d");

initMap.put("3", "c");

initMap.put("1", "a");

initMap.put("2", "b");

//默认自然排序,key为升序

System.out.println("默认 排序结果:" + initMap.toString());

//自定义排序,在TreeMap初始化阶段传入Comparator 内部对象

Map comparatorMap = new TreeMap<String, String>(new Comparator() {

@Override

public int compare(String o1, String o2){

//根据key比较大小,采用倒叙,以大到小排序

return o2.compareTo(o1);

}

});

comparatorMap.put("4", "d");

comparatorMap.put("3", "c");

comparatorMap.put("1", "a");

comparatorMap.put("2", "b");

System.out.println("自定义 排序结果:" + comparatorMap.toString());

}

输出结果:

默认 排序结果:{1=a, 2=b, 3=c, 4=d}

自定义 排序结果:{4=d, 3=c, 2=b, 1=a}

相信使用过TreeMap的朋友,一定知道TreeMap会自动将key按照一定规则进行排序,TreeSet正是使用了TreeMap这种特性,来实现添加的元素集合,在输出的时候,其结果是已经排序好的。

如果您没看过源码TreeMap的实现过程,可以参阅集合系列文章中TreeMap的实现过程介绍,或者阅读 jdk 源码。

remove方法

TreeSet 的删除方法,同样如此,也是基于 TreeMap 的底层实现,源码如下:

public boolean remove(Object o) {

//调用TreeMap 的remove方法,移除元素

return m.remove(o)==PRESENT;

}

查询方法

TreeSet 没有重写 get 方法,而是使用迭代器或者 for 循环来遍历元素,方法如下:

public static void main(String[] args) {

Set treeSet = new TreeSet<>();

System.out.println("treeSet初始容量大小:"+treeSet.size());

treeSet.add("1");

treeSet.add("4");

treeSet.add("3");

treeSet.add("8");

treeSet.add("5");

System.out.println("treeSet容量大小:"+treeSet.size());
//迭代器遍历
Iterator<String> iterator = treeSet.iterator();
while (iterator.hasNext()){
String str = iterator.next();
System.out.print(str + ",");
} System.out.println("\n===========");
//增强for循环
for (String str : treeSet) {
System.out.print(str + ",");
}

}

输出结果:

treeSet初始容量大小:0

treeSet容量大小:5

1,3,4,5,8,

1,3,4,5,8,

自定义排序

使用自定义排序,有 2 种方法,第一种在需要添加的元素类,实现Comparable接口,重写compareTo方法来实现对元素进行比较,实现自定义排序。

方法一

/**

  • 创建实体类Person实现Comparable接口

    */

    public class Person implements Comparable{

    private int age;

    private String name;

    public Person(String name, int age){

    this.name = name;

    this.age = age;

    }

    @Override

    public int compareTo(Person o){

    //重写 compareTo 方法,自定义排序算法

    return this.age-o.age;

    }

    @Override

    public String toString(){

    return name+":"+age;

    }

    }

创建一个Person实体类,实现Comparable接口,重写compareTo方法,通过变量age实现自定义排序 测试方法如下:

public static void main(String[] args) {

Set treeSet = new TreeSet<>();

System.out.println("treeSet初始容量大小:"+treeSet.size());

treeSet.add(new Person("李一",18));

treeSet.add(new Person("李二",17));

treeSet.add(new Person("李三",19));

treeSet.add(new Person("李四",21));

treeSet.add(new Person("李五",20));

System.out.println("treeSet容量大小:"+treeSet.size());
System.out.println("按照年龄从小到大,自定义排序结果:");
//迭代器遍历
Iterator<Person> iterator = treeSet.iterator();
while (iterator.hasNext()){
Person person = iterator.next();
System.out.print(person.toString() + ",");
}

}

输出结果:

treeSet初始容量大小:0

treeSet容量大小:5

按照年龄从小到大,自定义排序结果:

李二:17,李一:18,李三:19,李五:20,李四:21,

方法二

第二种方法是在TreeSet初始化阶段,Person不用实现Comparable接口,将Comparator接口以内部类的形式作为参数,初始化进去,方法如下:

public static void main(String[] args) {

//自定义排序

Set treeSet = new TreeSet<>(new Comparator(){

@Override

public int compare(Person o1, Person o2) {

if(o1 == null || o2 == null){

//不用比较

return 0;

}

//从小到大进行排序

return o1.getAge() - o2.getAge();

}

});

System.out.println("treeSet初始容量大小:"+treeSet.size());

treeSet.add(new Person("李一",18));

treeSet.add(new Person("李二",17));

treeSet.add(new Person("李三",19));

treeSet.add(new Person("李四",21));

treeSet.add(new Person("李五",20));

System.out.println("treeSet容量大小:"+treeSet.size());
System.out.println("按照年龄从小到大,自定义排序结果:");
//迭代器遍历
Iterator<Person> iterator = treeSet.iterator();
while (iterator.hasNext()){
Person person = iterator.next();
System.out.print(person.toString() + ",");
}

}

输出结果:

treeSet初始容量大小:0

treeSet容量大小:5

按照年龄从小到大,自定义排序结果:

李二:17,李一:18,李三:19,李五:20,李四:21,

需要注意的是,TreeSet不能添加为空的元素,否则会报空指针错误!

05. EnumSet

EnumSet 是一个与枚举类型一起使用的专用 Set 集合,继承自AbstractSet抽象类。与 HashSet、LinkedHashSet 、TreeSet 不同的是,EnumSet 元素必须是Enum的类型,并且所有元素都必须来自同一个枚举类型,EnumSet 定义源码如下:

public abstract class EnumSet<E extends Enum> extends AbstractSet

implements Cloneable, java.io.Serializable {

......

}

EnumSet是一个虚类,不能直接通过实例化来获取对象,只能通过它提供的静态方法来返回EnumSet实现类的实例。

EnumSet的实现类有两个,分别是RegularEnumSet、JumboEnumSet两个类,两个实现类都继承自EnumSet。

EnumSet会根据枚举类型中元素的个数,来决定是返回哪一个实现类,当 EnumSet元素中的元素个数小于或者等于64,就会返回RegularEnumSet实例;当EnumSet元素个数大于64,就会返回JumboEnumSet实例。

这一点,我们可以从源码中看出,源码如下:

public static <E extends Enum> EnumSet noneOf(Class elementType) {

Enum<?>[] universe = getUniverse(elementType);

if (universe == null)

throw new ClassCastException(elementType + " not an enum");

//当元素个数小于或者等于 64 的时候,返回 RegularEnumSet

if (universe.length <= 64)

return new RegularEnumSet<>(elementType, universe);

else

//大于64,返回 JumboEnumSet

return new JumboEnumSet<>(elementType, universe);

}

noneOf是EnumSet中一个静态方法,用于判断是返回哪一个实现类。

我们来看看当元素个数小于等于64的时候,使用RegularEnumSet的类,源码如下:

class RegularEnumSet<E extends Enum> extends EnumSet {

/**元素为long型*/
private long elements = 0L; /**添加元素*/
public boolean add(E e) {
typeCheck(e); long oldElements = elements;
//二进制运算,获取元素
elements |= (1L << ((Enum<?>)e).ordinal());
return elements != oldElements;
}

}

RegularEnumSet 通过二进制运算得到结果,直接使用long来存放元素。

我们再来看看当元素个数大于64的时候,使用JumboEnumSet的类,源码如下:

class JumboEnumSet<E extends Enum> extends EnumSet {

/**元素为long型*/
private long elements = 0L; /**添加元素*/
public boolean add(E e) {
typeCheck(e); int eOrdinal = e.ordinal();
int eWordNum = eOrdinal >>> 6; long oldElements = elements[eWordNum];
//二进制运算
elements[eWordNum] |= (1L << eOrdinal);
//使用数组来操作元素
boolean result = (elements[eWordNum] != oldElements);
if (result)
size++;
return result;
}

}

JumboEnumSet 也是通过二进制运算得到结果,使用long来存放元素,但是它是使用数组来存放元素。

二者相比,RegularEnumSet 效率比 JumboEnumSet 高些,因为操作步骤少,大多数情况下返回的是 RegularEnumSet,只有当枚举元素个数超过 64 的时候,会使用 JumboEnumSet。

添加元素:

//新建一个EnumEntity的枚举类型,定义2个参数

public enum EnumEntity {

WOMAN,MAN;

}

创建一个空的 EnumSet:

//创建一个 EnumSet,内容为空

EnumSet noneSet = EnumSet.noneOf(EnumEntity.class);

System.out.println(noneSet);

输出结果:

[]

创建一个 EnumSet,并将枚举类型的元素全部添加进去:

//创建一个 EnumSet,将EnumEntity 元素内容添加到EnumSet中

EnumSet allSet = EnumSet.allOf(EnumEntity.class);

System.out.println(allSet);

输出结果:

[WOMAN, MAN]

创建一个 EnumSet,添加指定的枚举元素:

//创建一个 EnumSet,添加 WOMAN 到 EnumSet 中

EnumSet customSet = EnumSet.of(EnumEntity.WOMAN);

System.out.println(customSet);

查询元素

EnumSet与HashSet、LinkedHashSet、TreeSet一样,通过迭代器或者 for 循环来遍历元素,方法如下:

EnumSet allSet = EnumSet.allOf(EnumEntity.class);

for (EnumEntity enumEntity : allSet) {

System.out.print(enumEntity + ",");

}

输出结果:

WOMAN,MAN,

06. 总结

HashSet 是一个输入输出无序的 Set 集合,元素不重复,底层基于 HashMap 的 key 来实现,元素可以为空,如果添加的元素为对象,对象需要重写 equals() 和 hashCode() 方法来约束是否为相同的元素。

LinkedHashSet 是一个输入输出有序的 Set 集合,继承自 HashSet,元素不重复,底层基于 LinkedHashMap 的 key来实现,元素也可以为空,LinkedHashMap 使用循环链表结构来保证输入输出有序。

TreeSet 是一个排序的 Set 集合,元素不可重复,底层基于 TreeMap 的 key来实现,元素不可以为空,默认按照自然排序来存放元素,也可以使用 Comparable 和 Comparator 接口来比较大小,实现自定义排序。

EnumSet 是一个与枚举类型搭配使用的专用 Set 集合,在 jdk1.5 中加入。EnumSet 是一个虚类,有2个实现类 RegularEnumSet、JumboEnumSet,不能显式的实例化改类,EnumSet 会动态决定使用哪一个实现类,当元素个数小于等于64的时候,使用 RegularEnumSet;大于 64的时候,使用JumboEnumSet类,EnumSet 其内部使用位向量实现,拥有极高的时间和空间性能,如果元素是枚举类型,推荐使用 EnumSet。

07. 参考

1、JDK1.7&JDK1.8 源码

2、程序园 - java集合-EnumMap与EnumSet

3、 Java极客技术 - https://blog.csdn.net/javageektech/article/details/103077788

深入浅出的分析 Set集合的更多相关文章

  1. 【集合系列】- 深入浅出的分析 Set集合

    一.摘要 关于 Set 接口,在实际开发中,其实很少用到,但是如果你出去面试,它可能依然是一个绕不开的话题. 言归正传,废话咱们也不多说了,相信使用过 Set 集合类的朋友都知道,Set集合的特点主要 ...

  2. JDK(十)JDK1.7&1.8源码对比分析【集合】ConcurrentHashMap

    前言 在JDK1.7&1.8源码对比分析[集合]HashMap中我们对比分析了JDK1.7和1.8版本的HashMap源码,趁热打铁,这篇文章就来看看JDK1.7和1.8版本的Concurre ...

  3. JDK(九)JDK1.7源码分析【集合】HashMap的死循环

    前言 在JDK1.7&1.8源码对比分析[集合]HashMap中我们遗留了一个问题:为什么HashMap在调用resize() 方法时会出现死循环?这篇文章就通过JDK1.7的源码来分析并解释 ...

  4. JDK(八)JDK1.7&1.8源码对比分析【集合】HashMap

    前言 在JDK1.8源码分析[集合]HashMap文章中,我们分析了HashMap在JDK1.8中新增的特性(引进了红黑树数据结构),但是为什么要进行这个优化呢?这篇文章我们通过对比JDK1.7和1. ...

  5. 【集合系列】- 深入浅出的分析TreeMap

    一.摘要 在集合系列的第一章,咱们了解到,Map的实现类有HashMap.LinkedHashMap.TreeMap.IdentityHashMap.WeakHashMap.Hashtable.Pro ...

  6. 【集合系列】- 深入浅出的分析 Hashtable

    一.摘要 在集合系列的第一章,咱们了解到,Map 的实现类有 HashMap.LinkedHashMap.TreeMap.IdentityHashMap.WeakHashMap.Hashtable.P ...

  7. 【集合系列】- 深入浅出的分析IdentityHashMap

    一.摘要 在集合系列的第一章,咱们了解到,Map 的实现类有 HashMap.LinkedHashMap.TreeMap.IdentityHashMap.WeakHashMap.Hashtable.P ...

  8. 【集合系列】- 深入浅出的分析 WeakHashMap

    一.摘要 在集合系列的第一章,咱们了解到,Map 的实现类有 HashMap.LinkedHashMap.TreeMap.IdentityHashMap.WeakHashMap.Hashtable.P ...

  9. 【集合系列】- 深入浅出的分析 Properties

    一.摘要 在集合系列的第一章,咱们了解到,Map 的实现类有 HashMap.LinkedHashMap.TreeMap.IdentityHashMap.WeakHashMap.Hashtable.P ...

随机推荐

  1. mysql数据库高并发处理

    总体思想:短, 少, 分流 短: 1.页面静态化, 2.使用缓存 3.使用存储过程, 对于处理一次请求需要多次访问数据库的操作, 将操作整合到存储过程, 这样只需要一次数据库访问 4.延迟修改, 将修 ...

  2. 堆排序Heap_Sort

    堆排序就是借助二叉堆进行排序,不了解二叉堆的可以先看这里.本文以升序排序为例,首先将待排序数组放置在最小堆中,此时堆顶一定是数组中最小的元素,然后删除堆顶元素,此时调整后的最小堆顶会是第二小的元素,从 ...

  3. this关键词详解

    当一个对象创建后,Java虚拟机(JVM)就会给这个对象分配一个引用自身的指针,这个指针的名字就是 this. 因此,this只能在类中的非静态方法中使用,静态方法和静态的代码块中绝对不能出现this ...

  4. python函数的作用域和引用范围

    以下内容参考自runoob网站,以总结python函数知识点,巩固基础知识,特此鸣谢! 原文地址:http://www.runoob.com/python3/python3-function.html ...

  5. Java8-Optional-No.02

    import java.util.Optional; import java.util.function.Supplier; public class Optional2 { static class ...

  6. Codeforces Round #591 (Div. 2, based on Technocup 2020 Elimination Round 1) C. Save the Nature【枚举二分答案】

    https://codeforces.com/contest/1241/problem/C You are an environmental activist at heart but the rea ...

  7. Driver对 (一对两对的对):specific/mini VS general

    老是听说miniport,port,在这里算是搞清楚了.mini就是specific(特殊)的意思.在微软的驱动层次里面,最底层的一般都是比较特殊的,但是为了满足系统的可拓展.可维护.通用等要求,微软 ...

  8. P1582 倒水,P2158 [SDOI2008]仪仗队——数学,二进制

    有n个瓶子,里面都有一升水,但是只想保留k个瓶子,只能两个瓶子里面的水体积相等时才能倒在一个瓶子里:不能丢弃有水的瓶子:瓶子容量无限: 问需要购买几个额外的瓶子才能满足条件: 因为每个瓶子一开始只有一 ...

  9. include指令与jsp:include动作标识的区别

    include指令: 文件包含指令include是jsp的另一条指令标识.通过该指令可以在一个jsp页面中包含另一个jsp页面.不过该指令是静态包含,也就是说被包含文件中所有内容会被原样包含到jsp页 ...

  10. spring-boot学习 (Groovy与Spring Boot Cli)

    一.使用idea创建一个spring-boot项目,选择groovy语言 二.编写相应代码 1.创建实例类 package com.zhi.example class Man { Long id St ...