Java 中的 Set 是非常常用的数据类型。Set 是无序的 Collection,Java Set 有三个常用的实现类,分别是:HashSet、LinkedHashSet、TreeSet

本文基于 JDK8 分析

HashSet

HashSet 继承自 AbstractSet,实现了 Set 接口。底层基于 HashMap 实现,是一个不允许有重复元素的无序集合。允许 null 元素,非线程安全。HashSet 还实现了 Cloneable、Serializable 接口,所以 HashSet 是支持复制、序列化的

所以说,HashMap 是替 HashSet 打工的。就像老板手下的员工,任劳任怨,做牛做马,像极了被剥削的我们(小声哔哔)

// 用于存储元素的 HashMap
private transient HashMap<E,Object> map;
// 凑数的值元素,
private static final Object PRESENT = new Object();

HashSet 有五个构造函数,解释下第二个构造函数:默认加载因子为 0.75 的情况下,假设 c 的元素个数就是 map 此时的最大阈值,最大阈值为 (int) (c.size()/.75f),再加一,通过 HashMap 的扩容机制(取大于当前容量的最小二次幂),就可以取得最适合的容量大小

// 构造一个默认容量为 16 的 HashMap
public HashSet() {
map = new HashMap<>();
}
// 将 Collection 中的元素赋给 HashMap
public HashSet(Collection<? extends E> c) {
map = new HashMap<>(Math.max((int) (c.size()/.75f) + 1, 16));
addAll(c);
}
// 指定 HashMap 的初始容量和加载因子
public HashSet(int initialCapacity, float loadFactor) {
map = new HashMap<>(initialCapacity, loadFactor);
}
// 指定 HashMap 的初始容量
public HashSet(int initialCapacity) {
map = new HashMap<>(initialCapacity);
}
// 供 LinkedHashSet 使用
HashSet(int initialCapacity, float loadFactor, boolean dummy) {
map = new LinkedHashMap<>(initialCapacity, loadFactor);
}

HashSet 常用方法

第一个是 add 方法。HashSet 使用 HashMap 保证元素不重复,熟悉 HashMap 的都知道,HashMap 的 Key 是不允许重复的,所以可以把要添加的元素作为 HashMap 的 Key 保存,但 Value 还是要有的,所以 HashSet 又定义了一个静态常量对象 PRESENT 来凑数,实际上并没有什么意义

private static final Object PRESENT = new Object();

public boolean add(E e) {
return map.put(e, PRESENT) == null;
}

到这里就一目了然了,HashSet 中添加元素的方法其实就是调用 HashMap 的 put 方法,如果 put 方法的返回值为 null,证明以 e 为键的元素不存在,则可以添加;否则会把原有的值删除并覆盖,并返回原来的值。所以当 add 方法中的条件判断成立,则证明添加成功,反之则失败。如果不了解 HashMap 的机制,可以看一下下面这张图

![](G:\SSS\Java\Java SE\博客\HashMap add.png)

至于其他的 remove、contains 就更不用说了,全是 HashMap 的知识,不再赘述

LinkedHashSet

LinkedHashSet 是 HashSet 的子类,实现了 Set 接口,Set 有的特点它都有。既然 HashSet 靠 HashMap 干活,那是否 LinkedHashSet 也有自己的小弟呢?(没错,说的就是你 LinkedHashMap)

还记得之前提到在 HashSet 有一个专供 LinkedHashSet 使用的构造方法吗?这个构造方法只能由 LinkedHashSet 调用,参数 dummy 并没有实际意义,只是为了和 HashSet 中其他参数区分开罢了(重载原理)

LinkedHashMap 基于双向链表实现,相比于 HashMap 最大的不同就是有序。LinkedHashSet 中除了四个构造器以外再无其他方法,全部继承自 HashSet。如果想了解更多,就去看看 LinkedHashMap 吧

// HashSet 中专供 LinkedHashSet 使用的构造方法
HashSet(int initialCapacity, float loadFactor, boolean dummy) {
map = new LinkedHashMap<>(initialCapacity, loadFactor);
} // LinkedHashSet 的构造方法
public LinkedHashSet(int initialCapacity, float loadFactor) {
super(initialCapacity, loadFactor, true);
} public LinkedHashSet(int initialCapacity) {
super(initialCapacity, .75f, true);
} public LinkedHashSet() {
super(16, .75f, true);
} public LinkedHashSet(Collection<? extends E> c) {
super(Math.max(2*c.size(), 11), .75f, true);
addAll(c);
}

TreeSet

在此之前先了解一下 SortedSet,SortSet 扩展了 Set 并提供其元素的总排序,要求所有元素都必须实现 Comparable 接口,而且所有元素都必须是可比较的,即两个对象可以互相作为 compareTo 方法的参数。从这里可以看出,SortedSet 所谓的有序并不是我们通常认为的先后插入顺序,而是根据对象的比较函数对元素排序。SortSet 接口的方法如下:

// 返回用于对此集合中的元素进行排序的比较器,如果此集合使用其元素的自然顺序,则返回 null
Comparator<? super E> comparator();
// 返回此集合的部分元素,元素范围从 fromElement(包括)到 toElement(不包括)
SortedSet<E> subSet(E fromElement, E toElement);
// 返回此集合的部元素,其中元素全部小于 toElement
SortedSet<E> headSet(E toElement);
// 返回此集合的部分元素,其中元素全部大于或等于 fromElement
SortedSet<E> tailSet(E fromElement);
// 返回此集合中当前的第一个(最低)元素
E first();
// 返回此集合中当前的最后一个(最高)元素
E last();

NavigableSet 实现了 Sorted 接口,其本身也是一个接口,对 SortedHash 进行了扩展,支持导航方法,例如查找与指定目标最匹配项等。TreeSet 继承自 AbstractSet,实现了 NavigableSet 接口。TreeSet 基于 TreeMap 实现,其构造方法如下:

private transient NavigableMap<E,Object> m;

// 构造一个指定的 NavigableMap 的集合
TreeSet(NavigableMap<E,Object> m) {
this.m = m;
}
// 默认方法,根据元素的自然排序进行排序
public TreeSet() {
this(new TreeMap<E,Object>());
}
// 指定比较器进行排序
public TreeSet(Comparator<? super E> comparator) {
this(new TreeMap<>(comparator));
}
// 构造一个包含指定集合中元素的集合,根据元素的自然排序进行排序
public TreeSet(Collection<? extends E> c) {
this();
addAll(c);
}
// 构造一个包含相同元素的集合,并使用与指定排序集相同的排序
public TreeSet(SortedSet<E> s) {
this(s.comparator());
addAll(s);
}

TreeSet 也是基于 TreeMap 工作的,TreeMap 也是一个可排序的 Map,排序原理也是依靠比较器,更多的细节请了解 TreeMap

Java Set 常用集合 HashSet、LinkedHashSet、TreeSet的更多相关文章

  1. java集合框架之几种set(HashSet LinkedHashSet TreeSet )

    参考http://how2j.cn/k/collection/collection-sets/691.html#nowhere HashSet LinkedHashSet TreeSet HashSe ...

  2. Java中的集合HashSet、LinkedHashSet、TreeSet和EnumSet(二)

    Set接口 前面已经简绍过Set集合,它类似于一个罐子,一旦把对象'丢进'Set集合,集合里多个对象之间没有明显的顺序.Set集合于Collection基本上完全一样,它没有提供任何额外的方法. Se ...

  3. Set集合——HashSet、TreeSet、LinkedHashSet(2015年07月06日)

    一.Set集合不同于List的是: Set不允许重复 Set是无序集合 Set没有下标索引,所以对Set的遍历要通过迭代器Iterator 二.HashSet 1.HashSet由一个哈希表支持,内部 ...

  4. HashSet,LinkedHashSet,TreeSet的区别

    Set接口Set不允许包含相同的元素,如果试图把两个相同元素加入同一个集合中,add方法返回false.Set判断两个对象相同不是使用==运算符,而是根据equals方法.也就是说,只要两个对象用eq ...

  5. Java容器深入浅出之HashSet、TreeSet和EnumSet

    Java集合中的Set接口,定义的是一类无顺序的.不可重复的对象集合.如果尝试添加相同的元素,add()方法会返回false,同时添加失败.Set接口包括3个主要的实现类:HashSet.TreeSe ...

  6. Java 基础 - Set接口 及其实现类HashSet/LinkedHashSet/TreeSet

    笔记: /**Set接口 及其实现类 * 公用操作同Collection: * * ①size(),clear()②isEmpty(),③contains(),④add()方法 和remove()方法 ...

  7. Java Set集合(HashSet、TreeSet)

    什么是HashSet?操作过程是怎么样的? 1.HashSet底层实际上是一个HashMap,HashMap底层采用了哈希表数据结构 2.哈希表又叫做散列表,哈希表底层是一个数组,这个数组中每一个元素 ...

  8. HashSet LinkedHashSet TreeSet 分析

    1.HashSet分析 hashset 底层是hash表,就是hashMap,是无序的,唯一的.也就是说,它的底层其实就是一个HashMap  key 值的组成值.所以具有唯一性. public Ha ...

  9. Java中常用集合操作

    一.Map 名值对存储的. 常用派生类HashMap类 添加: put(key,value)往集合里添加数据 删除: clear()删除所有 remove(key)清除单个,根据k来找 获取: siz ...

随机推荐

  1. 计算机网络-网络层(6)ICMP协议

    互联网控制报文协议(ICMP,Internet Control Message Protocol),被主机和路由器用来彼此沟通网络层的信息 ICMP报文是承载在IP分组中的,即lCMP报文是作为IP有 ...

  2. Java数据结构——循环链表

    一.单向循环链表表中的最后一个节点的指针域指向头结点,整个链表形成一个环.其他的与单链表相同. (以下图片均来自网络,侵删) 插入操作 删除操作 简单实现 public class CiNode { ...

  3. 状态压缩动态规划(状压DP)详解

    0 引子 不要999,也不要888,只要288,只要288,状压DP带回家.你买不了上当,买不了欺骗.它可以当搜索,也可以卡常数,还可以装B,方式多样,随心搭配,自由多变,一定符合你的口味! 在计算机 ...

  4. influxDB初步学习

    influxdb的安装等操作在我的文章. 首先得装influxdb,其次操作如下. application.properties spring.datasource.test1.jdbc-url=jd ...

  5. 基于postman的api自动化测试实践

    测试的好处 每个人都同意测试很重要,但并不是所有人都会去做.每当你添加新的代码,测试可以保证你的api按照预期运行.通过postman,你可以为所有api编写和运行测试脚本. postman中的测试 ...

  6. source insight4提示结尾不一致。关闭

    source insight4提示结尾不一致.关闭.世界清静了. Options -> Preferences ->Files  最后的Ask to fix inconsistent li ...

  7. Chrome开发者工具调试详解

    chrome开发者工具最常用的四个功能模块:元素(ELements).控制台(Console).源代码(Sources),网络(Network). 元素(Elements):用于查看或修改HTML元素 ...

  8. 攻防世界——web新手练习区解题记录<1>(1-4题)

    web新手练习区一至四题 第一题view_source: 题目说右键不管用了,我们先获取在线场景来看一看,我们看到这样一个网页,并且右键确实点了没什么反应,而用到右键一般就是查看网页源码 用快捷键(F ...

  9. 笔记-Linux 内存优化

    1.清理前内存使用情况 free -m2.开始清理 echo 1 > /proc/sys/vm/drop_caches 3.清理后内存使用情况 free -m 4.完成! 查看内存条数命令: d ...

  10. 浅谈备受开发者好评的.NET core敏捷开发工具,讲讲LEARUN工作流引擎

    通俗来讲,所谓一个工作流管理系统,如果将其拆分出来一个个单讲话,大致可理解为由工作流引擎.工作流设计器.流程操作.工作流客户界面. 流程监控.表单设计器.与表单的集成以及与应用程序的集成等几个部分组成 ...