Java集合之HashSet

1.HashSet概述：
　　HashSet实现Set接口，由哈希表（实际上是一个HashMap实例）支持。它不保证set 的迭代顺序；特别是它不保证该顺序恒久不变。此类允许使用null元素。HashSet中不允许有重复元素，这是因为HashSet是基于HashMap实现的，HashSet中的元素都存放在HashMap的key上面，而value中的值都是统一的一个private static final Object PRESENT = new Object();。HashSet跟HashMap一样，都是一个存放链表的数组。

　　HashSet中add方法调用的是底层HashMap中的put()方法，而如果是在HashMap中调用put，首先会判断key是否存在，如果key存在则修改value值，如果key不存在这插入这个key-value。而在set中，因为value值没有用，也就不存在修改value值的说法，因此往HashSet中添加元素，首先判断元素（也就是key）是否存在，如果不存在这插入，如果存在着不插入，这样HashSet中就不存在重复值。

2.HashSet的实现：

对于HashSet而言，它是基于HashMap实现的，HashSet底层使用HashMap来保存所有元素，更确切的说，HashSet中的元素，只是存放在了底层HashMap的key上，而value使用一个static final的Object对象标识。因此HashSet 的实现比较简单，相关HashSet的操作，基本上都是直接调用底层HashMap的相关方法来完成，HashSet的源代码如下：

public class HashSet<E>

    extends AbstractSet<E>

    implements Set<E>, Cloneable, java.io.Serializable

{

    static final long serialVersionUID = -5024744406713321676L;

    // 底层使用HashMap来保存HashSet中所有元素。

    private transient HashMap<E,Object> map;

    // 定义一个虚拟的Object对象作为HashMap的value，将此对象定义为static final。

    private static final Object PRESENT = new Object();

    /**

     * 默认的无参构造器，构造一个空的HashSet。

      *

     * 实际底层会初始化一个空的HashMap，并使用默认初始容量为16和加载因子0.75。

      */

    public HashSet() {

        map = new HashMap<E,Object>();

    }

    /**

     * 构造一个包含指定collection中的元素的新set。

      *

     * 实际底层使用默认的加载因子0.75和足以包含指定

     * collection中所有元素的初始容量来创建一个HashMap。

     * @param c 其中的元素将存放在此set中的collection。

     */

    public HashSet(Collection<? extends E> c) {

        map = new HashMap<E,Object>(Math.max((int) (c.size()/.75f) + 1, 16));

        addAll(c);

    }

    /**

     * 以指定的initialCapacity和loadFactor构造一个空的HashSet。

     *

     * 实际底层以相应的参数构造一个空的HashMap。

     * @param initialCapacity 初始容量。

     * @param loadFactor 加载因子。

     */

    public HashSet(int initialCapacity, float loadFactor) {

        map = new HashMap<E,Object>(initialCapacity, loadFactor);

    }

    /**

     * 以指定的initialCapacity构造一个空的HashSet。

     *

     * 实际底层以相应的参数及加载因子loadFactor为0.75构造一个空的HashMap。

     * @param initialCapacity 初始容量。

     */

    public HashSet(int initialCapacity) {

        map = new HashMap<E,Object>(initialCapacity);

    }

    /**

     * 以指定的initialCapacity和loadFactor构造一个新的空链接哈希集合。

     * 此构造函数为包访问权限，不对外公开，实际只是是对LinkedHashSet的支持。

     *

     * 实际底层会以指定的参数构造一个空LinkedHashMap实例来实现。

     * @param initialCapacity 初始容量。

     * @param loadFactor 加载因子。

     * @param dummy 标记。

     */

    HashSet(int initialCapacity, float loadFactor, boolean dummy) {

        map = new LinkedHashMap<E,Object>(initialCapacity, loadFactor);

    }

    /**

     * 返回对此set中元素进行迭代的迭代器。返回元素的顺序并不是特定的。

     *

     * 底层实际调用底层HashMap的keySet来返回所有的key。

     * 可见HashSet中的元素，只是存放在了底层HashMap的key上，

     * value使用一个static final的Object对象标识。

     * @return 对此set中元素进行迭代的Iterator。

     */

    public Iterator<E> iterator() {

        return map.keySet().iterator();

    }

    /**

     * 返回此set中的元素的数量（set的容量）。

     *

     * 底层实际调用HashMap的size()方法返回Entry的数量，就得到该Set中元素的个数。

     * @return 此set中的元素的数量（set的容量）。

     */

    public int size() {

        return map.size();

    }

    /**

     * 如果此set不包含任何元素，则返回true。

     *

     * 底层实际调用HashMap的isEmpty()判断该HashSet是否为空。

     * @return 如果此set不包含任何元素，则返回true。

     */

    public boolean isEmpty() {

        return map.isEmpty();

    }

    /**

     * 如果此set包含指定元素，则返回true。

     * 更确切地讲，当且仅当此set包含一个满足(o==null ? e==null : o.equals(e))

     * 的e元素时，返回true。

     *

     * 底层实际调用HashMap的containsKey判断是否包含指定key。

     * @param o 在此set中的存在已得到测试的元素。

     * @return 如果此set包含指定元素，则返回true。

     */

    public boolean contains(Object o) {

        return map.containsKey(o);

    }

    /**

     * 如果此set中尚未包含指定元素，则添加指定元素。

     * 更确切地讲，如果此 set 没有包含满足(e==null ? e2==null : e.equals(e2))

     * 的元素e2，则向此set 添加指定的元素e。

     * 如果此set已包含该元素，则该调用不更改set并返回false。

     *

     * 底层实际将将该元素作为key放入HashMap。

     * 由于HashMap的put()方法添加key-value对时，当新放入HashMap的Entry中key

     * 与集合中原有Entry的key相同（hashCode()返回值相等，通过equals比较也返回true），

     * 新添加的Entry的value会将覆盖原来Entry的value，但key不会有任何改变，

     * 因此如果向HashSet中添加一个已经存在的元素时，新添加的集合元素将不会被放入HashMap中，

     * 原来的元素也不会有任何改变，这也就满足了Set中元素不重复的特性。

     * @param e 将添加到此set中的元素。

     * @return 如果此set尚未包含指定元素，则返回true。

     */

    public boolean add(E e) {

        return map.put(e, PRESENT)==null;

    }

    /**

     * 如果指定元素存在于此set中，则将其移除。

     * 更确切地讲，如果此set包含一个满足(o==null ? e==null : o.equals(e))的元素e，

     * 则将其移除。如果此set已包含该元素，则返回true

     * （或者：如果此set因调用而发生更改，则返回true）。（一旦调用返回，则此set不再包含该元素）。

     *

     * 底层实际调用HashMap的remove方法删除指定Entry。

     * @param o 如果存在于此set中则需要将其移除的对象。

     * @return 如果set包含指定元素，则返回true。

     */

    public boolean remove(Object o) {

        return map.remove(o)==PRESENT;

    }

    /**

     * 从此set中移除所有元素。此调用返回后，该set将为空。

     *

     * 底层实际调用HashMap的clear方法清空Entry中所有元素。

     */

    public void clear() {

        map.clear();

    }

    /**

     * 返回此HashSet实例的浅表副本：并没有复制这些元素本身。

     *

     * 底层实际调用HashMap的clone()方法，获取HashMap的浅表副本，并设置到HashSet中。

     */

    public Object clone() {

        try {

            HashSet<E> newSet = (HashSet<E>) super.clone();

            newSet.map = (HashMap<E, Object>) map.clone();

            return newSet;

        } catch (CloneNotSupportedException e) {

            throw new InternalError();

        }

    }

}

3.示例：
接下来看一个示例程序，测试一下自己是否真正掌握了HashSet 集合的功能。

package com.spring.test;

import java.util.HashSet;

import java.util.Set;

class Name

{

    private String first;

    private String last;    

    public Name(String first, String last)

    {

        this.first = first;

        this.last = last;

    }    

    public boolean equals(Object o)

    {

        if (this == o)

        {

            return true;

        }    

        if (o.getClass() == Name.class)

        {

            Name n = (Name)o;

            return n.first.equals(first)

                && n.last.equals(last);

        }

        return false;

    }

} 

public class TestSet {

    public static void main(String[] args){

        Set<Name> s = new HashSet<Name>();

        s.add(new Name("abc", "123"));

        System.out.println(

        s.contains(new Name("abc", "123")));

    }

}

上面程序中向 HashSet 里添加了一个 new Name("abc", "123") 对象之后，立即通过程序判断该 HashSet 是否包含一个 new Name("abc", "123") 对象。粗看上去，很容易以为该程序会输出 true。实际运行上面程序将看到程序输出 false，这是因为 HashSet 判断两个对象相等的标准除了要求通过 equals() 方法比较返回 true 之外，还要求两个对象的 hashCode() 返回值相等。而上面程序没有重写 Name 类的 hashCode() 方法，两个 Name 对象的 hashCode() 返回值并不相同，因此 HashSet 会把它们当成 2 个对象处理，因此程序返回 false。
由此可见，当我们试图把某个类的对象当成 HashMap 的 key，或试图将这个类的对象放入 HashSet 中保存时，重写该类的 equals(Object obj) 方法和 hashCode() 方法很重要，而且这两个方法的返回值必须保持一致：当该类的两个的 hashCode() 返回值相同时，它们通过 equals() 方法比较也应该返回 true。通常来说，所有参与计算 hashCode() 返回值的关键属性，都应该用于作为 equals() 比较的标准。如下程序就正确重写了 Name 类的 hashCode() 和 equals() 方法，程序如下：

package com.spring.test;

import java.util.HashSet;

import java.util.Set;

class Name

{

    private String first;

    private String last;    

    public Name(String first, String last){

        this.first = first;

        this.last = last;

    }    

    // 根据 first 判断两个 Name 是否相等

    public boolean equals(Object o){

        if (this == o){

            return true;

        }    

        if (o.getClass() == Name.class){

            Name n = (Name)o;

            return n.first.equals(first);

        }

        return false;

    } 

    // 根据 first 计算 Name 对象的 hashCode() 返回值

    public int hashCode(){

        return first.hashCode();

    }

    public String toString(){

        return"Name[first=" + first + ", last=" + last + "]";

    } 

} 

public class TestSet {

    public static void main(String[] args){

        Set<Name> set = new HashSet<Name>();

        set.add(new Name("abc", "123"));

        set.add(new Name("abc", "456"));

        System.out.println(set);

    }

}

上面程序中提供了一个 Name 类，该 Name 类重写了 equals() 和 toString() 两个方法，这两个方法都是根据 Name 类的 first 实例变量来判断的，当两个Name 对象的 first 实例变量相等时，这两个 Name 对象的 hashCode() 返回值也相同，通过 equals() 比较也会返回 true。
程序主方法先将第一个 Name 对象添加到 HashSet 中，该 Name 对象的 first 实例变量值为"abc"，接着程序再次试图将一个 first 为"abc"的 Name 对象添加到 HashSet 中，很明显，此时没法将新的 Name 对象添加到该 HashSet 中，因为此处试图添加的 Name 对象的 first 也是" abc"，HashSet 会判断此处新增的Name 对象与原有的 Name 对象相同，因此无法添加进入，这时输出 set 集合时将看到该集合里只包含一个 Name 对象，就是第一个、last 为"123"的 Name 对象。

4.总结：

（1）HashSet 的实现其实非常简单，它只是封装了一个 HashMap 对象来存储所有的集合元素，所有放入 HashSet 中的集合元素实际上由 HashMap 的 key 来保存，而 HashMap 的 value 则存储了一个 PRESENT，它是一个静态的 Object 对象。

（2）对于HashSet中保存的对象，请注意正确重写其equals和hashCode方法，以保证放入的对象的唯一性。

Java集合之HashSet的更多相关文章

Java 集合：HashSet 与 ArrayList
Set 集合是无序不可以重复的的.List 集合是有序可以重复的. Java 集合:HashSet 与 hashCode.equals 博客里面已经说到这个问题,但是解释的还是不够清楚. 看一个小例子 ...
Java 集合 HashMap & HashSet 拾遗
Java 集合 HashMap & HashSet 拾遗 @author ixenos 摘要:HashMap内部结构分析 Java HashMap采用的是冲突链表方式从上图容易看出,如果选择 ...
死磕 java集合之HashSet源码分析
问题 (1)集合(Collection)和集合(Set)有什么区别? (2)HashSet怎么保证添加元素不重复? (3)HashSet是否允许null元素? (4)HashSet是有序的吗? (5) ...
Java集合：HashSet的源码分析
Java集合---HashSet的源码分析一. HashSet概述: HashSet实现Set接口,由哈希表(实际上是一个HashMap实例)支持.它不保证set 的迭代顺序:特别是它不保证该 ...
Java集合之HashSet/TreeSet原理
Set集合 1.HashSet 只去重复, 没有顺序 HashSet的add方法会调用hashCode和equals, 所以存储在HashSet中的对象需要重写这两个方法. 2.TreeSet ...
Java集合系列-HashSet
原创文章,转载请标注出处:https://www.cnblogs.com/V1haoge/p/10755431.html 一.概述 HashSet是基于哈希实现的set集合,其实它底层是一个value ...
【Java集合】HashSet源码解析以及HashSet与HashMap的区别
HashSet 前言 HashSet是一个不可重复且元素无序的集合.内部使用HashMap实现. 我们可以从HashSet源码的类注释中获取到如下信息: 底层基于HashMap实现,所以迭代过程中不能 ...
java集合之HashSet哈希SET基础
hashSet实现set接口.serializable.cloneable接口.不允许有重复值,但可以null,不保证与插入顺序一致. HashSet迭代的时间与HashSet实例的大小(元素的数量) ...
Java集合之HashSet源码分析
概述 HashSet是基于HashMap来实现的, 底层采用HashMap的key来保存数据, 借此实现元素不重复, 因此HashSet的实现比较简单, 基本上的都是直接调用底层HashMap的相关方 ...

随机推荐

Ubuntu 15.1 unity在顶部面板显示系统CPU/内存/网络速度
全部的文件:http://files.cnblogs.com/files/xiaobo-Linux/ubuntu%E6%98%BE%E7%A4%BA%E7%B3%BB%E7%BB%9F%E7%BD%9 ...
IT人士怎样的休息方式才高效
为什么你睡了11个小时仍然觉得疲累? 为什么你花了好几万去岛国度假并没有增加生活的热情? 都说要去KTV,去夜店,去游乐园就能忘掉不快,更带劲地开始新的一天,但是尽兴归来心里只剩空虚? 我们真的明白休 ...
CORS基础要点：关于dataType、contentType、withCredentials
事实上,面试时我喜欢问跨域,因为多数开发者都知道它并且常用,而我希望能从面试者的回答中知道他在这个问题的深入程度,进一步看看面试者研究问题的思维方式及钻研精神,然而确实难到了很多人,当然这也不是面试通 ...
Java并发包源码分析
并发是一种能并行运行多个程序或并行运行一个程序中多个部分的能力.如果程序中一个耗时的任务能以异步或并行的方式运行,那么整个程序的吞吐量和可交互性将大大改善.现代的PC都有多个CPU或一个CPU中有多个 ...
java.io.NotSerializableException: test.io.file.Student
java.io.NotSerializableException: test.io.file.Student at java.io.ObjectOutputStream.writeObject0 ...
C#中string.format用法详解
C#中string.format用法详解本文实例总结了C#中string.format用法.分享给大家供大家参考.具体分析如下: String.Format 方法的几种定义: String.Form ...
Django基础之安装配置
安装配置一 MVC和MTV模式著名的MVC模式:所谓MVC就是把web应用分为模型(M),控制器(C),视图(V)三层:他们之间以一种插件似的,松耦合的方式连接在一起. 模型负责业务对象与数据库的 ...
webgl动画小测试
// MultiPoint.js (c) 2012 matsuda // Vertex shader program var VSHADER_SOURCE = 'attribute vec4 a_Po ...
[LeetCode] Rank Scores 分数排行
Write a SQL query to rank scores. If there is a tie between two scores, both should have the same ra ...
[LeetCode] Read N Characters Given Read4 用Read4来读取N个字符
The API: int read4(char *buf) reads 4 characters at a time from a file.The return value is the actua ...

Java集合之HashSet

Java集合之HashSet的更多相关文章

随机推荐

热门专题