为什么重写equals的同时要重写hashcode

在覆盖equals方法的时候，你必须要遵守它的通用约定。下面是约定的内容，来自Object的规范[JavaSE6]

自反性。对于任何非null的引用值x，x.equals(x)必须返回true。
对称性。对于任何非null的引用值x和y，当且仅当y.equals(x)返回true时，x.equals(y)必须返回true
传递性。对于任何非null的引用值x、y和z，如果x.equals(y)返回true，并且y.equals(z)也返回true，那么x.equals(z)也必须返回true。
一致性。对于任何非null的引用值x和y，只要equals的比较操作在对象中所用的信息没有被修改，多次调用该x.equals(y)就会一直地返回true，或者一致地返回false。
对于任何非null的引用值x，x.equals(null)必须返回false。

结合以上要求，得出了以下实现高质量equals方法的诀窍：

使用==符号检查“参数是否为这个对象的引用”。如果是，则返回true。这只不过是一种性能优化，如果比较操作有可能很昂贵，就值得这么做。
使用instanceof操作符检查“参数是否为正确的类型”。如果不是，则返回false。一般来说，所谓“正确的类型”是指equals方法所在的那个类。
把参数转换成正确的类型。因为转换之前进行过instanceof测试，所以确保会成功。
对于该类中的每个“关键”域，检查参数中的域是否与该对象中对应的域相匹配。如果这些测试全部成功，则返回true;否则返回false。
当编写完成了equals方法之后，检查“对称性”、“传递性”、“一致性”。

这里可以用hashmap重写的euqals作为模板讲解

public final boolean equals(Object o) {

           //自反性

           if (o == this)

               return true;

           if (o instanceof Map.Entry) {

               Map.Entry<?,?> e = (Map.Entry<?,?>)o;

               if (Objects.equals(key, e.getKey()) &&

                   Objects.equals(value, e.getValue()))

                   return true;

           }

           return false;

       }

覆盖equals时总要覆盖hashCode 的原因：

一个很常见的错误根源在于没有覆盖hashCode方法。在每个覆盖了equals方法的类中，也必须覆盖hashCode方法。如果不这样做的话，就会违反Object.hashCode的通用约定，从而导致该类无法结合所有基于散列的集合一起正常运作，这样的集合包括HashMap、HashSet和Hashtable。

比如将两个对象存入HashSet里面：如果不重写hashCode，还用原来的hashCode就可能判断两个对象的hashCode不相等（其实重写hashCode再判断这两个对象才发现这两个对象的hashCode是相等的），然后因为判断这两个对象的hashCode不相等就会直接将这两个对象存入HashSet，这就导致了实际上存入了这两个相同的对象。

在应用程序的执行期间，只要对象的equals方法的比较操作所用到的信息没有被修改，那么对这同一个对象调用多次，hashCode方法都必须始终如一地返回同一个整数。在同一个应用程序的多次执行过程中，每次执行所返回的整数可以不一致。

如果两个对象根据equals()方法比较是相等的，那么调用这两个对象中任意一个对象的hashCode方法都必须产生同样的整数结果。

如果两个对象根据equals()方法比较是不相等的，那么调用这两个对象中任意一个对象的hashCode方法，则不一定要产生相同的整数结果。但是程序员应该知道，给不相等的对象产生截然不同的整数结果，有可能提高散列表的性能。

最好同时重写equals和hashcode的原因

先来试想一个场景，如果你想查找一个集合中是否包含某个对象，那么程序应该怎么写呢？通常的做法是逐一取出每个元素与要查找的对象一一比较，当发现两者进行equals比较结果相等时，则停止查找并返回true，否则，返回false。但是这个做法的一个缺点是当集合中的元素很多时，譬如有一万个元素，那么逐一的比较效率势必下降很快。于是有人发明了一种哈希算法来提高从该集合中查找元素的效率，这种方式将集合分成若干个存储区域（可以看成一个个桶），每个对象可以计算出一个哈希码，可以根据哈希码分组，每组分别对应某个存储区域，这样一个对象根据它的哈希码就可以分到不同的存储区域（不同的桶中）。如下图所示：

实际的使用中，一个对象一般有key和value，可以根据key来计算它的hashCode。假设现在全部的对象都已经根据自己的hashCode值存储在不同的存储区域中了，那么现在查找某个对象（根据对象的key来查找），不需要遍历整个集合了，现在只需要计算要查找对象的key的hashCode，然后找到该hashCode对应的存储区域，在该存储区域中来查找就可以了，这样效率也就提升了很多。说了这么多相信你对hashCode的作用有了一定的了解，下面就来看看hashCode和equals的区别和联系。

在研究这个问题之前，首先说明一下JDK对equals(Object obj)和hashCode()这两个方法的定义和规范：在Java中任何一个对象都具备equals(Object obj)和hashCode()这两个方法，因为他们是在Object类中定义的。 equals(Object obj)方法用来判断两个对象是否“相同”，如果“相同”则返回true，否则返回false。 hashCode()方法返回一个int数，在Object类中的默认实现是“将该对象的内部地址转换成一个整数返回”。

举例

首先以hashmap的插入进行详细讲解（不想看源码的可以略过，因为这里不只分析了主题所需知识，明确需要了解hashmap储存数据的结构才能看懂）

final V putVal(int hash, K key, V value, boolean onlyIfAbsent,

                   boolean evict) {

        Node<K,V>[] tab; Node<K,V> p; int n, i;

        //hashmap采用懒加载模式，第一次往数据结构里插入的时候扩容

        if ((tab = table) == null || (n = tab.length) == 0)

            n = (tab = resize()).length;

        //hashmap根据(n - 1) & hash得出在数组的下标，首先判断该下标位置是否为空，

        //为空则直接插入

        if ((p = tab[i = (n - 1) & hash]) == null)

            tab[i] = newNode(hash, key, value, null);

        else {

            Node<K,V> e; K k;

          /**

          如果不为空则判断第一个元素的key是否等于插入的元素的key，等于则替换插入的元素

          注意这里的细节，怎么判断key是否相同的，后续都用到了相同的判断

          首先判断hash值是否相等，不相等则直接判断key不想等，相等然后再调用key的euqals方法判断

          这里先判断hash的原因是，euqals 的开销较大，先用hash对比能节省大部分需要用到euqals的情况

          所以重写equals的同时要重写hashcode，当然不是每种情况都需要，但是重写一些更保险，防止后续补充了数据结构忘记重写

          */

            if (p.hash == hash &&

                ((k = p.key) == key || (key != null && key.equals(k))))

                e = p;

          //判断是否树化

            else if (p instanceof TreeNode)

                e = ((TreeNode<K,V>)p).putTreeVal(this, tab, hash, key, value);

            else {

          //遍历比较是否有相同的key

                for (int binCount = 0; ; ++binCount) {

                    //当遍历完都没有相同的key

                    if ((e = p.next) == null) {

                        p.next = newNode(hash, key, value, null);

                        if (binCount >= TREEIFY_THRESHOLD - 1) // -1 for 1st

                            treeifyBin(tab, hash);

                        break;

                    }

                    if (e.hash == hash &&

                        ((k = e.key) == key || (key != null && key.equals(k))))

                        break;

                    p = e;

                }

            }

        //e!=null表示有相同的key，否则根据if ((e = p.next) == null)这一判断条件会一直走到e=null

            if (e != null) { // existing mapping for key

                V oldValue = e.value;

                if (!onlyIfAbsent || oldValue == null)

                    e.value = value;

                afterNodeAccess(e);

                return oldValue;

            }

        }

        ++modCount;

      //一共两种需要扩容的情况，这是第二种，当size大于阈值的时候扩容

        if (++size > threshold)

            resize();

        afterNodeInsertion(evict);

        return null;

    }

最后再来看几个测试的例子吧：

测试一：覆盖equals（Object obj）但不覆盖hashCode（）,导致数据不唯一性

public class HashCodeTest {

    public static void main(String[] args) {

        Collection set = new HashSet();

        Point p1 = new Point(1, 1);

        Point p2 = new Point(1, 1);  

        System.out.println(p1.equals(p2));

        set.add(p1);   //(1)

        set.add(p2);   //(2)

        set.add(p1);   //(3)  

        Iterator iterator = set.iterator();

        while (iterator.hasNext()) {

            Object object = iterator.next();

            System.out.println(object);

        }

    }

}  

class Point {

    private int x;

    private int y;  

    public Point(int x, int y) {

        super();

        this.x = x;

        this.y = y;

    }  

    @Override

    public boolean equals(Object obj) {

        if (this == obj)

            return true;

        if (obj == null)

            return false;

        if (getClass() != obj.getClass())

            return false;

        Point other = (Point) obj;

        if (x != other.x)

            return false;

        if (y != other.y)

            return false;

        return true;

    }  

    @Override

    public String toString() {

        return "x:" + x + ",y:" + y;

    }  

}

输出结果：

true

x:1,y:1

x:1,y:1

原因分析：

（1）当执行set.add(p1)时（1），集合为空，直接存入集合；

（2）当执行set.add(p2)时（2），首先判断该对象（p2）的hashCode值所在的存储区域是否有相同的hashCode，因为没有覆盖hashCode方法，所以jdk使用默认Object的hashCode方法，返回内存地址转换后的整数，因为不同对象的地址值不同，所以这里不存在与p2相同hashCode值的对象，因此jdk默认不同hashCode值，equals一定返回false，所以直接存入集合。

（3）当执行set.add(p1)时（3），时，因为p1已经存入集合，同一对象返回的hashCode值是一样的，继续判断equals是否返回true，因为是同一对象所以返回true。此时jdk认为该对象已经存在于集合中，所以舍弃。

测试二：覆盖hashCode方法，但不覆盖equals方法，仍然会导致数据的不唯一性

修改Point类：

class Point {

    private int x;

    private int y;  

    public Point(int x, int y) {

        super();

        this.x = x;

        this.y = y;

    }  

    @Override

    public int hashCode() {

        final int prime = 31;

        int result = 1;

        result = prime * result + x;

        result = prime * result + y;

        return result;

    }  

    @Override

    public String toString() {

        return "x:" + x + ",y:" + y;

    }  

}

输出结果：

false

x:1,y:1

x:1,y:1

原因分析：

（1）当执行set.add(p1)时（1），集合为空，直接存入集合；

（2）当执行set.add(p2)时（2），首先判断该对象（p2）的hashCode值所在的存储区域是否有相同的hashCode，这里覆盖了hashCode方法，p1和p2的hashCode相等，所以继续判断equals是否相等，因为这里没有覆盖equals，默认使用'=='来判断（返回内存地址），所以这里equals返回false，jdk认为是不同的对象，所以将p2存入集合。

（3）当执行set.add(p1)时（3），时，因为p1已经存入集合，同一对象返回的hashCode值是一样的，并且equals返回true。此时jdk认为该对象已经存在于集合中，所以舍弃。

综合上述两个测试，要想保证元素的唯一性，必须同时覆盖hashCode和equals才行。

（注意：在HashSet中插入同一个元素（hashCode和equals均相等）时，会被舍弃，而在HashMap中插入同一个Key（Value 不同）时，原来的元素会被覆盖。）

测试三：在内存泄露问题

public class HashCodeTest {

    public static void main(String[] args) {

        Collection set = new HashSet();

        Point p1 = new Point(1, 1);

        Point p2 = new Point(1, 2);  

        set.add(p1);

        set.add(p2);  

        p2.setX(10);

        p2.setY(10);  

        set.remove(p2);  

        Iterator iterator = set.iterator();

        while (iterator.hasNext()) {

            Object object = iterator.next();

            System.out.println(object);

        }

    }

}  

class Point {

    private int x;

    private int y;  

    public Point(int x, int y) {

        super();

        this.x = x;

        this.y = y;

    }  

    public int getX() {

        return x;

    }  

    public void setX(int x) {

        this.x = x;

    }  

    public int getY() {

        return y;

    }  

    public void setY(int y) {

        this.y = y;

    }  

    @Override

    public int hashCode() {

        final int prime = 31;

        int result = 1;

        result = prime * result + x;

        result = prime * result + y;

        return result;

    }  

    @Override

    public boolean equals(Object obj) {

        if (this == obj)

            return true;

        if (obj == null)

            return false;

        if (getClass() != obj.getClass())

            return false;

        Point other = (Point) obj;

        if (x != other.x)

            return false;

        if (y != other.y)

            return false;

        return true;

    }  

    @Override

    public String toString() {

        return "x:" + x + ",y:" + y;

    }  

}

运行结果：

x:1,y:1

x:10,y:10

原因分析：

假设p1的hashCode为1，p2的hashCode为2，在存储时p1被分配在1号桶中，p2被分配在2号筒中。这时修改了p2中与计算hashCode有关的信息（x和y）,当调用remove(Object obj)时，首先会查找该hashCode值得对象是否在集合中。假设修改后的hashCode值为10（仍存在2号桶中）,这时查找结果空，jdk认为该对象不在集合中，所以不会进行删除操作。然而用户以为该对象已经被删除，导致该对象长时间不能被释放，造成内存泄露。解决该问题的办法是不要在执行期间修改与hashCode值有关的对象信息，如果非要修改，则必须先从集合中删除，更新信息后再加入集合中。

总结：

1.hashCode是为了提高在散列结构存储中查找的效率，在线性表中没有作用。

2.equals和hashCode需要同时覆盖。

3.若两个对象equals返回true，则hashCode有必要也返回相同的int数。

4.若两个对象equals返回false，则hashCode不一定返回不同的int数,但为不相等的对象生成不同hashCode值可以提高哈希表的性能。

5.若两个对象hashCode返回相同int数，则equals不一定返回true。

6.若两个对象hashCode返回不同int数，则equals一定返回false。

7.同一对象在执行期间若已经存储在集合中，则不能修改影响hashCode值的相关信息，否则会导致内存泄露问题。

最后最后：如果你看到了这里并觉得文章对你有一点点帮助，希望可以评论区告诉我，哪怕扣个1也行，能看到别人对我的意见或者赞赏是我的动力

本文参考：https://blog.csdn.net/tiantiandjava/article/details/46988461

为什么重写equals的同时要重写hashcode的更多相关文章

java -为什么重写equals()，还需要重写hashCode()?
1.先post这两个方法的基本定义: equals()的定义: 浅谈Java中的equals和==(转) hashCode()的定义: java中hashCode()方法的作用 Java中hashCo ...
为什么重写equals()方法就必须重写hashCode()方法
hashCode()和equals()保持一致,如果equals方法返回true,那么两个对象的hasCode()返回值必须一样.如果equals方法返回false,hashcode可以不一样,但是这 ...
一文搞懂--Java中重写equals方法为什么要重写hashcode方法？
Java中重写equals方法为什么要重写hashcode方法? 直接看下面的例子: 首先我们只重写equals()方法 public class Test { public static void ...
重写Equals为什么要同时重写GetHashCode
.NET程序员都知道,如果我们重写一个类的Equals方法而没有重写GetHashCode,则VS会提示警告 :“***”重写 Object.Equals(object o)但不重写 Object.G ...
【转】重写Equals为什么要同时重写GetHashCode
.NET程序员都知道,如果我们重写一个类的Equals方法而没有重写GetHashCode,则VS会提示警告 :“***”重写 Object.Equals(object o)但不重写 Object.G ...
重写equals()方法也要重写hashcode()方法
如果我们对equals方法进行了重写,建议一定要对hashCode方法重写,以保证相同的对象返回相同的hash值,不同的对象返回不同的hash值.
JAVA中重写equals()方法为什么要重写hashcode()方法?
object对象中的 public boolean equals(Object obj),对于任何非空引用值 x 和 y,当且仅当 x 和 y 引用同一个对象时,此方法才返回 true:注意:当此方法 ...
why在重写equals时还必须重写hashcode方法
首先我们先来看下String类的源码:可以发现String是重写了Object类的equals方法的,并且也重写了hashcode方法 public boolean equals(Object anO ...
为什么重写equals时一定要重写hashcode
我们开发时写一个类,默认继承Object类,Object类的equals方法是比较是否指向同一个对象(地址是否相同), Object类的hashcode方法返回的对象内存地址的值, 一个类只重写了e ...

随机推荐

对QuerySet的理解
1. 如何通过Django的Model操作数据库? 在Django的Model中,QuerySet是一个很重要的概念.因为我们同数据库的所有查询以及更新交互都是通过它来完成的. 2. Django的M ...
java 编程基础 Class对象反射：参数反射
方法参数反射 Java8在java.lang.reflect包下新增了Executable抽象基类,该对象代表可执行的类成员,该类派生了Constructor和Method两个子类.Executabl ...
libevent源码学习（15）：信号event的处理
目录信号event处理流程与信号event相关的结构体初始化工作创建一个信号event添加一个信号event信号回调函数信号event的激活 Libevent中的event,主要分为三大类 ...
Clusternet 成为首批通过工信部开源成熟度评估项目！！！
Clusternet 作为首批项目参与了<信息技术开源开源项目评估模型参考架构>测评,并成为通过评估的四个项目之一.<信息技术开源开源项目评估模型参考架构>由国防科技大 ...
【九度OJ】题目1176：树查找解题报告
[九度OJ]题目1176:树查找解题报告标签(空格分隔): 九度OJ http://ac.jobdu.com/problem.php?pid=1176 题目描述: 有一棵树,输出某一深度的所有节点 ...
机器人的舞蹈（hdu 2232）
机器人的舞蹈 Time Limit: 1000/1000 MS (Java/Others) Memory Limit: 32768/32768 K (Java/Others)Total Subm ...
1052 - String Growth
1052 - String Growth PDF (English) Statistics Forum Time Limit: 2 second(s) Memory Limit: 32 MB Z ...
Docker 与 K8S学习笔记（三）—— 镜像的使用
前面的文章介绍过镜像的三种获取方式: 下载并使用别人创建好的镜像: 在现有镜像上创建新的镜像: 从无到有创建镜像. 本文主要介绍前两种. 一.下载镜像在Docker Hub上有大量优质镜像可以使用, ...
破解UltraEdit64 Version 28.20.0.92 技术分享。
本文为原创作品,转载请注明出处,作者:Chris.xisaer E-mail:69920579@qq.com QQ群3244694 补丁程序下载地址:https://download.csdn.net ...
Codeforces 876B：Divisiblity of Differences（数学）
B. Divisiblity of Differences You are given a multiset of n integers. You should select exactly k of ...

为什么重写equals的同时要重写hashcode

为什么重写equals的同时要重写hashcode的更多相关文章

随机推荐

热门专题