为何修改equals方法时还要重写hashcode方法的原因分析

为何修改equals方法时还要重写hashcode方法

虽然在实际开发中,我们已经使用到散列集合(如HashMap),或也单独学过散列(Hash)。

但是也会有很多人像我一样,看到有些时候别人写的pojo中有对对象内hashcode函数做一个重写,这就让我重新思考为什么要这么做? 下面就让我和你一起去探索一下吧!

Hash是什么?

Hash就是上文说到的散列,是把任意长度的输入(又叫做预映射pre-image)通过散列算法变换成固定长度的输出,该输出就是散列值。它的理论时间复杂度是可以达到O(1),但一般来说,这个散列函数是极难设计的。说到散列值,就是通过散列函数转化出来的:

如果两个散列值是不一样y(x1)!=y(x2),那么这两个散列值的原始输入一定是不一样的。

如果两个散列值出现了相等,那么并不代码这两个散列值的原始输入一定是一样的,可能是属于哈希碰撞(不同关键字经过散列变换结果是一样的的现象);

对于哈希函数有哪些我也不再介绍,想了解可以直接去查散列函数的。

Hashcode作用

很多情况下我们也许都会用到hash表来做提高查询效率,那么这个hash表是如何提高效率的?其实就是基于上面所说的散列函数,根据设计的散列函数,我们对于每一个关键字都有唯一的散列值,那么就能够直接根据这个散列值直接就能找到元素在集合中的位置,从而获得其值,这对于集合的一个个对象进行比较来说,是提高了很多的。

通过以上操作,我们很容易就能理解为啥散列技术在查询的复杂度是能达到O(1).

但是一般来说java都会内置了hashcode的实现,那为什么在写对象的时候,只要对equals进行重写,都推荐对hashcode进行重写呢?

看HashCode的常规协定:

在 Java 应用程序执行期间,在同一对象上多次调用 hashCode 方法时,必须一致地返回相同的整数,前提是对象上 equals 比较中所用的信息没有被修改。从某一应用程序的一次执行到同一应用程序的另一次执行,该整数无需保持一致。

如果根据 equals(Object) 方法,两个对象是相等的,那么在两个对象中的每个对象上调用 hashCode 方法都必须生成相同的整数结果。

以下情况不 是必需的:

如果根据 equals(java.lang.Object) 方法,两个对象不相等,那么在两个对象中的任一对象上调用 hashCode 方法必定会生成不同的整数结果。但是,程序员应该知道,为不相等的对象生成不同整数结果可以提高哈希表的性能。

实际上,由 Object 类定义的 hashCode 方法确实会针对不同的对象返回不同的整数。(这一般是通过将该对象的内部地址转换成一个整数来实现的,但是 JavaTM 编程语言不需要这种实现技巧。)

当equals方法被重写时,通常有必要重写 hashCode 方法,以维护 hashCode 方法的常规协定,该协定声明相等对象必须具有相等的哈希码。

根据以上知道,java内部的一个实现是以地址来的,如果对equals进行重写了,也就是对象你判断相等时不再以java提供的方法,那么将来在使用hash表的时候,就会存在equals是相等的,但hashcode却是不相等的!

所以建议:在修改equals的方法时,记得修改hashcode方法!!!

下面做个小例子

/**
 * @author: Kilig
 * @date: 2020/6/22 21:18
 * @description:
 */
public class User {
    private int id;
    public int getId() {
        return id;
    }
    public void setId(int id) {
        this.id = id;
    }
    @Override
    public boolean equals(Object o) {
        if (this == o) return true;
        if (!(o instanceof User)) return false;
        User user = (User) o;
        return getId() == user.getId();
    }
//    @Override
//    public int hashCode() {
//        return Objects.hash(getId());
//    }
}
public static void main(String[] args) {
        User a=new User();
        User b=new User();
        a.setId(1);
        b.setId(1);
        System.out.println(a.equals(b));
        System.out.println(a.hashCode() == b.hashCode());
    }

运行结果

尝试将其放到set集合时

看到这结果显然不是我们想要的,因为我两个对象相等,其```hashcode也应相等,然而结果却是在不可重复的set集合中存了两个对象,所以我们做一个改进,对User进行重写hashcode``方法。

  @Override
    public int hashCode() {
        return Objects.hash(getId()); //使用默认的hash函数处理关键字,这里是ID,我们认为Id相等的用户其就是同一个用户
    }

然后看看set的结果:

的确符合我们预期结果。

基于以上的学习,我们也基本了解为啥在修改equals方法时也要对hashcode进行修改。

Java重写equals()方法的步骤

Java语言规范要求equals方法具有下面的特性:

  1. 自反性:对于任何非空引用x,x.equals(x)应该返回true
  2. 对称性:对于任何引用x和y,当且仅当y.equals(x)返回true,x.equals(y)也应该返回true
  3. 传递性:对于任何引用x和y和z,如果x.equal(y)返回true,y.equals(z)返回true,x.equals(z)也应该返回true
  4. 一致性:如果x和y引用的对象没有发生变化,反复调用x.equals(y)应该返回同样的结果
  5. 对于任意非空引用x,x.equals(null)应该返回false

重写equals()方法的步骤:

显式参数命名为otherObject,稍后需要将它转换成另一个叫做other的变量

检测this与otherObject是否引用同一个对象

if (this == otherObject)
    return true;

检测otherObject是否为null,是则返回false

if (this == null)
    return false;

比较this与otherObject是否属于同一个类。如果equals的语义在每个子类中有所改变,就使用getClass检测

if (getClass() != otherObject.getClass())
    return false;

如果所有的子类都拥有统一的语义,就使用instanceof检测

if (!(otherObject instanceof ClassName))
    return false;

将otherObject转换成相应的类类型变量

ClassName other = (ClassName) otherObject

将other需要比较的域成员都进行比较,只要有一个不同都返回false

需要注意的是,如果重新定义了equals()方法,就必须重新定义hashCode()方法,以便用户可以将对象插入到散列表中。

equals()方法与hashCode()方法的定义必须保持一致,即如果equals()返回true,则2个对象的hashCode()必须具有相同的值。

重写equals()方法中有提到,我们需要将要比较的域成员都进行比较,那么我们在重写hashCode()方法时可以将这些域成员的散列值组合起来,这样就能保证它与equals()方法具有一致性了。

假设需被比较的域成员为field_1、field_2与field_3,那么我们可以编写一下hashCode()方法:

public int hashCode() {
    return Objects.hash(field_1, field_2, field_3);
}

以上为个人经验,希望能给大家一个参考,也希望大家多多支持我们。

(0)

相关推荐

  • Java中equals()方法重写实现代码

    Java中equals()方法重写实现代码 Java中的equals()方法是在Object类中定义,Object类是所有类的父类.换句话说,任何类都隐含地继承了该方法.判断两个对象的内容是否相同,必须使用equals()方法,对于没有重写该方法的类,需要重写该方法. 重写equals()方法代码如下: /** *equlas()方法重写实例 */ class User { /** *方法描述:设置name值 *输入参数:String name *返回类型:void */ public void

  • 重写hashCode()和equals()方法详细介绍

    hashCode()和equals()方法可以说是Java完全面向对象的一大特色.它为我们的编程提供便利的同时也带来了很多危险.这篇文章我们就讨论一下如何正解理解和使用这2个方法. 如何重写equals()方法 如果你决定要重写equals()方法,那么你一定要明确这么做所带来的风险,并确保自己能写出一个健壮的equals()方法.一定要注意的一点是,在重写equals()后,一定要重写hashCode()方法.具体原因稍候再进行说明. 我们先看看 JavaSE 7 Specification中

  • java中重写equals()方法的同时要重写hashcode()方法(详解)

    object对象中的 public boolean equals(Object obj),对于任何非空引用值 x 和 y,当且仅当 x 和 y 引用同一个对象时,此方法才返回 true: 注意:当此方法被重写时,通常有必要重写 hashCode 方法,以维护 hashCode 方法的常规协定,该协定声明相等对象必须具有相等的哈希码.如下: (1) 当obj1.equals(obj2)为true时,obj1.hashCode() == obj2.hashCode()必须为true (2) 当obj

  • 为何修改equals方法时还要重写hashcode方法的原因分析

    为何修改equals方法时还要重写hashcode方法 虽然在实际开发中,我们已经使用到散列集合(如HashMap),或也单独学过散列(Hash). 但是也会有很多人像我一样,看到有些时候别人写的pojo中有对对象内hashcode函数做一个重写,这就让我重新思考为什么要这么做? 下面就让我和你一起去探索一下吧! Hash是什么? Hash就是上文说到的散列,是把任意长度的输入(又叫做预映射pre-image)通过散列算法变换成固定长度的输出,该输出就是散列值.它的理论时间复杂度是可以达到O(1

  • java中为何重写equals时必须重写hashCode方法详解

    前言 大家都知道,equals和hashcode是java.lang.Object类的两个重要的方法,在实际应用中常常需要重写这两个方法,但至于为什么重写这两个方法很多人都搞不明白. 在上一篇博文Java中equals和==的区别中介绍了Object类的equals方法,并且也介绍了我们可在重写equals方法,本章我们来说一下为什么重写equals方法的时候也要重写hashCode方法. 先让我们来看看Object类源码 /** * Returns a hash code value for

  • why在重写equals时还必须重写hashcode方法分享

    复制代码 代码如下: public boolean equals(Object anObject) {    if (this == anObject) {        return true;    }    if (anObject instanceof String) {        String anotherString = (String)anObject;        int n = count;        if (n == anotherString.count) { 

  • 为什么在重写 equals方法的同时必须重写 hashcode方法

    我们都知道Java语言是完全面向对象的,在java中,所有的对象都是继承于Object类. 其 equals 方法比较的是两个对象的引用指向的地址,hashcode 是一个本地方法,返回的是对象地址值.Ojbect类中有两个方法equals.hashCode,这两个方法都是用来比较两个对象是否相等的. 为何重写 equals方法的同时必须重写 hashcode方法呢 可以这样理解:重写了 equals 方法,判断对象相等的业务逻辑就变了,类的设计者不希望通过比较内存地址来比较两个对象是否相等,而

  • JavaWeb dbutils执行sql命令并遍历结果集时不能查到内容的原因分析

    JAVAWEB dbutils执行sql命令并遍历结果集时不能查到内容的原因及处理方法如下所示: 遍历结果集时只遍历bean对象才会只输出第一行那种内容(第一行是输出了UserEntity类实例化的对象),所以这里需要 re.getRepoTableName() 才能通过对象调用相对应的内容 这样一来,就可以取到值了 PS:JavaWeb之DBUtils详细介绍如下所示: 一.什么是DBUtils及作用 DBUtils是apache公司写的.DBUtils是java编程中的数据库操作实用工具,小

  • python修改包导入时搜索路径的方法

    目录 前言 一.模块导入时路径搜索机制 1.1 包导入搜索机制 1.2 修改搜索路径 1.2.1 通过修改sys.path变量 1.2.2 通过修改PYTHONPATH环境变量 1.2.3 通过添加**.pth文件 附:临时添加python搜索包路径的方法 总结 前言 在Python中,import操作应该算是最为频繁和常见的,但同时也应该是最核心需要搞清楚其工作原理的地方,比如,python是如何找到我希望导入的包的位置的,如果搞清楚了这个问题,那我们后续有自定义的包,就可以放到电脑的任意路径

  • MySql范围查找时索引不生效问题的原因分析

    1 问题描述 本文对建立好的复合索引进行排序,并取记录中非索引字段,发现索引不生效,例如,有如下表,DDL语句为: CREATE TABLE `employees` ( `emp_no` int(11) NOT NULL, `birth_date` date NOT NULL, `first_name` varchar(14) NOT NULL, `last_name` varchar(16) NOT NULL, `gender` enum('M','F') NOT NULL, `hire_da

  • 使用DataTable.Select 方法时,特殊字符的转义方法分享

    复制代码 代码如下: public static string Replace(string oldStr)        {            if (string.IsNullOrEmpty(oldStr))            {                return "";            }            string str2 = Regex.Replace(oldStr, @"[\[\+\\\|\(\)\^\*\""

  • java中重写equals和重写hashCode()

    java中重写equals和重写hashCode() 记得在刚上初一的时候,第一堂数学课学的是集合,那时候我知道了集合是不允许重复元素存在的. hashCode 方法用于散列集合的查找,equals 方法用于判断两个对象是否相等. 为什么重写了 equals 方法,还要重写 hashCode 方法? 因为如果只重写了 equals 方法,两个对象 equals 返回了true,但是如果没有重写 hashCode 方法,集合还是会插入元素.这样集合中就出现了重复元素了. 接下来详细分析,以 Has

随机推荐