java自定义equals函数和hashCode函数

 

所有类都继承自Object类,他所有的非final方法:equals,hashCode, toString, clone 和 finalize,它们都有通用约定。 我们在覆盖这些方法的时候需要遵循这些约定,否则依赖这些约定的类(例如HashMap和HashSet)就无法结合该类一起工作了。

 

一. equals

相等的概念:

  • 逻辑相等:例如Integer中包含的数值相等,我们就认为这两个Integer相等。 再比如AbstractList中如果两个list包含的所有元素相等则两个List相等。
  • 真正意义上的相等:同一个对象。

如果不重载equals函数,那么两个类的相等只能是真正意义上的equal。如果类想要自己的相等逻辑就需要像Integer/List那样重载equals函数。

 

java规范中equals方法特征

  • 自反性 : 对于任何非空引用x, x.equals(x) 返回true;
  • 对称性: 对于任何引用x, y, 当且仅当y.equals(x) 返回true, x.equals(y)返回true;
  • 传递性: 对于任何引用x, y, z, 若x.equals(y)返回true, y.equals(z)返回true; 则 x.equals(z)返回true;
  • 一致性: 若x和y引用的对象没有发生改变, 则反复调用x.equals(y)应该返回同样的结果.
  • 对任意非空引用x, x.equals(null) 返回false;

下面可以通过两个不同的情况看待这个问题:

  • 如果子类能够拥有自己的相等概念, 则对称性需求强制采用getClass进行检测
  • 如果由超类决定相等的概念, 那么就用instanceof进行检测,这样可以在不用子类的对象之间进行相等的比较

 

TimeStamp的不对称性

Date date = new Date();
Timestamp t1 = new Timestamp(date.getTime());

System.out.println("Date equals Timestamp ? : " +  date.equals(t1));// true
System.out.println("Timestamp equals Date ? : " +  t1.equals(date));// false

 

TimeStamp源码:(使用了instanceof 而不是 getClass())

    // Timestamp
    @Override
    public boolean equals(java.lang.Object ts) {
        if (ts instanceof Timestamp) {
            return this.equals((Timestamp)ts);
        } else {
            return false;// 非Timestamp 实例直接返回false
        }
    }
    // 省略其他代码
    public boolean equals(Timestamp ts) {
        if (super.equals(ts)) {
            if  (nanos == ts.nanos) {
                return true;
            } else {
                return false;
            }
        } else {
            return false;
        }
    }

父类Date:

    // Date
    @Override
    public boolean equals(Object obj) {
        return obj instanceof Date && getTime() == ((Date) obj).getTime();
    }

 

备注:

  1. 在标准的java库中包含150多个equals方法的实现,包括instanceof检测, 调用getClass检测, 捕获ClassCastException检测或者什么都不做. 在java.sql.TimeStamp实现人员指出, Timestamp类继承Date类,而后者的equals方法使用了一个instanceof检测,这样重写equals方法时,就无法同时做到对称性.
  2. 在由超类决定相等时,可以考虑final关键字修改比较函数,若考虑到子类equals方法灵活性,可以不加修饰,例如AbstractSet.equals方法,应该申明为final, 这样就可以比较子类HashSet和TreeSet, 但是考虑到子类的灵活性,没有添加任何修饰.

 

编写equals方法的建议:

  1. 显示参数命名为otherObject, 稍后转化成other变量

    public boolean equals(Object otherObject)

  2. 检测this和otherObject是否是同一个对象的引用,是,返回true;

    if(this==otherObject){
    return true;
    }

  3. 检测otherObject是否为null, 是, 返回false;

    if(otherObject == null){
    return false;
    }

  4. 比较this和otherObject是否属于同一个类. 如果equals的语义在每个子类中有所改变,就使用getClass检测:

    if(getClass() != otherObject.getClass()){
    return false;
    }

    如果所以子类语义相同,使用instanceof检测:

    if(!(otherObject instanceof Employee)){
    return false;
    }

     

  5. 将otherObject转化为相对应的类型变量other

    Employee other = (Employee)otherObject;

  6. 对所需要的比较的数据域进行比较. 如果是基本数据类型,使用a==b比较; 如果是对象比较,调用Objects.equals(a, b)进行比较

    return Objects.equals(name, other.name) && salary == other.salary && Objects.equals(hireDay, other.hireDay);

 

二、hashCode()

设计原则中有一条: 覆盖equals时总要覆盖hashCode

hashCode编码原则:

1.只要对象equals方法的比较操作所用到的信息没有被修改,对同一对象调用多次,hashCode方法都必须返回同一整数。在同一应用程序的多次执行过程中,每次执行返回的整数可以不一致。

2.如果两个对象根据equals(Object)方法比较是相等的,那么这两个对象的hashCode返回值相同。

3.如果两个对象根据equals(Object)方法比较是不等的,那么这两个对象的hashCode返回值不一定不等,但是给不同的对象产生截然不同的整数结果,能提高散列表的性能。


具体实例

如果一个类覆盖了equals覆盖了equals函数,却没有覆盖hashCode会违反上述第二条原则。下面看一下没有重载hashCode的例子:

public class PhoneNumber {
    private final int areaCode;
    private final int prefix;
    private final int lineNumber;

    public PhoneNumber(int areaCode, int prefix, int lineNumber) {
        rangeCheck(areaCode, 999, "area code");
        rangeCheck(prefix, 999, "prefix");
        rangeCheck(lineNumber, 9999, "line number");
        this.areaCode = areaCode;
        this.prefix = prefix;
        this.lineNumber = lineNumber;
    }

    private static void rangeCheck(int arg, int max, String name) {
        if(arg < 0 || arg > max) {
            throw new IllegalArgumentException(name + ": " + arg);

        }
    }

    @Override
    public boolean equals(Object o) {
        if(o == this)
            return true;
        if(!(o instanceof PhoneNumber))
            return false;
        PhoneNumber pn = (PhoneNumber)o;
        return pn.lineNumber == lineNumber
                && pn.prefix == prefix
                && pn.areaCode == areaCode;
    }

}

执行如下代码:

Map<PhoneNumber, String> map = new HashMap<PhoneNumber, String>();
map.put(new PhoneNumber(707, 867, 5309), "Jenny");
System.out.println(map.get(new PhoneNumber(707, 867, 5309)));

我们期望它返回Jenny,然而它返回的是null。

原因在于违反了hashCode的约定,由于PhoneNumber没有覆盖hashCode方法,导致两个相等的实例拥有不相等的散列码,put方法把电话号码对象放在一个散列桶中,get方法从另外一个散列桶中查找这个电话号码的所有者,显然是无法找到的

只要覆盖hashCode并遵守约定,就能修正这个问题。

 

一个好的散列函数倾向于“为不相等的对象产生不相等的散列码”,下面有简单的解决办法:

1.把某个非零的常数值,如17,保存在一个名为result的int类型的变量中。(为了2.a中计算的散列值为0的初始域会影响到散列值)

2.对于对象中的每个关键域f,完成一下步骤:

 a.为该域计算int类型的散列码c

  i.如果该域是boolean,计算(f ? 1:0)

  ii.如果该域是byte、char、short或者int类型,则计算(int)f

  iii.如果该域是long,则计算(int)(f ^ (f >>> 32))

  iv.如果该域是float,则计算Float.floatToIntBits(f)

  v.如果该域是double,则计算Double.doubleToLongBits(f),然后

  vi.如果该域是一个对象引用,并且该类的equals方法通过递归地调用equals的方式来比较这个域,则同样为这个域递归地调用hashCode。如果需要更复杂的比较,则为这个域计算一个“范式”,然后针对这个“范式”调用hashCode。如果域的值为null,则返回0(或其他某个常数,但通常为0)。

  vii.如果该域是一个数组,则要吧每一个元素当做单独的域来处理,也就是要递归地应用上述规则,对每个重要的元素计算一个散列码,然后根据2.b把这些散列值组合起来。如果数组域中的每个元素都很重要,可以使用1.5中增加的其中一个Array.hashCode方法。

 b.按照下面的公式,把步骤2.a中计算得到的散列码c合并到result中:

  result = 31 * result + c。(选择31是因为它是一个奇素数,如果乘数是偶数,乘法溢出时会丢失信息,VM可以优化 31 * i == (i << 5) - i)

3.返回result。

编写完hashCode方法后,编写单元测试来验证相同的实例是否有相等的散列码。

把上面的解决方法应用到PhoneNumber类中:

@Override
public int hashCode() {
    int result = 17;
    result = 31 * result + areaCode;
    result = 31 * result + prefix;
    result = 31 * result + lineNumber;
    return result;
}

现在使用之前的测试代码,发现能够返回Jenny了。

 

posted @ 2019-06-07 16:55  NeilZhang  阅读(1717)  评论(0编辑  收藏  举报