hashcode 和 equals

https://www.cnblogs.com/Qian123/p/5703507.html#_label0

hashCode是jdk根据对象的地址或者字符串或者数字算出来的int类型的数值详细了解请参考 public int hashCode()返回该对象的哈希码值。支持此方法是为了提高哈希表（例如 java.util.Hashtable 提供的哈希表）的性能。

一致性

Java对象的eqauls方法和hashCode方法是这样规定的：

1、相等（相同）的对象必须具有相等的哈希码（或者散列码）。

2、如果两个对象的hashCode相同，它们并不一定相同。

在 Java 应用程序执行期间，在对同一对象多次调用 hashCode 方法时，必须一致地返回相同的整数，前提是将对象进行hashcode比较时所用的信息没有被修改。

equals 比较使用的是对象在内存中的地址，hashCode 根据hash算法计算出一个整数。

要求是：

equals 相等的，调用hashCode结果一定相等。不然Set的唯一性就不能保证了。以为Set是先用hash进行判断的。

hashCode结果相等，equals 不一定相等。equals不等的，并不要求 hashCode 结果也不等。所以说，equals的默认比较和hashCode没关系。

重写

如果equals重写了hashCode也要重写，因为如果说一个对象比较 id是否相同作为新的 equals。那么两个在内存中不同的对象，equals的结果也会是true，

如果继续使用原来的hashCode，他们的hashCode是不同的，由于Set先用 hashCode 判断，那这两个数据就能被存到同一个Set中，与我们的业务期待不符合。

所以hashCode必须重写。而且重写也要按照hash算法重写，不然Set本身通过hash提高性能的初衷就没有实现，Set效率会非常低下。

这时hashCode通过什么样的hash算法重写就看个人水平了，还是要选择优秀的hash算法。

public int hashCode(){  
   return 1; //等价于hashcode无效  
}

就是说，实际上对象是否相等还是用equals来判断的，在判断前加上 hashCode 这一步是为了提高效率。因为有了这一步，所以 hashCode和equals的关系变得亲密了。

虽然没有要求equals不等，hashcode必须不等，但是实际情况中大量的验证发现，hashCode能够保持 equals不等hashCode不等。

在object类中，hashCode定义如下：

public native int hashCode();

想要弄明白hashCode的作用，必须要先知道Java中的集合。　　
       总的来说，Java中的集合（Collection）有两类，一类是List，再有一类是Set。前者集合内的元素是有序的，元素可以重复；后者元素无序，但元素不可重复。这里就引出一个问题：要想保证元素不重复，可两个元素是否重复应该依据什么来判断呢？
        这就是Object.equals方法了。但是，如果每增加一个元素就检查一次，那么当元素很多时，后添加到集合中的元素比较的次数就非常多了。也就是说，如果集合中现在已经有1000个元素，那么第1001个元素加入集合时，它就要调用1000次equals方法。这显然会大大降低效率。
       于是，Java采用了哈希表的原理。哈希（Hash）实际上是个人名，由于他提出一哈希算法的概念，所以就以他的名字命名了。哈希算法也称为散列算法，是将数据依特定算法直接指定到一个地址上，初学者可以简单理解，hashCode方法实际上返回的就是对象存储的物理地址（实际可能并不是）。
       这样一来，当集合要添加新的元素时，先调用这个元素的hashCode方法，就一下子能定位到它应该放置的物理位置上。如果这个位置上没有元素，它就可以直接存储在这个位置上，不用再进行任何比较了；如果这个位置上已经有元素了，就调用它的equals方法与新元素进行比较，相同的话就不存了，不相同就散列其它的地址。所以这里存在一个冲突解决的问题。这样一来实际调用equals方法的次数就大大降低了，几乎只需要一两次。

posted @ 2019-10-14 09:02 cuiqq 阅读(168) 评论(0) 收藏举报

刷新页面返回顶部

cuiqq

hashcode 和 equals

一致性

重写

公告