hashcode 和 equals
https://www.cnblogs.com/Qian123/p/5703507.html#_label0
hashCode是jdk根据对象的地址或者字符串或者数字算出来的int类型的数值 详细了解请 参考 public int hashCode()返回该对象的哈希码值。支持此方法是为了提高哈希表(例如 java.util.Hashtable 提供的哈希表)的性能。
一致性
Java对象的eqauls方法和hashCode方法是这样规定的:
1、相等(相同)的对象必须具有相等的哈希码(或者散列码)。
2、如果两个对象的hashCode相同,它们并不一定相同。
重写
如果equals重写了hashCode也要重写,因为 如果说 一个对象比较 id是否相同作为新的 equals。那么两个在内存中不同的对象,equals的结果也会是true,
如果继续使用原来的hashCode,他们的hashCode是不同的,由于Set先用 hashCode 判断,那这两个数据就能被存到同一个Set中,与我们的业务期待不符合。
所以hashCode必须重写。而且重写也要按照hash算法重写,不然Set本身通过hash提高性能的初衷就没有实现,Set效率会非常低下。
这时hashCode通过什么样的hash算法重写就看个人水平了,还是要选择优秀的hash算法。
public int hashCode(){ return 1; //等价于hashcode无效 }
就是说,实际上对象是否相等还是用equals来判断的,在判断前加上 hashCode 这一步是为了提高效率。因为有了这一步,所以 hashCode和equals的关系变得亲密了。
在object类中,hashCode定义如下:
public native int hashCode();
想要弄明白hashCode的作用,必须要先知道Java中的集合。
总的来说,Java中的集合(Collection)有两类,一类是List,再有一类是Set。前者集合内的元素是有序的,元素可以重复;后者元素无序,但元素不可重复。这里就引出一个问题:要想保证元素不重复,可两个元素是否重复应该依据什么来判断呢?
这就是Object.equals方法了。但是,如果每增加一个元素就检查一次,那么当元素很多时,后添加到集合中的元素比较的次数就非常多了。也就是说,如果集合中现在已经有1000个元素,那么第1001个元素加入集合时,它就要调用1000次equals方法。这显然会大大降低效率。
于是,Java采用了哈希表的原理。哈希(Hash)实际上是个人名,由于他提出一哈希算法的概念,所以就以他的名字命名了。哈希算法也称为散列算法,是将数据依特定算法直接指定到一个地址上,初学者可以简单理解,hashCode方法实际上返回的就是对象存储的物理地址(实际可能并不是)。
这样一来,当集合要添加新的元素时,先调用这个元素的hashCode方法,就一下子能定位到它应该放置的物理位置上。如果这个位置上没有元素,它就可以直接存储在这个位置上,不用再进行任何比较了;如果这个位置上已经有元素了,就调用它的equals方法与新元素进行比较,相同的话就不存了,不相同就散列其它的地址。所以这里存在一个冲突解决的问题。这样一来实际调用equals方法的次数就大大降低了,几乎只需要一两次。