hashCode 和 equals

hashCode 和 equals 方法一样,都是定义在 Object 顶层父类中,子类可以重写

public class Object {
    public native int hashCode();
}

hashCode 方法是 native 方法,如果没有重写,那它通常会将内存地址转换为 int 数值进行返回,

我们用 hashCode() 获取到的这个 int 数值,就是 哈希码,也叫散列码。

哈希码的作用:确定对象在哈希表中的索引位置。

哈希表的基本原理:

现有这么一个需求:小明想让 一批对象能够存储起来,不允许存储重复的对象,并且能够随时获取对象。

​     说起存储我们就想起了数组,我们可以将对象挨个存放在数组中。

​     当判断对象是否存储时,亦或是获取指定的对象,我们每次都要遍历数组,挨个儿用 equals 方法进行比较,返回结果为 true 相当于,找到了指定的对象,返回 false,则可以进行存储,元素不重复。

​     若是有 10000 个对象,我要每次进行操作都要比较 10000 次,此时的时间复杂度 为O(n) 。。。嗯效率确实低。

​     这时 通过hashCode()获得的 哈希码 就派上用场了,我们可以通过哈希码对数组长度取余,这样就能得到数组存放的位置, 比如,哈希码为 17,数组长度是 10 ,17 对 10 取余 为 7,对象存放在下标 7 的位置。

​     这样无论是存储元素,还是获取元素,通过数组下标只用操作一次,此时的时间复杂度为 O(1) 。这就是 哈希码 的作用,确定索引位置,就能大幅度提高效率了。

哈希冲突:

​     还有一个很大的问题,那就是 哈希码可能会重复的,毕竟哈希码只是通过一定的逻辑,计算出来的 int 数值,那两个不同的对象,完全有可能哈希码会相同。这就是我们常说的哈希冲突。

​     当要存储的对象,和已经存储的对象,发生哈希冲突时,我们首先要做的就是,判断这两个对象是否相等,如果相等,则视为重复元素,不存储;若是不相等,形成链表。

​     这就是为什么要同时重写,hashCode 和 equals 方法,hashCode() ,用来确定索引位置,以提高效率的同时,可能会发生哈希冲突,我们就得通过 equals() 来判断冲突的对象是否相等。

​     如果只重写了 hashCode() 方法,那哈希冲突发生时,即使两个对象相等,也不会判定为重复,进而导致哈希表里存放一大堆重复对象; 如果只重写了 equals 方法,那两个相等的对象,内存地址大概率不会相等,通过未重写的hashCode() 返回的哈希码,是不同的,这样还是会造成哈希表中存储一大堆的重复对象。

    所以,最好还是一起重写。

总结:

     hashCode() 用来在最快的时间内,判断两个对象,是否相等,并定位索引位置,可能会出现误差,equals() 用来判断两个对象是否绝对相等,hashCode() 用来保证性能,equals() 方法用来保证可靠,

posted @   走马!  阅读(39)  评论(0编辑  收藏  举报
相关博文:
阅读排行:
· 阿里最新开源QwQ-32B,效果媲美deepseek-r1满血版,部署成本又又又降低了!
· 单线程的Redis速度为什么快?
· SQL Server 2025 AI相关能力初探
· AI编程工具终极对决:字节Trae VS Cursor,谁才是开发者新宠?
· 展开说说关于C#中ORM框架的用法!
点击右上角即可分享
微信分享提示
主题色彩