Java中的hashCode的计算方法与原理

前言

在Java中,每个对象都有一个从Object基类派生出的 hashCode() 方法,用于根据当前对象的某些特征返回一个整型变量。其核心源代码(省略一些类型判断与验证代码)如下所示:

public static int hashCode(byte[] value) {
    int h = 0;
    for (byte v : value) {
        h = 31 * h + (v & 0xff);
    }
    return h;
}

那么为什么要这么计算,31这个数字是哪来的,本文将从理论和实践层面进行详细说明。

计算公式

 

 

为什么是数字31?

由于哈希码(HashCode)的目的是为了区分对象,所以其分布自然是越均匀越好。为了保证分布均匀,一般的方法是使用一些相对大的素质,但是为什么选择了31,而不是 23、29、37 或者直接更大的,如97?

在 《Effective Java》48页,第 3 章 “Always override hashcode when you override equals” 写道[2]:

A nice property of 31 is that the multiplication can be replaced by a shift and a subtraction for better performance: 31 * i == (i << 5) - i. Modern VMs do this sort of optimization automatically.

 

也就是说 31 * i 可以用 (i << 5) - i 来计算,而移位操作的效率高于乘法,所以这是基于性能角度的考虑。所以31即满足素数的要求,又可以快速计算,所以被使用在对极致性能要求的Java源代码中。

结论

通过源代码,我们可以看到Java对性能有极致的追求,就hashCode的实现代码中,做了两大优化:
1)使用加乘运行代替连续阶乘运算以提高效率;
2)使用可以用位左移操作计算的31代替其他运算。

转载:https://blog.csdn.net/weixin_43145361/article/details/105904810

 

 

posted @ 2022-04-14 16:10  迷走神经  阅读(883)  评论(0编辑  收藏  举报