Java中的hashCode的计算方法与原理
前言
在Java中,每个对象都有一个从Object基类派生出的 hashCode() 方法,用于根据当前对象的某些特征返回一个整型变量。其核心源代码(省略一些类型判断与验证代码)如下所示:
public static int hashCode(byte[] value) { int h = 0; for (byte v : value) { h = 31 * h + (v & 0xff); } return h; }
那么为什么要这么计算,31这个数字是哪来的,本文将从理论和实践层面进行详细说明。
计算公式
为什么是数字31?
由于哈希码(HashCode)的目的是为了区分对象,所以其分布自然是越均匀越好。为了保证分布均匀,一般的方法是使用一些相对大的素质,但是为什么选择了31,而不是 23、29、37 或者直接更大的,如97?
在 《Effective Java》48页,第 3 章 “Always override hashcode when you override equals” 写道[2]:
A nice property of 31 is that the multiplication can be replaced by a shift and a subtraction for better performance: 31 * i == (i << 5) - i. Modern VMs do this sort of optimization automatically.
也就是说 31 * i
可以用 (i << 5) - i
来计算,而移位操作的效率高于乘法,所以这是基于性能角度的考虑。所以31即满足素数的要求,又可以快速计算,所以被使用在对极致性能要求的Java源代码中。
结论
通过源代码,我们可以看到Java对性能有极致的追求,就hashCode的实现代码中,做了两大优化:
1)使用加乘运行代替连续阶乘运算以提高效率;
2)使用可以用位左移操作计算的31代替其他运算。
转载:https://blog.csdn.net/weixin_43145361/article/details/105904810