使用String的HashCode作为Map主键需要注意的地方
最近在公司做一个学位分配的算法,里面大多数都是在比较数据,于是首先想到了对两个集合转换成Map后进行主键比对。
于是乎就有了一个引用类里面包含了两个String类型的字段来做主键,这个类我复写了hashCode方法与equals。
但是在算法写完之后,发现里面的数据对比有问题,出现了Map内容丢失问题,
后来想到String的HashCode可能有重复的可能,于
是来网上搜索一把,看到各位大神的笔记,于是就记一下,防止以后再犯错误。。。
String.hashCode()方法的算法如下:str.charAt(0) * 31n-1 + str.charAt(1) * 31n-2 + ... + str.charAt(n-1)
据说算法中31这个数字是对英文字符进行优化后产生的一个最佳数字,
但是碰上字母大小写或是一些特殊字符,再或者是中文字符,它就不灵了,很容易重复,
举个例子:
"Aa" = 'A' * 31 + 'a' = 2112
"BB" = 'B' * 31 + 'B' = 2112
如果必须要使用String类型的HashCode,在字符串多的情况下,建议扩大HashCode算法的范围,将重复率减小。