好的HASH函数需要把原始数据均匀地分布到HASH数组里
原始数据不大会是真正的随机的,可能有某些规律,
比如大部分是偶数,这时候如果HASH数组容量是偶数,容易使原始数据HASH后不会均匀分布。
比如 2 4 6 8 10 12这6个数,如果对 6 取余 得到 2 4 0 2 4 0 只会得到3种HASH值,冲突会很多
如果对 7 取余 得到 2 4 6 1 3 5 得到6种HASH值,没有冲突
同样地,如果数据都是3的倍数,而HASH数组容量是3的倍数,HASH后也容易有冲突
用一个质数则会减少冲突的概率
参考
http://www.xuebuyuan.com/2177964.html
http://www.vvbin.com/?p=376