项长老

  博客园 :: 首页 :: 博问 :: 闪存 :: 新随笔 :: 联系 :: 订阅 订阅 :: 管理 ::

好的HASH函数需要把原始数据均匀地分布到HASH数组里

原始数据不大会是真正的随机的,可能有某些规律,

比如大部分是偶数,这时候如果HASH数组容量是偶数,容易使原始数据HASH后不会均匀分布。
比如 2 4 6 8 10 12这6个数,如果对 6 取余 得到 2 4 0 2 4 0 只会得到3种HASH值,冲突会很多
如果对 7 取余 得到 2 4 6 1 3 5 得到6种HASH值,没有冲突

同样地,如果数据都是3的倍数,而HASH数组容量是3的倍数,HASH后也容易有冲突
用一个质数则会减少冲突的概率

 

参考

http://www.xuebuyuan.com/2177964.html

http://www.vvbin.com/?p=376

posted on 2016-04-02 17:53  项长老  阅读(455)  评论(0编辑  收藏  举报