一致性哈希算法

一致哈希算法 Consistent Hashing

标签（空格分隔）： Java基础

有三台缓存服务器sever1,server2,server3,如何读写呢？有如下方法

每次请求随机发送到一台缓存服务器,策略简单但是会导致问题：

解决相同key访问发送到同一服务器的常用方法->计算哈希。如下

server=Hash(key)%3

这样会解决随机访问导致的问题。但是有产生了新的问题：

分布式系统每个节点都可能失效，在节点失效或者加入新节点后，如何把对数据的影响降到最低？在分布式缓存中，如果没有好的算法，某个节点失效或者加入新节点后，会对当前缓存的命中率产生巨大的影响。
传统Hash也不是最优解,更好的算法呼之欲出。

定义：一致性哈希将整个哈希值空间组织成一个虚拟的圆环，如假设某哈希函数H的值空间为0~\(2^{32}\)-1（即哈希值是一个32位无符号整形），如何将一个key，映射到一个节点，这里分为两步.

上图摘自语雀
当减少或者增加一个节点时，只对顺时针方向第一个原有节点的数据有影响，其他节点不变

当节点比较少时，这个算法还是存在数据分布不均匀的情况，这时候可以引入虚拟节点。在原有的基础上多一步由虚拟节点映射到实际节点的步骤即可让少量节点也能满足均匀性。

"虚拟节点"的 hash 计算可以采用对应节点的 IP 地址加数字后缀的方式。例如假设 cache A 的 IP 地址为202.168.14.241 。

引入“虚拟节点”前，计算 cache A 的 hash 值：
Hash(“202.168.14.241”);
引入“虚拟节点”后，计算“虚拟节”点 cache A1 和 cache A2 的 hash 值：

Hash(“202.168.14.241#1”); // cache A1
Hash(“202.168.14.241#2”); // cache A2

没有搞懂为何选这个数字,有人说是一个无符号int,此问题待定...

posted @ 2020-01-07 16:33 往霄龙阅读(268) 评论(0) 收藏举报

刷新页面返回顶部