Notes:一致性哈希算法
业务场景:
存在三个专门提供缓存服务的服务器,前端所需要的图片等静态资源被缓存于这三个服务器其中之一。
但是如何提高查找图片的速度呢?
可以采用哈希算法。
常规意义上的哈希算法:
通过hash(图片名称)%N的方式寻找到存储于服务器的编号,N代表服务器台数,这样就能很快定位到图片存储的服务器。
但是有一种不足是,当这些缓存服务器其中之一死机了,那么一般需要转变哈希算法为hash(图片名称)%(N-1),但这样会使所有缓存服务器上存储的图片资源全部错位而失效,例如原来根据哈希算法计算出来的"test3.jpg"的缓存服务器编号为1,现在变为2了,但是去2号服务器上找却没有找到对应的资源,所以会向后端请求该图片资源,一旦这样的次数增多,后端服务器的压力就会巨大,很可能会GG;
现在一致性哈希算法可以解决这种问题。
一致性哈希算法是通过:
1.采用hash("服务器IP地址")%2^32来计算服务器对应的编号值
2.采用hash("图片名称")%2^32来计算图片资源对应的哈希地址值
服务器编号值和哈希地址值都是0-2^32这一范围中的数据值,一般会有一个控制器专门计算图片的哈希地址值然后选择正向最接近的一个服务器编号值的对应服务器进行缓存资源请求,这些编号值的分布可以视为一个Hash环,将这一范围的数值分布看成时钟上数值的分布。
而像一般哈希算法的那种情况,采用一致性哈希算法(因为始终没有改变哈希算法)不会导致全部缓存服务器上的资源错位,失去意义,所以自然避免了临时的大量后端请求,保护了后端服务器的安全。
避免缓存图片请求全部集中于一个缓存服务器,可以采用虚拟节点的方式来使缓存服务器在环中均匀分布,道理很简单,就是将Hash环中均衡点的哈希值设置为某一缓存服务器的服务器编号。