摘要:
(1)在分布式系统中,对于某个节点是否还“活着”的探测,通常是设定一个时间的阀值,然后根据接收到的“心跳”信息的间隔,来判定这个节点是否还活着,然后返回一个bool值;但这种做法很容易造成误判:因为你不能确切得知道 究竟是真的是节点挂掉了,还是网络比较“慢”;(2)cassandra里面采用一种可以... 阅读全文
淘宇瀚
做一个好的SRE;任何时候都要有从零开始的勇气;
|
|
|
|