redis分布式锁超时事故
redis分布式锁有两层超时:
1 锁等待超时
2 tcp connection超时
任一个超时未设置,都有可能造成阻塞
事故如下:
*disruptor采用阻塞模式,到最大消息池时即阻塞,导致线程阻塞
左下角,获取redis锁虽然使用了trylock立即返回,但是没想到,由于断网,redis客户端在tcp层阻塞了,且未设置超时,阻塞随着阻塞链传递到无界的single线程池,最终导致oom
解决方案:
1 redis部署内网,并在tcp redis锁2个层面设置超时
2 线程池设置为有界,且配置放弃策略,这个方案虽然保障了jvm,但会有业务上的遗漏,比如行情到了,应该成交了,确被放弃了