外部服务的隔离及降级
本文的来源是之前的一次生产事故,当时由于某家医院的机房网络故障,造成整个某项业务的全部停止服务,也就是说其它医院虽说与平台的网络畅通,但是由于平台的资源全部被消耗,其它医院也不能再提供给患者提供任何服务。下图是用户、平台及医院的调用关系图:
我最近找了一些公共的开源框架,包扩大概的看了看apache commons和google guava工具包,都没有找到合适的工具,便花了两个晚上的时间,自己实现了一个简单的版本,源码可见于
https://github.com/mantuliu/distributed/tree/master/src/main/java/com/mantu/common/util
其中BusinessLimiter是具体的限流类,核心代码就是tryAcquire() 和release()操作
BusinessLimiterUtil是工具类,可以通过它和调用方的properties文件结合使用,创建多个BusinessLimiter的实例,例如结合上面的业务场景,可以在配置文件中配置每家医院的限流值,当医院一的接口出现故障时,由于对每家医院都使用的限流,因此医院一超出阀值调用被自动丢弃,保证其它医院支付服务的正常进行,从而实现了外部服务的隔离和降级。
使用demo可见于:
https://github.com/mantuliu/distributed/tree/master/src/main/java/com/mantu/common/sample
这个版本的实现还是非常简单的,后续会支持更复杂的情况,对于“坏服务”实现自动降级和摘除节点。