熔断器Hystrix(Spring Cloud Netflix)
一、Hystrix是什么
雪崩效应
在微服务架构中通常会有多个服务层调用,基础服务的故障可能会导致级联故障,进而造成整个系统不可用的情况,这种现象被称为服务雪崩效应。服务雪崩效应是一种因“服务提供者”的不可用导致“服务消费者”的不可用,并将不可用逐渐放大的过程。
如果下图所示:A作为服务提供者,B为A的服务消费者,C和D是B的服务消费者。A不可用引起了B的不可用,并将不可用像滚雪球一样放大到C和D时,雪崩效应就形成了。
熔断器(CircuitBreaker)
熔断器的原理很简单,如同电力过载保护器。它可以实现快速失败,如果它在一段时间内侦测到许多类似的错误,会强迫其以后的多个调用快速失败,不再访问远程服务器,从而防止应用程序不断地尝试执行可能会失败的操作,使得应用程序继续执行而不用等待修正错误,或者浪费CPU时间去等到长时间的超时产生。熔断器也可以使应用程序能够诊断错误是否已经修正,如果已经修正,应用程序会再次尝试调用操作。
熔断器模式就像是那些容易导致错误的操作的一种代理。这种代理能够记录最近调用发生错误的次数,然后决定使用允许操作继续,或者立即返回错误。 熔断器开关相互转换的逻辑如下图:
熔断器就是保护服务高可用的最后一道防线。
Hystrix特性
断路器机制
断路器很好理解, 当Hystrix Command请求后端服务失败数量超过一定比例(默认50%), 断路器会切换到开路状态(Open). 这时所有请求会直接失败而不会发送到后端服务. 断路器保持在开路状态一段时间后(默认5秒), 自动切换到半开路状态(HALF-OPEN). 这时会判断下一次请求的返回情况, 如果请求成功, 断路器切回闭路状态(CLOSED), 否则重新切换到开路状态(OPEN). Hystrix的断路器就像我们家庭电路中的保险丝, 一旦后端服务不可用, 断路器会直接切断请求链, 避免发送大量无效请求影响系统吞吐量, 并且断路器有自我检测并恢复的能力。
Fallback
Fallback相当于是降级操作. 对于查询操作, 我们可以实现一个fallback方法, 当请求后端服务出现异常的时候, 可以使用fallback方法返回的值. fallback方法的返回值一般是设置的默认值或者来自缓存.
资源隔离
在Hystrix中, 主要通过线程池来实现资源隔离. 通常在使用的时候我们会根据调用的远程服务划分出多个线程池. 例如调用产品服务的Command放入A线程池, 调用账户服务的Command放入B线程池. 这样做的主要优点是运行环境被隔离开了. 这样就算调用服务的代码存在bug或者由于其他原因导致自己所在线程池被耗尽时, 不会对系统的其他服务造成影响. 但是带来的代价就是维护多个线程池会对系统带来额外的性能开销. 如果是对性能有严格要求而且确信自己调用服务的客户端代码不会出问题的话, 可以使用Hystrix的信号模式(Semaphores)来隔离资源。
二、SpringCloud如何使用Hystrix
提示:熔断只是作用在服务调用这一端。
非Feign使用Hystrix
引入依赖
<dependency> <groupId>org.springframework.cloud</groupId> <artifactId>spring-cloud-starter-netflix-hystrix</artifactId> </dependency>
添加注解
在启动类上添加@EnableHystrix注解开启Hystrix
@HystrixCommand(fallbackMethod = "方法名")进行注解实现熔断
@RestController @RequestMapping("/api/v1/order") public class OrderController { @Autowired private OrderService orderService; @Autowired private StringRedisTemplate redisTemplate; @RequestMapping("saveforribbon") @HystrixCommand(fallbackMethod = "saveOrderFail") public Object saveforRibbon(@RequestParam("user_id") int userId,@RequestParam("product_id") int productId){ return this.orderService.saveForRibbon(userId,productId); } @RequestMapping("saveforfeign") @HystrixCommand(fallbackMethod = "saveOrderFail") public Object saveforFeign(@RequestParam("user_id") int userId,@RequestParam("product_id") int productId){ return this.orderService.saveForFeign(userId,productId); } // 方法参数签名必须与api一致 private Object saveOrderFail(int userId, int productId){ // 监控报警机制 new Thread(()->{ String saveOrderKey = "save-order"; String sendValue = redisTemplate.opsForValue().get(saveOrderKey); if(StringUtils.isBlank(sendValue)){ // 发送警告消息 System.out.println("紧急消息,用户下单失败,请尽快处理查找原因."); redisTemplate.opsForValue().set(saveOrderKey, "save-order-fali", 30, TimeUnit.SECONDS); } else { System.out.println("已经发送消息,30秒内不可重复发送。"); } }).start(); Map<String,Object> fallbackResponse = new HashMap(); fallbackResponse.put("code", -100); fallbackResponse.put("msg","请求人数过多,请稍后再试。"); return fallbackResponse; } }
断路器监控
(1)引入依赖
<dependency> <groupId>org.springframework.cloud</groupId> <artifactId>spring-cloud-starter-netflix-hystrix-dashboard</artifactId> </dependency>
SpringBoot 2.x以上,需要添加以下依赖,否则会报错:
dependency> <groupId>com.netflix.hystrix</groupId> <artifactId>hystrix-javanica</artifactId> <version>1.5.12</version> </dependency>
(2)在启动类上添加@EnableHystrixDashboard注解。
(3)在配置文件application.yml中,添加如下内容:
management: security: false endpoints: web: exposure: include: hystrix.stream base-path: /
(4)在浏览器中输入:http://localhost:8091/hystrix,显示如下界面:
然后,在该界面Hystrix Dashboard下面的输入框中输入:http://localhost:8091/hystrix.stream,会跳转到下面的页面:
一直显示loading,直到你发出请求,比如通过postman发送Post请求,请求Url为http://localhost:8091/,成功后,会看到监控信息。
Feign中使用断路器
Feign是自带断路器的,在D版本的Spring Cloud之后,它没有默认打开。需要在配置文件中配置打开它,在配置文件加以下代码:
#feign组件的配置 feign: #默认是关闭的 hystrix: enabled: true client: config: default: connectTimeOut: 2000 readTimeOut: 2000
(1)必须引入feign依赖
<dependency> <groupId>org.springframework.cloud</groupId> <artifactId>spring-cloud-starter-openfeign</artifactId> </dependency>
(2)在启动类上添加@EnableFeignClients注解开启Spring Cloud Feign的支持功能
@EnableEurekaClient @SpringBootApplication @EnableFeignClients(basePackages = { "com.kyle.client.feign.inter" }) public class Application { public static void main(String[] args) { SpringApplication.run(Application.class, args); } }
(3)定义HelloServiceFeign,接口@FeignClient注解指定服务名来绑定服务,然后再使用Spring MVC的注解来绑定具体该服务提供的REST接口。
@FeignClient(value = "hello-service-provider") public interface HelloServiceFeign { @RequestMapping(value = "/demo/getHost", method = RequestMethod.GET) public String getHost(String name); @RequestMapping(value = "/demo/postPerson", method = RequestMethod.POST, produces = "application/json; charset=UTF-8") public Person postPerson(String name); }
注意:这里服务名不区分大小写,所以使用hello-service-provider和HELLO-SERVICE-PROVIDER都是可以的。
@RestController public class RestClientController { @Autowired private HelloServiceFeign client; /** * @param name * @return Person * @Description: 测试服务提供者post接口 */ @RequestMapping(value = "/client/postPerson", method = RequestMethod.POST, produces = "application/json; charset=UTF-8") public Person postPerson(String name) { return client.postPerson(name); } /** * @param name * @return String * @Description: 测试服务提供者get接口 */ @RequestMapping(value = "/client/getHost", method = RequestMethod.GET) public String getHost(String name) { return client.getHost(name); } }
三、有其他替代方案吗?
resilience4j
resilience4j, 这个框架是是为Java 8 和 函数式编程设计的一个轻量级的容错框架,该框架充分利用函数式编程的概念,为函数式接口、lamda表达式、方法引用高阶函数进行包装,(本质上是装饰者模式的概念),通过包装实现断路、限流、重试、舱壁功能。
这个框架整体而言比较轻量,没有控制台,不太好做系统级监控。
Alibaba Sentinel
Sentinel 是 阿里巴巴开源的轻量级的流量控制、熔断降级 Java 库,该库的核心是使用的是信号量隔离的方式做流量控制和熔断,其优点是其集成性和易用性,几乎能和当前主流的Spring Cloud, dubbo ,grpc ,nacos, zookeeper做集成。