微服务Spring Cloud17_熔断器Hystrix7

一、简介

 Hystrix 在英文里面的意思是豪猪,它的logo看下面的图是一头豪猪,它在微服务系统中是一款提供保护机制的组件,和eureka一样也是由netflix公司开发。

 主页:https://github.com/Netflix/Hystrix/ 

  

 那么Hystrix的作用是什么呢?具体要保护什么呢?

 Hystrix是Netflix开源的一个延迟和容错库,用于隔离访问远程服务、第三方库,防止出现级联失败

二、雪崩问题

 微服务中,服务间调用关系错综复杂,一个请求,可能需要调用多个微服务接口才能实现,会形成非常复杂的调用链路:

  

 如图,一次业务请求,需要调用A、P、H、I四个服务,这四个服务又可能调用其它服务。

 如果此时,某个服务出现异常:

  

 例如: 微服务I发生异常,请求阻塞,用户请求就不会得到响应,则tomcat的这个线程不会释放,于是越来越多的用户请求到来,越来越多的线程会阻塞:

  

 服务器支持的线程和并发数有限,请求一直阻塞,会导致服务器资源耗尽,从而导致所有其它服务都不可用,形成雪崩效应。

 这就好比,一个汽车生产线,生产不同的汽车,需要使用不同的零件,如果某个零件因为种种原因无法使用,那么就 会造成整台车无法装配,陷入等待零件的状态,直到零件到位,才能继续组装。此时如果有很多个车型都需要这个零件,那么整个工厂都将陷入等待的状态,导致所有生产都陷入瘫痪。一个零件的波及范围不断扩大。  

 Hystrix解决雪崩问题的手段主要是服务降级,包括:

  • 线程隔离:用户请求不直接访问服务,而是使用线程池中空闲的线程访问服务,加速失败判断时间
  • 服务熔断:及时返回服务调用失败的结果,让线程不因为等待服务而阻塞。

三、线程隔离&服务降级   

 1、原理

  线程隔离示意图:

   

  解读:

    • Hystrix为每个依赖服务调用分配一个小的线程池,如果线程池已满调用将被立即拒绝,默认不采用排队,加速失败判定时间
    • 用户的请求将不再直接访问服务,而是通过线程池中的空闲线程来访问服务,如果线程池已满,或者请求超时,则会进行降级处理,什么是服务降级?

        服务降级:优先保证核心服务,而非核心服务不可用或弱可用。

  用户的请求故障时,不会被阻塞,更不会无休止的等待或者看到系统崩溃,至少可以看到一个执行结果(例如返回友好的提示信息) 。

  服务降级虽然会导致请求失败,但是不会导致阻塞,而且最多会影响这个依赖服务对应的线程池中的资源,对其它服务没有响应。

  触发Hystrix服务降级的情况:

    • 线程池已满
    • 请求超时 

  配置步骤:

    • 添加依赖
<dependency>
    <groupId>org.springframework.cloud</groupId>
    <artifactId>spring-cloud-starter-netflix-hystrix</artifactId>
</dependency>
    • 开启熔断

      

    • 降级逻辑
@RestController
@RequestMapping("/consumer")
@Slf4j
@DefaultProperties(defaultFallback = "defaultFallback")
public class ConsumerController {

    @Autowired
    private RestTemplate restTemplate;

    @Autowired
    private DiscoveryClient discoveryClient;

    @GetMapping("/{id}")
//    @HystrixCommand(fallbackMethod = "queryByIdFallback")
    @HystrixCommand
//    public User queryById(@PathVariable Long id){
    public String queryById(@PathVariable Long id){
        /*String url="http://localhost:9091/user/"+id;
        List<ServiceInstance> serviceInstanceList = discoveryClient.getInstances("user-service");
        ServiceInstance serviceInstance = serviceInstanceList.get(0);
        url="http://"+serviceInstance.getHost()+":"+serviceInstance.getPort()+"/user/"+id;*/
        String url="http://user-service/user/"+id;
        return restTemplate.getForObject(url,String.class);

    }

    public String queryByIdFallback(Long id){
        log.error("查询用户信息失败。id:{}", id);
        return "对不起,网络太拥挤了!";
    }

    public String defaultFallback(){
        return "默认提示:对不起,网络太拥挤了!";
    }
}
    • 修改超时配置
hystrix:
  command:
    default:
      execution:
        isolation:
          thread:
            timeoutInMilliseconds: 2000

 2、动手实践

  1)引入依赖

   在 consumer-demo 消费端系统的pom.xml文件添加如下依赖:

<dependency>
    <groupId>org.springframework.cloud</groupId>
    <artifactId>spring-cloud-starter-netflix-hystrix</artifactId>
</dependency>

  2)开启熔断

   在启动类 ConsumerApplication 上添加注解:@EnableCircuitBreaker

@SpringBootApplication
@EnableDiscoveryClient
@EnableCircuitBreaker
public class ConsumerApplication {
 // ...
}

  可以看到,我们类上的注解越来越多,在微服务中,经常会引入上面的三个注解,于是Spring就提供了一个组合注 解:@SpringCloudApplication

   

  因此,我们可以使用这个组合注解来代替之前的3个注解。 

@SpringCloudApplication
public class ConsumerApplication {
    // ...
}

  3)编写降级逻辑

   当目标服务的调用出现故障,我们希望快速失败,给用户一个友好提示。因此需要提前编写好失败时的降级处理逻 辑,要使用HystrixCommand来完成。

    改造 consumer-demo\src\main\java\com\itheima\consumer\controller\ConsumerController.java 处理器类,如下: 

package com.itheima.consumer.controller;
import com.itheima.consumer.pojo.User;
import com.netflix.hystrix.contrib.javanica.annotation.HystrixCommand;
import lombok.extern.slf4j.Slf4j;
import org.springframework.beans.factory.annotation.Autowired;
import org.springframework.cloud.client.ServiceInstance;
import org.springframework.cloud.client.discovery.DiscoveryClient;
import org.springframework.web.bind.annotation.GetMapping;
import org.springframework.web.bind.annotation.PathVariable;
import org.springframework.web.bind.annotation.RequestMapping;
import org.springframework.web.bind.annotation.RestController;
import org.springframework.web.client.RestTemplate;
import java.util.List;
@RestController @RequestMapping(
"/consumer") @Slf4j public class ConsumerController {    @Autowired    private RestTemplate restTemplate;    @Autowired    private DiscoveryClient discoveryClient;    @GetMapping("{id}")    @HystrixCommand(fallbackMethod = "queryByIdFallback")    public String queryById(@PathVariable Long id){        String url = "http://localhost:9091/user/" + id;        //获取eureka中注册的user-service实例列表        /*List<ServiceInstance> serviceInstanceList = discoveryClient.getInstances("user-service");        ServiceInstance serviceInstance = serviceInstanceList.get(0);        url = "http://" + serviceInstance.getHost() + ":" + serviceInstance.getPort() + "/user/" + id;*/        url = "http://user-service/user/" + id;        return restTemplate.getForObject(url, String.class);   }    public String queryByIdFallback(Long id){        log.error("查询用户信息失败。id:{}", id);        return "对不起,网络太拥挤了!";   } }

   要注意:熔断的降级逻辑方法必须跟正常逻辑方法保证:相同的参数列表和返回值声明

   失败逻辑中返回User对象没有太大意义,一般会返回友好提示。所以把queryById的方法改造为返回String, 反正也是Json数据。这样失败逻辑中返回一个错误说明,会比较方便。

   说明:

    • @HystrixCommand(fallbackMethod = "queryByIdFallBack"):用来声明一个降级逻辑的方法

   测试: 当 user-service 正常提供服务时,访问与以前一致。但是当将 user-service 停机时,会发现页面返回了降级处理信息:

    

  4)默认的Fallback

   刚才把fallback写在了某个业务方法上,如果这样的方法很多,那岂不是要写很多。所以可以把Fallback配置加在类上,实现默认fallback;

   再次改造 consumer-demo\src\main\java\com\itheima\consumer\controller\ConsumerController.java

package com.itheima.consumer.controller;
import com.itheima.consumer.pojo.User;
import com.netflix.hystrix.contrib.javanica.annotation.DefaultProperties;
import com.netflix.hystrix.contrib.javanica.annotation.HystrixCommand;
import lombok.extern.slf4j.Slf4j;
import org.springframework.beans.factory.annotation.Autowired;
import org.springframework.cloud.client.ServiceInstance;
import org.springframework.cloud.client.discovery.DiscoveryClient;
import org.springframework.web.bind.annotation.GetMapping;
import org.springframework.web.bind.annotation.PathVariable;
import org.springframework.web.bind.annotation.RequestMapping;
import org.springframework.web.bind.annotation.RestController;
import org.springframework.web.client.RestTemplate;
import java.util.List;
@RestController @RequestMapping(
"/consumer") @Slf4j @DefaultProperties(defaultFallback = "defaultFallback") public class ConsumerController {    @Autowired    private RestTemplate restTemplate;    @Autowired    private DiscoveryClient discoveryClient;    @GetMapping("{id}")    //@HystrixCommand(fallbackMethod = "queryByIdFallback")    @HystrixCommand    public String queryById(@PathVariable Long id){        String url = "http://localhost:9091/user/" + id;        //获取eureka中注册的user-service实例列表        /*List<ServiceInstance> serviceInstanceList = discoveryClient.getInstances("user-service");        ServiceInstance serviceInstance = serviceInstanceList.get(0);        url = "http://" + serviceInstance.getHost() + ":" + serviceInstance.getPort() + "/user/" + id;*/        url = "http://user-service/user/" + id;        return restTemplate.getForObject(url, String.class);   }    public String queryByIdFallback(Long id){        log.error("查询用户信息失败。id:{}", id);        return "对不起,网络太拥挤了!";   }    public String defaultFallback(){        return "默认提示:对不起,网络太拥挤了!";   } }
    • @DefaultProperties(defaultFallback = "defaultFallBack"):在类上指明统一的失败降级方法;该类中所有方法返回类型要与处理失败的方法的返回类型一致。 

      

  5)超时设置

   在之前的案例中,请求在超过1秒后都会返回错误信息,这是因为Hystrix的默认超时时长为1,我们可以通过配置修改这个值;

   修改 consumer-demo\src\main\resources\application.yml 添加如下配置:

hystrix:
 command:
   default:
     execution:
       isolation:
         thread:
           timeoutInMilliseconds: 2000

   这个配置会作用于全局所有方法。为了方便复制到yml配置文件中,可以复制 hystrix.command.default.execution.isolation.thread.timeoutInMilliseconds=2000 到yml文件中会自动格式化后再进行修改。  

   为了触发超时,可以在 user-service\src\main\java\com\itheima\user\service\UserService.java 的方法中休眠2秒; 

@Service
public class UserService {
    @Autowired
    private UserMapper userMapper;
    public User queryById(Long id) {
        try {
            Thread.sleep(2000);
       } catch (InterruptedException e) {
            e.printStackTrace();
       }
        return userMapper.selectByPrimaryKey(id);
   }
}

   测试:   

    

    可以发现,请求的时长已经到了2s+,证明配置生效了。如果把修改时间修改到2秒以下,又可以正常访问。 

四、服务熔断  

 1、熔断原理

   在服务熔断中,使用的熔断器,也叫断路器,其英文单词为:Circuit Breaker

   熔断机制与家里使用的电路熔断原理类似;当如果电路发生短路的时候能立刻熔断电路,避免发生灾难。在分布式系统中应用服务熔断后;服务调用方可以自己进行判断哪些服务反应慢或存在大量超时,可以针对这些服务进行主动熔断,防止整个系统被拖垮。

   Hystrix的服务熔断机制,可以实现弹性容错;当服务请求情况好转之后,可以自动重连。通过断路的方式,将后续请求直接拒绝,一段时间(默认5秒)之后允许部分请求通过,如果调用成功则回到断路器关闭状态,否则继续打开,拒绝请求的服务。

   Hystrix的熔断状态机模型:

    

   状态机有3个状态:

    • Closed:关闭状态(断路器关闭),所有请求都正常访问。
    • Open:打开状态(断路器打开),所有请求都会被降级。Hystrix会对请求情况计数,当一定时间内失败请求百分比达到阈值,则触发熔断,断路器会完全打开。默认失败比例的阈值是50%,请求次数最少不低于20次,也就是10次以上失败就会打开断路器。
    • Half Open:半开状态,不是永久的,断路器打开后会进入休眠时间(默认是5S)。随后断路器会自动进入半开 状态。此时会释放部分请求通过,若这些请求都是健康的,则会关闭断路器,否则继续保持打开,再次进行休眠计时。

 2、动手实践

   为了能够精确控制请求的成功或失败,在 consumer-demo 的处理器业务方法中加入一段逻辑;

   修改 consumer-demo\src\main\java\com\itheima\consumer\controller\ConsumerController.java

@GetMapping("{id}")
@HystrixCommand
public String queryById(@PathVariable("id") Long id){
    if(id == 1){
        throw new RuntimeException("太忙了");
   }
    String url = "http://user-service/user/" + id;
    String user = restTemplate.getForObject(url, String.class);
    return user;
}

   这样如果参数是id为1,一定失败,其它情况都成功。(不要忘了清空user-service中的休眠逻辑)

   我们准备两个请求窗口:

    • 一个请求:http://localhost:8080/consumer/1,注定失败
    • 一个请求:http://localhost:8080/consumer/2,肯定成功

   当我们疯狂访问id为1的请求时(超过20次),就会触发熔断。断路器会打开,一切请求都会被降级处理。

   此时你访问id为2的请求,会发现返回的也是失败,而且失败时间很短,只有20毫秒左右;因进入半开状态之后2是可以的。

    

   不过,默认的熔断触发要求较高,休眠时间窗较短,为了测试方便,我们可以通过配置修改熔断策略consumer-demo: 

# 配置熔断策略:
hystrix:
 command:
   default:
     circuitBreaker:
       errorThresholdPercentage: 50 # 触发熔断错误比例阈值,默认值50%
       sleepWindowInMilliseconds: 10000 # 熔断后休眠时长,默认值5秒
       requestVolumeThreshold: 10 # 熔断触发最小请求次数,默认值是20
     execution:
       isolation:
         thread:
           timeoutInMilliseconds: 2000 # 熔断超时设置,默认为1秒

   为了方便复制上述配置,可以使用如下格式复制到yml文件中会自动格式化:

hystrix.command.default.circuitBreaker.requestVolumeThreshold=10
hystrix.command.default.circuitBreaker.sleepWindowInMilliseconds=10000
hystrix.command.default.circuitBreaker.errorThresholdPercentage=50
hystrix.command.default.execution.isolation.thread.timeoutInMilliseconds=2000

   上述的配置项可以参考 HystrixCommandProperties 类中。

 

posted on 2024-05-08 16:35  花溪月影  阅读(12)  评论(0编辑  收藏  举报