06-Hystrix组件(断路器)

Hystrix组件(断路器)

服务熔断Hystrix入门

服务容错的核心知识

雪崩效应

在微服务架构中,一个请求需要调用多个服务是非常常见的。如客户端访问A服务,而A服务需要调用B服务,B服务需要调用C服务,由于网络原因或者自身的原因,如果B服务或者C服务不能及时响应,A服务将处于阻塞状态,直到B服务C服务响应。此时若有大量的请求涌入,容器的线程资源会被消耗完毕,导致服务瘫痪。服务与服务之间的依赖性,故障会传播,造成连锁反应,会对整个微服务系统造成灾难性的严重后果,这就是服务故障的雪崩效应

6-1

雪崩是系统中的蝴蝶效应导致其发生的原因多种多样,有不合理的容量设计,或者是高并发下某一个方法响应变慢,亦或是某台机器的资源耗尽。从源头上我们无法完全杜绝雪崩源头的发生,但是雪崩的根本原因来源于服务之间的强依赖,所以我们可以提前评估,做好 熔断,隔离,限流

服务隔离

顾名思义,它是指将系统按照一定的原则划分为若干个服务模块,各个模块之间相对独立,无强依赖。当有故障发生时,能将问题和影响隔离在某个模块内部,而不扩散风险,不波及其它模块,不影响整体的系统服务。

熔断降级

熔断 这一概念来源于电子工程中的 断路器(Circuit Breaker)。在互联网系统中,当下游服务因访问压力过大而响应变慢或失败,上游服务为了保护系统整体的可用性,可以暂时切断对下游服务的调用。这种 牺牲局部,保全整体的措施就叫做熔断。

6-2

所谓降级,就是当某个服务熔断之后,服务器将不再被调用,此时客户端可以自己准备一个本地的fallback回调,返回一个缺省值。 也可以理解为兜底

服务限流

限流可以认为服务降级的一种,限流就是限制系统的输入输出流量已达到保护系统的目的。

一般来说系统的吞吐量是可以被测算的,为了保证系统的稳固运行,一旦达到的需要限制的阈值,就需要限制流量并采取少量措施以完成限制流量的目的。比如:推迟解决,拒绝解决,或者部分拒绝解决等等。

Hystrix介绍

6-3

Hystrix是由Netflix开源的一个延迟容错库,用于隔离访问远程系统、服务或者第三方库,防止级联失败,从而提升系统的可用性与容错性。Hystrix主要通过以下几点实现延迟和容错。

  • 包裹请求:使用HystrixCommand包裹对依赖的调用逻辑,每个命令在独立线程中执行。这使用了设计模式中的“命令模式”。
  • 跳闸机制:当某服务的错误率超过一定的阈值时,Hystrix可以自动或手动跳闸,停止请求该服务一段时间。
  • 资源隔离:Hystrix为每个依赖都维护了一个小型的线程池(或者信号量)。如果该线程池已满,发往该依赖的请求就被立即拒绝,而不是排队等待,从而加速失败判定。
  • 监控:Hystrix可以近乎实时地监控运行指标和配置的变化,例如成功、失败、超时、以及被拒绝的请求等。
  • 回退机制:当请求失败、超时、被拒绝,或当断路器打开时,执行回退逻辑。回退逻辑由开发人员自行提供,例如返回一个缺省值。
  • 自我修复:断路器打开一段时间后,会自动进入“半开”状态

对 RestTemplate 的支持

环境搭建

引入坐标

<!--引入hystrix依赖-->
<dependency>
    <groupId>org.springframework.cloud</groupId>
    <artifactId>spring-cloud-starter-netflix-hystrix</artifactId>
</dependency>

在启动类中激活 Hystrix ,使用 @EnableCircuitBreaker 注解

@SpringBootApplication
@EnableCircuitBreaker//开启熔断器
public class OrderRestApplication {

	public static void main(String[] args) {
		SpringApplication.run(OrderRestApplication.class, args);
	}

	@LoadBalanced
	@Bean
	public RestTemplate restTemplate() {
		return new RestTemplate();
	}

}

配置熔断触发的降级逻辑

/**
 * 单一方式
 * 降级方法
 *  和需要受到保护的方法的返回值一致
 *  方法参数一致
*/
public Product orderFallBack(Long id) {
    Product p = new Product();
    p.setId(id);
    p.setProductName("触发降级方法");
    return p;
}

在需要收到保护的接口,上使用 @HystrixCommand 配置

/**
* 使用 @HystrixCommand 注解配置熔断保护
* 		属性fallbackmethod : 配置熔断之后的降级方法
*/
@HystrixCommand(fallbackMethod = "orderFallBack")
@RequestMapping(value = "/buy/{id}", method = RequestMethod.GET)
public Product findByIdFunTwo(@PathVariable Long id) {
    Product product = restTemplate.getForObject("http://SERVER-PRODUCT/product/" + id, 							Product.class);
    return product;
}

公共统一的熔断设置

/**
 * @DefaultProperties : 指定此接口中公共的熔断设置
 *      如果过在@DefaultProperties指定了公共的降级方法
 *      在@HystrixCommand不需要单独指定某个降级方法
 */
@DefaultProperties(defaultFallback = "defaultFallBack")
@RestController
@RequestMapping(value = "/public")
public class DefaultOrderController {
	@Autowired
	private RestTemplate restTemplate;

	/**
	 * 此处使用@HystrixCommand注解时,不用指定降级方法
	 */
	@HystrixCommand
	@RequestMapping(value = "/buy/{id}", method = RequestMethod.GET)
	public Product findByIdFunTwo(@PathVariable Long id) {
		//使用服务名称调用
		Product product = restTemplate.getForObject("http://SERVER-PRODUCT/product/" + 							id, Product.class);
		return product;
	}


	/**
	 * 指定统一的降级方法
	 *  * 参数 : 没有参数
	 */
	public Product defaultFallBack() {
		Product product = new Product();
		product.setProductName("触发统一的降级方法");
		return product;
	}
}

访问测试

  • 单一降级测试
    • 启动EurekaServer、商品微服务、订单微服务
    • 正常访问 http://localhost:9002/order/buy/1 ,页面打印正常的商品信息
    • 当商品微服务停止或访问不通时,页面输出自定义的单一降级方法语句:触发降级方法
  • 公共统一降级测试
    • 启动EurekaServer、商品微服务、订单微服务
    • 正常访问 http://localhost:9002/public/buy/1 ,页面打印正常的商品信息
    • 当商品微服务停止或访问不通时,页面输出自定义的公共统一降级方法语句:触发统一的降级方法

对 Feign 的支持

环境搭建

引入坐标

无操作,因为feign中已经集成了Hystrix。

在yml文件的feign中配置开启Hystrix

feign:
	#开启对hystrix的支持
	hystrix:
		enabled: true

自定义一个接口的实现类,这个实现类就是熔断触发的降级逻辑

@Component
public class ProductFeignClientCallBack implements ProductFeignClient {

	/**
	 * 熔断降级的方法
	 */
	@Override
	public Product findById(Long id) {
		Product p = new Product();
		p.setProductName("feign调用触发熔断降级方法");
		return p;
	}
}

修改feignClient接口添加降级方法的支持

/**
 * 声明需要调用的微服务名称
 *  @FeignClient
 *      * name : 服务提供者的名称
 *      * fallback : 配置熔断发生降级方法
 *                  实现类.class
 */
@FeignClient(name = "server-product",fallback = ProductFeignClientCallBack.class)
public interface ProductFeignClient {

	/**
	 * 配置需要调用的微服务接口
	 * 此处的url为:提供者controller方法的具体url
	 */
	@RequestMapping(value = "/product/{id}", method = RequestMethod.GET)
	Product findById(@PathVariable("id") Long id);

}

访问测试

  • 降级测试

    • 启动EurekaServer、商品微服务、订单微服务

    • 正常访问 http://localhost:9003/order/buy/1 ,页面打印正常的商品信息

    • 当商品微服务停止或访问不通时,页面输出Feign接口实现类的降级方法语句,如下:

      {
      	"msg": "基于feign调用触发熔断降级"
      }
      

Hystrix的超时时间

hystrix:
  command:
    default:
      execution:
        isolation:
          thread:
            timeoutInMilliseconds: 3000 #默认的连接超时时间1秒,若1秒没有返回数据,自动的触发降级逻辑

当在规定的时间内,没有获取到微服务的数据,这个时候会自动的触发熔断降级方法。

服务熔断Hystrix高级

hystrix设置监控信息

基本搭建

订单工程中搭建,使用ribbon或feign工程其一即可

引入坐标

<!--引入hystrix依赖-->
<dependency>
    <groupId>org.springframework.cloud</groupId>
    <artifactId>spring-cloud-starter-netflix-hystrix</artifactId>
</dependency>
<!-- 健康监控 -->
<dependency>
    <groupId>org.springframework.boot</groupId>
    <artifactId>spring-boot-starter-actuator</artifactId>
</dependency>

在启动类上配置激活注解

@EnableCircuitBreaker	//激活hystrix

yml配置暴露actuator监控的端点

#dashboard暴露端点
management:
  endpoints:
    web:
      exposure:
        include: '*'

基本环境测试

  • 浏览器访问url,进行查看
http://localhost:9002/actuator/hystrix.stream -- ribbon工程搭建时用这个
http://localhost:9003/actuator/hystrix.stream -- feign工程搭建时用这个
  • 订单服务未访问时,页面打印

    6-8

  • 当订单服务访问时,页面打印

    6-9

web监控平台

问题描述:

Springboot2.0以后版本访问提示错误 Unable to connect to Command Metric Stream

解决方法

环境搭建

order_service_feign 工程模块为例

引入坐标

<!--hystrix的web可视化面板-->
<dependency>
    <groupId>org.springframework.cloud</groupId>
    <artifactId>spring-cloud-starter-netflix-hystrix-dashboard</artifactId>
</dependency>

在启动类上配置激活注解

@EnableHystrixDashboard	//激活hytrix的web监控平台

测试

  • 浏览器访问 url,进行展示 HystrixDashboard
http://localhost:9003/hystrix

6-10

  • 点击进入后是个空白的面板,只有访问过之后,才会出现监控的数据

6-11

6-12

断路器聚合监控Turbine

在微服务架构体系中,每个服务都需要配置Hystrix DashBoard监控。如果每次只能查看单个实例的监控数据,就需要不断切换监控地址,这显然很不方便。要想看这个系统的Hystrix Dashboard数据就需要用到Hystrix Turbine。Turbine是一个聚合Hystrix监控数据的工具,他可以将所有相关微服务的Hystrix监控数据聚合到一起,方便使用。引入Turbine后,整个监控系统架构如下︰

6-13

环境搭建

创建新模块 hystrix_turbine

引入坐标

<dependency>
    <groupId>org.springframework.cloud</groupId>
    <artifactId>spring-cloud-starter-netflix-turbine</artifactId>
</dependency>
<dependency>
    <groupId>org.springframework.cloud</groupId>
    <artifactId>spring-cloud-starter-netflix-hystrix</artifactId>
</dependency>
<dependency>
    <groupId>org.springframework.cloud</groupId>
    <artifactId>spring-cloud-starter-netflix-hystrix-dashboard</artifactId>
</dependency>

yml配置

server:
  port: 8031
spring:
  application:
    name:
      hystrix-turbine
eureka:
  client:
    service-url:
      defaultZone: http://localhost:9000/eureka/
  instance:
    prefer-ip-address: true
turbine: # 要监控的微服务列表,多个用,分隔。此处只写了一个服务,则只监控当前这一个
  appConfig: service-order
  clusterNameExpression: "'default'"

启动类添加注解

@SpringBootApplication
@EnableTurbine	//激活Turbine
@EnableHystrixDashboard	//激活hytrix的web监控平台
public class HystrixTurbineServiceApplication {

	public static void main(String[] args) {
		SpringApplication.run(HystrixTurbineServiceApplication.class, args);
	}
}

测试

  • 浏览器访问url,进行展示HystrixDashboard
http://localhost:8031/hystrix

页面中在url位置输入 http://localhost:8031/turbine.stream,动态根据turbine.stream数据展示多个微服务的监控数据。如下:

6-4

熔断器(断路器)的状态

6-5

Closed:关闭状态(断路器关闭)

所有请求都正常访问。代理类维护了最近调用失败的次数,如果某次调用失败,则使失败次数加1。如果最近失败次数超过了在给定时间内允许失败的阈值,则代理类切换到断开(Open)状态。此时代理开启了一个超时时钟,当该时钟超过了该时间,则切换到半断开( Half-Open )状态。该超时时间的设定是给了系统- -次机会来修正导致调用失败的错误。

Open :打开状态(断路器打开)

所有请求都会被降级。Hystix会对请求情况计数, 当规定时间内失败请求百分比达到阈值,则触发熔断,断路器会完全关闭。默认失败比例的阈值是50% ,请求次数最少不低于20次。

Half Open:半开状态

open状态不是永久的,打开后会进入休眠时间(默认是5S)。随后断路器会自动进入半开状态。此时会释放1次请求通过,若这个请求是健康的,则会关闭断路器;否则继续保持打开,再次进行5秒休眠计时。

断路器图示讲解

6-6


环境准备:
1.在订单系统中加入逻辑
判断请求的id :
如果ld=1 :正常执行( 正常调用商品微服务)
如果id=2 :抛出异常
2.默认hystrix中有触发断路器状态转化的阈值
触发熔断的最小请求次数: 20
触发熔断的请求失败的比率: 50%
断路器开启的时长: 5秒

熔断器的隔离策略

微服务使用Hystrix熔断器实现了服务的自动降级,让微服务具备自我保护的能力,提升了系统的稳定
性,也较好的解决雪崩效应其使用方式目前支持两种策略:

  • 线程池隔离策略:使用一个线程池来存储当前的请求,线程池对请求作处理,设置任务返回处理超
    时时间,堆积的请求堆积入线程池队列。这种方式需要为每个依赖的服务申请线程池,有一定的资
    源消耗,好处是可以应对突发流量(流量洪峰来临时,处理不完可将数据存储到线程池队里慢慢处
    理)
  • 信号量隔离策略:使用一个原子计数器(或信号量)来记录当前有多少个线程在运行,请求来先判
    断计数器的数值,若超过设置的最大线程个数则丢弃改类型的新请求,若不超过则执行计数操作请
    求来计数器+1,请求返回计数器-1。这种方式是严格的控制线程且立即返回模式,无法应对突发
    流量(流量洪峰来临时,处理的线程超过数量,其他的请求会直接返回,不继续去请求依赖的服
    务)使用一个原子计数器(或信号量)来记录当前有多少个线程在运行,请求来先判
    断计数器的数值,若超过设置的最大线程个数则丢弃改类型的新请求,若不超过则执行计数操作请
    求来计数器+1,请求返回计数器-1。这种方式是严格的控制线程且立即返回模式,无法应对突发
    流量(流量洪峰来临时,处理的线程超过数量,其他的请求会直接返回,不继续去请求依赖的服
    务)

两者的对比:

6-7

yml中配置即可

hystrix:
  command:
    default:
      execution:
        isolation:
          strategy: ExecutionIsolationStrategy.SEMAPHORE #信号量隔离
          strategy: # ExecutionIsolationStrategy.THREAD 线程池隔离
          maxConcurrentRequests: #最大信号量上限
posted @ 2021-07-19 15:45  爱码士很优秀  阅读(91)  评论(0编辑  收藏  举报