二、SpringCloud Alibaba Sentinel
下载:
HyStrix | Sentinel |
---|---|
需要程序员自己搭建监控平台 | 单独的一个组件,可以独立出来 |
没有一台web界面可以给程序员进行更细粒度化的配置流程。速率控制,服务熔断,服务降级 | 界面化的细粒度统一配置。 |
-
Sentinel:轻量级流量控制,熔断降级
-
Sentinel 的主要特性:
- 微服务使用中的各种问题
- 服务降级
- 服务熔断
<dependencies> <dependency> <groupId>com.alibaba.cloud</groupId> <artifactId>spring-cloud-starter-alibaba-nacos-discovery</artifactId> </dependency> <dependency> <groupId>com.alibaba.csp</groupId> <artifactId>sentinel-datasource-nacos</artifactId> </dependency> <dependency> <groupId>com.alibaba.cloud</groupId> <artifactId>spring-cloud-starter-alibaba-sentinel</artifactId> </dependency> <dependency> <groupId>org.springframework.cloud</groupId> <artifactId>spring-cloud-starter-openfeign</artifactId> </dependency> <dependency> <groupId>org.springframework.boot</groupId> <artifactId>spring-boot-starter-web</artifactId> </dependency> <dependency> <groupId>org.springframework.boot</groupId> <artifactId>spring-boot-starter-actuator</artifactId> </dependency> <dependency> <groupId>org.springframework.boot</groupId> <artifactId>spring-boot-devtools</artifactId> <scope>runtime</scope> <optional>true</optional> </dependency> <dependency> <groupId>cn.hutool</groupId> <artifactId>hutool-all</artifactId> <version>4.6.3</version> </dependency> <dependency> <groupId>org.projectlombok</groupId> <artifactId>lombok</artifactId> <optional>true</optional> </dependency> <dependency> <groupId>org.springframework.boot</groupId> <artifactId>spring-boot-starter-test</artifactId> <scope>test</scope> </dependency> </dependencies>
server: port: 8401 spring: application: name: cloudalibaba-sentinel-service cloud: nacos: discovery: server-addr: localhost:8848 sentinel: transport: dashboard: localhost:8080 port: 8719 #默认8719,假如被占用了会自动从8719开始依次+1扫描。直至找到未被占用的端口 management: endpoints: web: exposure: include: '*'
@EnableDiscoveryClient @SpringBootApplication public class MainApp8401{ public static void main(String[] args) { SpringApplication.run(MainApp8401.class, args); } }
@RestController public class FlowLimitController{ @GetMapping("/testA") public String testA() { return "------testA"; } @GetMapping("/testB") public String testB() { return "------testB"; } }
-
-
针对来源:Sentinel可以针对调用者进行限流,填写微服务名称,默认default(不区分来源)
-
阈值类型/单机阈值
-
QPS(每秒钟的请求数量):当调用该api的QPS达到阈值的时候,进行限流。
-
线程数:当调用该api的线程数达到阈值的时候,进行限流
-
QPS和线程数的区别(此时QPS=1 或者线程数=1):以testA为例,当QPS=1时,每秒访问testA的数量大于1时报错,请求进不到testA就被拦截报错;而线程数 = 1时,此时所有的请求都进入都testA,发现有多个线程(可以使用Thread.sleep(1000L)模拟),则报错。
-
-
是否集群:不需要集群
-
流控模式:
-
直接:api达到限流条件时,直接限流
-
关联:当关联的资源达到阈值时,就限流自己。
-
链路:只记录指定链路上的流量(指定资源从入口资源进来的流量,如果达到阈值,就进行限流)【api界别的这对来源】
-
-
流控效果:
-
快速失败:直接失败,抛出异常
-
Warm up:根据codeFactor(冷加载因子,默认3)的值,从阈值/codeFactor,经过预热时长,才达到设置的QPS阈值
-
-
快速点击访问http://localhost:8401/testA;报错:Blocked by Sentinel (flow limiting)
直接调用,默认报错信息,技术方面OK,但是是否应该有我们自己的后续处理?类似有一个fallback的兜底方法?
(2)、关联
当关联的资源达到阈值时,就限流自己。当与A关联的资源B达到阈值后,就限流自己。B惹事,A挂了
配置A:设置效果,当关联资源/testB的qps阈值超过1时,就限流/testA的Rest访问地址,当关联资源达到阈值后限制配置好的资源名。
- postman模拟并发密集访问testB
Run 大批量线程高并发访问B,导致A失效了
- 运行后发现testA挂了
-
(3)、链路
-
源码
- Warmup配置
默认coldFactor为3,即请求QPS从(threshold/3)开始,经多少预热时长才逐渐升至设定的QPS阈值。
匀速排队,阈值必须设置为QPS
匀速排队(RuleConstant.CONTROL_BEHAVIOR_RATE_LIMITER
)方式会严格控制请求通过的间隔时间,也即是让请求以均匀的速度通过,对应的是漏桶算法。详细文档可以参考 流量控制 - 匀速器模式,具体的例子可以参见 PaceFlowDemo。
该方式的作用如下图所示:
降级策略:
-
RT(平均响应时间,秒级)
-
平均响应时间,超出阈值且在时间窗口内通过的请求>=5,两个条件同时满足后触发降级,窗口期关闭后关闭断路器,RT最大4900(更大的需要同-Dcsp.sentinel.statistic.max.rt=xxx才能生效)
-
-
异常比例(秒级)
-
QPS>=5且异常比例(秒级统计)超过阈值时,触发降级,时间窗口结束后,关闭降价
-
-
异常数(分钟级)
-
异常数(分钟统计)超过阈值时,触发降级;时间窗口结束后,关闭降级。
-
Sentinel熔断降级会在调用链路中某个资源出现不稳定状态时(例如调用超时或异常比例升高),对这个资源的调用进行限制,让请求快速失败,避免影响到其他的资源而导致级联错误
当资源被降级后,在接下来的降级时间窗口期之内,对该资源的调用都自动熔断(默认行为时抛出DegradeException)
Sentinel的断路器是没有半开状态的。半开的状态系统自动去检测是否请求有异常,没有异常就关闭断路器恢复使用,有异常则继续打开断路器不可用。具体可以参考Hystrix。
(1)、RT
平均响应时间(DEAGRADE_GRADE_RT):当1s内持续进入5个请求,对应时刻的平均响应时间(秒级)均超过阈值(count,以ms为单位),那么在接下的时间窗口(Degrade Rule中的 timeWindow,以s为单位)之内,对这个方法的调用都会自动地熔断(抛出DegradeException).注意Sentinel默认统计的RT上限是4900ms,超出此阈值的都会算作4900ms,若需要变更此上限,可以通过启动配置项-Dcsp.sentinel.statistic.max.rt=xxx来配置。
- 测试
@GetMapping("/testC") public String testC(){ try { TimeUnit.SECONDS.sleep(1); } catch (InterruptedException e) { e.printStackTrace(); } log.info("testC 测试RT"); return "------testC"; }
jmeter压测:
(2)、异常比例
异常比例:当资源的每秒请求量>=5,并且每秒异常总数占通过量的比值超过阈值(DegadeRule中count)之后,资源进入降级状态,即再接下的时间窗口(DegradeRule中的timeWindow,以s为单位)之内,对这个方法的调用都会自动地返回,异常比率的阈值范围是[0.0,1.0]代表0%-100%
- 测试
@GetMapping("/testD") public String testD(){ log.info("testD 异常比例"); int age = 10/0; return "------testD"; }
- 测试
@GetMapping("/testE") public String testE(){ log.info("testE 测试异常数"); int age = 10/0; return "------testE 测试异常数"; }
五、热点key限流
很多时候我们希望统计某个热点数据中访问频次最高的 Top K 数据,并对其访问进行限制。比如:
-
-
商品 ID 为参数,统计一段时间内最常购买的商品 ID 并进行限制
-
用户 ID 为参数,针对一段时间内频繁访问的用户 ID 进行限制
-
热点参数限流会统计传入参数中的热点参数,并根据配置的限流阈值与模式,对包含热点参数的资源调用进行限流。热点参数限流可以看做是一种特殊的流量控制,仅对包含热点参数的资源调用生效。
Sentinel 利用 LRU 策略统计最近最常访问的热点参数,结合令牌桶算法来进行参数级别的流控。热点参数限流支持集群模式。
@GetMapping("/testHotKey") @SentinelResource(value = "testHotKey",blockHandler = "deal_testHotKey") public String testHotKey(@RequestParam(value = "p1",required = false) String p1, @RequestParam(value = "p2",required = false) String p2) { //int age = 10/0; return "------testHotKey"; } //兜底方法 public String deal_testHotKey (String p1, String p2, BlockException exception){ return "------deal_testHotKey,o(╥﹏╥)o"; }
-
@SentinelResource(value = "testHotKey")
-
方法testHostKey里面第一个参数只要QPS超过每秒1次,马上降级处理
-
异常打到了前台用户界面看不到,不友好;@SentinelResource(value = "testHotKey",blockHandler = "deal_testHotKey");用了我们自己定义的fallback方法deal_testHotKey。
5.4、测试
5.5、参数例外项
上述案例演示了第一个参数p1,当QPS超过1秒1次点击后马上被限流
特殊情况
-
-
普通:超过1秒钟一个后,QPS达到阈值1后马上被限流;如果我们期望p1参数当它是某个特殊值时,它的限流值和平时不一样
-
特例:假如当p1的值等于5时,它的阈值可以达到200
-
-
-
测试
-
当p1等于5的时候,阈值变为200
-
六、系统规则
Sentinel 系统自适应限流从整体维度对应用入口流量进行控制,结合应用的 Load、CPU 使用率、总体平均 RT、入口 QPS 和并发线程数等几个维度的监控指标,通过自适应的流控策略,让系统的入口流量和系统的负载达到一个平衡,让系统尽可能跑在最大吞吐量的同时保证系统整体的稳定性。
-
各项配置参数说明
系统保护规则时从应用级别的入口流量进行控制,从单台机器的load、CPU使用率、平均RT、入口QPS和并发线程数等几个维度监控应用指标,让系统尽可能跑在最大吞吐量的同时保证系统整体的稳定性。
系统保护规则时应用整体维度的,而不是资源维度的,并且仅对入口流量生效,入口流量指的是进入应用的流量,比如web服务或Dubbo服务端接受的请求,都属于入口流量
系统规则支持以下模式:
-
load自适应(仅对Linux/unix-like机器生效):系统的load1作为启发指标,进行自适应系统保护。当系统load1超过设定的启发值,且系统当前的并发线程数超过估算的系统容量时才会触发系统保护(BBR阶段)。系统容量有系统的maxOpsXminRt估算得出,设定参考值一般是CPU cores X 2 .5
-
CPU usage(1.5.0+版本):当系统的CPU使用率超过阈值即触发系统保护(取值范围0.0-1.0),比较灵敏
-
平均RT:当单台机器上所有入口流量的平均RT达到阈值即触发系统保护
-
并发线程数:当单台机器上所有入口流量的并发线程数达到阈值即触发系统保护
-
入口QPS:当单台机器上所有入口流量的QPS达到阈值即触发系统保护配置全局QPS
-
七、@SentinelResource
7.1、按资源名称限流+后续处理
(1)、启动Nacos成功、启动Sentinel成功
-
修改Spring Boot 的Module名称:cloudalibaba-sentinel-service8401
-
pom.xml添加如下依赖
<dependency> <groupId>com.jdy.springcloud</groupId> <artifactId>cloud-api-commons</artifactId> <version>${project.version}</version> </dependency>
- 业务类
@RestController public class RateLimitController{ @GetMapping("/byResource") @SentinelResource(value = "byResource",blockHandler = "handleException") public CommonResult byResource(){ return new CommonResult(200,"按资源名称限流测试OK",new Payment(2020L,"serial001")); } public CommonResult handleException(BlockException exception){ return new CommonResult(444,exception.getClass().getCanonicalN; }
图形配置和代码关系:表示1秒钟内查询次数大于1,就跑到我们自定义的处,限流
(3)、测试
超过上述问题,疯狂点击,返回了自己定义的限流处理信息,限流发送
7.2、按照Url地址限流+后续处理
通过访问的URL来限流,会返回Sentinel自带默认的限流处理信息
@GetMapping("/rateLimit/byUrl") @SentinelResource(value = "byUrl") public CommonResult byUrl(){ return new CommonResult(200,"按url限流测试OK",new Payment(2020L,"serial002")); }
- Sentinel控制台配置
7.3、上面兜底方法面临的问题
-
系统默认的,没有体现我们自己的业务要求
-
依照现有条件,我们自定义的处理方法又和业务代码耦合在一起,不直观
-
每个业务方法都添加一个兜底的,代码膨胀加剧
-
全局统一的处理方法没有体现。
7.4、自定义限流处理逻辑
-
自定义限流处理类 CustomerBlockHandler用于自定义限流处理逻辑
public class CustomerBlockHandler { //限流处理逻辑的方法入参要有BlockException public static CommonResult handleException(BlockException exception) { return new CommonResult(2020, "自定义限流处理信息....CustomerBlockHandler"); } }
-
Sentinel主要有三个核心API
-
SphU定义资源
-
Tracer定义统计
-
ContextUtil定义了上下文
-
8.1、Ribbon系列
启动nacos和sentinel
(1)、提供者9003/9004
-
新建 Spring Boot 的Module名称 :cloudalibaba-provider-payment9003/9004
-
pom.xml添加如下依赖
<dependencies> <!--SpringCloud ailibaba nacos --> <dependency> <groupId>com.alibaba.cloud</groupId> <artifactId>spring-cloud-starter-alibaba-nacos-discovery</artifactId> </dependency> <dependency><!-- 引入自己定义的api通用包,可以使用Payment支付Entity --> <groupId>com.jdy.springcloud</groupId> <artifactId>cloud-api-commons</artifactId> <version>${project.version}</version> </dependency> <!-- SpringBoot整合Web组件 --> <dependency> <groupId>org.springframework.boot</groupId> <artifactId>spring-boot-starter-web</artifactId> </dependency> <dependency> <groupId>org.springframework.boot</groupId> <artifactId>spring-boot-starter-actuator</artifactId> </dependency> <!--日常通用jar包配置--> <dependency> <groupId>org.springframework.boot</groupId> <artifactId>spring-boot-devtools</artifactId> <scope>runtime</scope> <optional>true</optional> </dependency> <dependency> <groupId>org.projectlombok</groupId> <artifactId>lombok</artifactId> <optional>true</optional> </dependency> <dependency> <groupId>org.springframework.boot</groupId> <artifactId>spring-boot-starter-test</artifactId> <scope>test</scope> </dependency> </dependencies>
- 编辑application.yml
server:
port: 9003
spring:
application:
name: nacos-payment-provider
cloud:
nacos:
discovery:
server-addr: localhost:8848 #配置Nacos地址
management:
endpoints:
web:
exposure:
include: '*'
- 主启动
@SpringBootApplication
@EnableDiscoveryClient
public class PaymentMain9003{
public static void main(String[] args) {
SpringApplication.run(PaymentMain9003.class, args);
}
}
- 业务类
@RestController public class PaymentController{ @Value("${server.port}") private String serverPort; public static HashMap<Long, Payment> hashMap = new HashMap<>(); static{ hashMap.put(1L,new Payment(1L,"28a8c1e3bc2742d8848569891fb42181")); hashMap.put(2L,new Payment(2L,"bba8c1e3bc2742d8848569891ac32182")); hashMap.put(3L,new Payment(3L,"6ua8c1e3bc2742d8848569891xt92183")); } @GetMapping(value = "/paymentSQL/{id}") public CommonResult<Payment> paymentSQL(@PathVariable("id") Long id){ Payment payment = hashMap.get(id); CommonResult<Payment> result = new CommonResult(200,"from mysql,serverPort: "+serverPort,payment); return result; } }
- 测试地址 http://localhost:9003/paymentSQL/1
(2)、消费者84
-
新建Spring Boot 的Module名称: cloudalibaba-consumer-nacos-order84
-
pom.xml添加如下依赖
<dependencies> <dependency> <groupId>org.springframework.cloud</groupId> <artifactId>spring-cloud-starter-openfeign</artifactId> </dependency> <dependency> <groupId>com.alibaba.cloud</groupId> <artifactId>spring-cloud-starter-alibaba-nacos-discovery</artifactId> </dependency> <dependency> <groupId>com.alibaba.cloud</groupId> <artifactId>spring-cloud-starter-alibaba-sentinel</artifactId> </dependency> <dependency> <groupId>com.jdy.springcloud</groupId> <artifactId>cloud-api-commons</artifactId> <version>${project.version}</version> </dependency> <dependency> <groupId>org.springframework.boot</groupId> <artifactId>spring-boot-starter-web</artifactId> </dependency> <dependency> <groupId>org.springframework.boot</groupId> <artifactId>spring-boot-starter-actuator</artifactId> </dependency> <dependency> <groupId>org.springframework.boot</groupId> <artifactId>spring-boot-devtools</artifactId> <scope>runtime</scope> <optional>true</optional> </dependency> <dependency> <groupId>org.projectlombok</groupId> <artifactId>lombok</artifactId> <optional>true</optional> </dependency> <dependency> <groupId>org.springframework.boot</groupId> <artifactId>spring-boot-starter-test</artifactId> <scope>test</scope> </dependency> </dependencies>
- 编写application.yml
server:
port: 84
spring:
application:
name: nacos-order-consumer
cloud:
nacos:
discovery:
server-addr: localhost:8848
sentinel:
transport:
dashboard: localhost:8080
port: 8719
service-url:
nacos-user-service: http://nacos-payment-provider
- 主启动
@EnableDiscoveryClient @SpringBootApplication @EnableFeignClients public class OrderNacosMain84{ public static void main(String[] args) { SpringApplication.run(OrderNacosMain84.class, args); } @Bean @LoadBalanced public RestTemplate getRestTemplate() { return new RestTemplate(); } }
-
-
修改后请重启微服务 ,热部署对java代码级生效及时,对@SentinelResource注解内属性,有时效果不好
-
目的:fallback负责业务运行异常,blockHandler负责sentinel控制台的配置违规。
-
-
@RestController @Slf4j public class CircleBreakerController{ public static final String SERVICE_URL = "http://nacos-payment-provider"; @Resource private RestTemplate restTemplate; @RequestMapping("/consumer/fallback/{id}") @SentinelResource(value = "fallback") public CommonResult<Payment> fallback(@PathVariable Long id) { CommonResult<Payment> result = restTemplate.getForObject(SERVICE_URL + "/paymentSQL/"+id,CommonResult.class,id); if (id == 4) { throw new IllegalArgumentException ("IllegalArgumentException,非法参数异常...."); }else if (result.getData() == null) { throw new NullPointerException ("NullPointerException,该ID没有对应记录,空指针异常"); } return result; }
-
-
只配置blockHandler:编码(那个业务类下面的CircleBreakerController的全部源码)
-
- 忽略属性...编码(那个业务类下面的CircleBreakerController的全部源码)
<dependency> <groupId>org.springframework.cloud</groupId> <artifactId>spring-cloud-starter-openfeign</artifactId> </dependency>
编写application.yml
server:
port: 84
spring:
application:
name: nacos-order-consumer
cloud:
nacos:
discovery:
server-addr: localhost:8848
sentinel:
transport:
dashboard: localhost:8080
port: 8719
service-url:
nacos-user-service: http://nacos-payment-provider
#对Feign的支持
feign:
sentinl:
enabled: true
- 业务类
@FeignClient(value = "nacos-payment-provider",fallback = PaymentFallbackService.class) public interface PaymentService{ @GetMapping(value = "/paymentSQL/{id}") public CommonResult<Payment> paymentSQL(@PathVariable("id") Long id); }
@Component public class PaymentFallbackService implements PaymentService{ @Override public CommonResult<Payment> paymentSQL(Long id){ return new CommonResult<>(44444,"服务降级返回,---PaymentFallbackService",new Payment(id,"errorSerial")); } }
@Resource private PaymentService paymentService; @GetMapping(value = "/consumer/paymentSQL/{id}") public CommonResult<Payment> paymentSQL(@PathVariable("id") Long id) { return paymentService.paymentSQL(id); }
- 主启动 :添加@EnableFeignClients启动Feign的功能
@EnableDiscoveryClient @SpringBootApplication @EnableFeignClients public class OrderNacosMain84{ public static void main(String[] args) { SpringApplication.run(OrderNacosMain84.class, args); } }
九、规则持久化
-
目前问题:一旦我们重启应用,Sentinel规则将消失,生产环境需要将配置规则进行持久化
-
解决方法:将限流配置规则持久化进Nacos保存,只要刷新8401某个rest地址,sentinel控制台的流控规则就能看到,只要Nacos里面的配置不删除,针对8401上Sentinel上的流控规则持续有效
步骤:
-
修改Spring Boot 的Module名称 :cloudalibaba-sentinel-service8401
-
pom.xml添加如下依赖
<dependency> <groupId>com.alibaba.csp</groupId> <artifactId>sentinel-datasource-nacos</artifactId> </dependency>
- 编写application.yml
server:
port: 8401
spring:
application:
name: cloudalibaba-sentinel-service
cloud:
nacos:
discovery:
server-addr: localhost:8848 #Nacos服务注册中心地址
sentinel:
transport:
dashboard: localhost:8080 #配置Sentinel dashboard地址
port: 8719
datasource:
ds1:
nacos:
server-addr: localhost:8848
dataId: cloudalibaba-sentinel-service
groupId: DEFAULT_GROUP
data-type: json
rule-type: flow
management:
endpoints:
web:
exposure:
include: '*'
feign:
sentinel:
enabled: true # 激活Sentinel对Feign的支持
- 添加Nacos业务规则配置
- 内容解析
[ { "resource": "/retaLimit/byUrl", "limitApp": "default", "grade": 1, "count": 1, "strategy": 0, "controlBehavior": 0, "clusterMode": false } ]
resource:资源名称
limitApp:来源应用
grade:阈值类型,0表示线程数,1表示QPS
count:单机阈值
strategy:流控模式,0:直接,1:关联 2:链路
controlBehavior:流控效果,0:快速失败 1:Warm up 2:排队等待
clusterMode:是否集群
- 启动8401后刷新sentinel发现业务规则有了
-
扎一看还是没有,稍等一会儿
-