可用性SLA还不懂?看完这个故事就懂了........

什么是SLA?那么多9到底是什么意思?
(瓦特??我怎么知道???????)

经过我几天几夜的
查阅文献、翻阅“古籍”、寻师问道

终于让我明白了
SLA协议里
各种不同词汇的含义

1、何为SLA(Service Level Agreement)服务等级协议

简单来说,SLA是一种双方的约定,是一种服务可用性的指标。

说人话!!!
就像是一对情侣
男友会向女友做出一些承诺,比如


(SLA中的对服务类型、质量时间条款的条文规定)

可男生却老是迟到
每周迟到的次数
超过了之前做的承诺的次数

(可用性低于条文中所规定的值)

为了哄女友开心
男孩只能在到达约会地点后
只能给她道歉、逛街、买礼物
表达自己的歉意

(可用性低于条文规定值,服务商所需提供的赔偿)

2、SLA和SLO 的区别

SLA(service level agreement)服务等级协议,指的是整个协议,其定义了服务类型、质量以及赔付标准等。

  • 作用:SLA的主要作用是设定客户期望,规定服务标准,确保服务提供者履行承诺,并规定违反服务水平的补救措施。
  • 示例:一个托管服务提供商承诺其服务器的月度正常运行时间为99.9%,并在未达到这一目标时提供退款或服务补偿。

SLO(service level objective)服务等级目标,指的是设计可用性,其意思即为设计该产品时期望达到的可用性目标。

  • 作用:SLO用于明确服务提供者需要达到的服务水平标准,以确保满足SLA的要求。它是服务提供者和客户在实际操作中监控和衡量服务性能的基础。
  • 示例:一个Web应用的SLO可能规定99.9%的请求在300毫秒内响应,99.5%的请求在200毫秒内响应。

SLI(Service Level Indicator)衡量和报告服务性能的工具,是一个实际的、可量化的指标,用于监控服务是否达到了设定的SLO。

  • 作用:SLI提供了实际的数据,帮助评估和监控服务是否达到了SLO的标准。它是服务提供者用来衡量和报告服务性能的工具。
  • 示例:一个Web应用的SLI可以是实际监控到的请求响应时间,错误率,或者可用性百分比。

SLA与SLO的区别
主要是体现在“协议”与“目标”上
SLO只是产品的“设计可用性”
比如恋爱过程中
男孩时常会和女友进行承诺
以后包揽一切家务

但是
“太美的承诺,因为太年轻”
承诺就仅仅是承诺
并未规定
具体该实施、实施的方法以及未达目标所受的惩罚等

(也就是“说说就是说说而已”)

3、SLA中那么多9究竟代表什么意思?

首先,我们来明确一个概念。
即为9越多
代表全年服务可用时间越长,服务更可靠

如果我们将一个月按照30天计算

那么换算成分钟就是

同时我们假设

 

4、云厂商宣传高SLA有什么意义?

我们经常会看见各大云厂商,在宣传自己产品SLA时,会喊出3个9,4个9,5个9的口号。

以阿里云为例,阿里云对象存储发布了号称全球领先的对象存储SLA

 

(阿里云对象存储OSS官网截图)其服务可用性承诺,最高可达到 99.995%

 (阿里云对象存储OSS官网截图)

假设每5分钟访问100次阿里云OSS,一个月内出故障的次数最多就是:

 

但有人问了
阿里云对象存储SLA服务协议等级这么高,就不怕被薅羊毛党盯上,通过技术或者外力的手段,薅阿里云的羊毛吗?

不过,这个看起来似乎不可能会发生的
据官方披露,阿里云OSS 能提出这么高的SLA
全得益于其背后稳定的技术
以及对产品久经打磨的信心!!!

提升SLA的背后技术亮点:

1、 阿里云对象存储(OSS)基于业界领先的阿里云自研分布式存储基座——盘古,结合先进的有巣分布式KV索引技术以及女娲一致性服务技术,确保服务高可用,数据高可靠,为用户业务保驾护航;
2、 提供同城冗余存储类型,全球部署五大区域,即使遭遇可用区级灾难或故障时,也能实现数据不丢,业务不停。再结合 跨区域复制功能,实现两地多中心架构,满足用户多维度的容灾要求;
3、 过去十年,阿里云OSS不仅经受住数百万用户持续的极致考验,还承受住历年双十一“地狱”级别的磨炼。支撑阿里经济体100%全面上云,助力 2019全球天猫购物狂欢节创下了2864亿的商业奇迹;

so,看完热闹来总结一下
阿里云之所以不断能持续提升自己的可用性SLA
一方面得益于自身技术的沉淀和产品饱受全球大规模高并发场景的打磨;另一方面也是背后有阿里巴巴(马爸爸)不断对技术科研的投入

posted @ 2024-05-16 18:04  Security  阅读(131)  评论(0编辑  收藏  举报