zabbix-场景定位

1、生命周期

1.1、说明

任何一个产品从无到有,都至少要经历如下几个阶段:调研阶段、设计阶段、开发阶段、测试阶段、运营阶段

1.2、生命周期流程图

2、发展现状

2.1、现状介绍

随着公司业务的发展,我们所提供的产品规模越来越大,功能越来越多、架构越来越复杂。而到了这个时候,我们往往对产品的交付质量和项目的持续稳定运行的要求越来越高,虽然我们通过各种开发框架、开发模型、
持续交付、DevOps等等,各种方法和手段来提高我们产品的质量,而且可以在一定程度上满足我们的需求。但是我们知道,对于任何一种产品来说,把它制造出来的时间和它运行的时间,这两者相差太多了。可以这么
说,一个产品的效益完全是由后续持续运行的过程中产生的价值来决定的。所以就需要我们有专业的人员对产品的运营阶段进行高质量的运营维护,从而保证产品在后续阶段持续稳定的盈利下去。
那怎么才能高质量的维护呢?简单来说,就是需要我们时刻的掌握到产品的运行过程中所产生的数据,这些数据包括硬件设备、系统性能、软件运行、趋势数据等等,根据我们对产品业务的熟悉程度,设定一定的指标, 当出现某些指标异常的时候,我们就采取一定的手段进行处理,从而保证产品项目软件的持续运营下去。而这个动作就是我们平常所说的
"数据采集与处理"

2.2、生产案例

1 2012.10 Google的项目软件升级失败,导致全球Gmail业务中断18分钟。
2 2014.06 Facebook项目软件配置更新,导致软件中断31分钟。
3 2014.12 Dropbox对底层操作系统升级,导致公司项目中断3小时。
4 2017.02 gitlab公司数据库更新操作失误,导致产品中断18小时,数据丢失6小时。
5 2017.06 苹果公司业务更新操作失误,导致业务中断36+小时。
6 2018.07 腾讯云业务维护操作失误,导致业务中断数小时,部分数据完全丢失。
7 2018.01 kubernetes公司某项目更新失误,导致中断19小时。
宕机事件,有条不紊的出现在世界的各个角落

2.3、数据流程

2.3.1、流程图

2.3.2、说明

1 数据采集:根据业务的特性,采取多种方式,进行对一些针对性的数据进行采集
2 数据整理:对上报后的数据源进行收集、清晰、整理
3 实时分析:对某些重要的核心的业务数据,进行实时分析。
4 离线分析:对普通的数据、非紧急的业务数据进行存储,后续进行响应的分析。
5 结果输出:将实时分析和离线分析后的数据结果展现出来,供决策参考。
6 问题决策:根据当前业务情况,人工或者自动方式对输出的结构进行分析,并判定下一步的行动(警告或修复),同时将其决策记录保存下来,以便为后序决策提供依据。
也就是说:采集、传输、存储、分析、警告这几部分是非常必要的。

3、核心目标

监控的核心目标就是维持网站的可用性

4、小结

生命周期:
 调研阶段 - 设计阶段 - 开发阶段 - 测试阶段 - 运营阶段
数据流程:
 数据采集 - 数据整理 - 实时分析(数据存储 - 离线分析) - 结果输出 - 决策 - 警告/修复

 

posted @ 2023-05-24 17:49  小粉优化大师  阅读(19)  评论(0编辑  收藏  举报