阿里云-云监控研究

1.概览页

1)云服务概览
按设备类型统计

2)报警概览
报警数量统计

3)事件概览
按设备类型,事件统计(插件,主机切换,实例故障)

4)资源水位
按设备类型,统计相关指标(指标的95th Percentile,以ECS的CPU使用率等于34%为例,其含义是95%的ECS实例CPU使用率都小于34% 。)

2.Dashboard页

按设备类型,添加对应大盘,切换大盘,添加相应的指标图表

3.应用分组

按应用系统划分组,制指定监控告警规则

点击“分组名称”,可查看以下信息
1)组内资源
组内所有实例

2)监控视图
监控指标图表展示

3)故障列表
显示正在报警的全部资源

4)事件监控
调用云监控api,将业务中的各类异常事件,重要事件上报到云监控,查询,报警。

5)可用性监控
定期探测本地或远程指定路径或端口是否正常响应

6)日志监控
系统或业务日志收集,消费,分析,告警

7)自定义监控
和事件监控类似,自定义监控项,将数据上报到云监控,查询,报警

8)报警历史
报警记录

9)报警规则
报警规则新增,修改,删除,列表

4.主机监控
通过在ECS服务器上,安装云监控插件,监控主机CPU,内存,磁盘等指标。

5.事件监控
同“应用分组”中的“事件监控”

6.自定义监控
同“应用分组”中的“自定义监控”

7.新站点监控
同“应用分组”中的“可用性监控”

8.云服务监控
云产品相关指标展示,告警规则设置

9.报警服务
报警规则,报警历史,报警联系人等设置

10.资源消耗
报警规则个数,API月调用量,短信月条数等资源可使用条数说明。

posted on 2018-08-09 16:23  迪米特  阅读(448)  评论(0编辑  收藏  举报

导航