云平台监控指标的设定

本文分享自天翼云开发者社区@《云平台监控指标的设定》,作者: AE86上山了

 

为了确保存储和服务器能应付不断增长的业务需求,对磁盘资源、内存和CPU资源、宿主操作系统进行监控是必要的。

1.磁盘资源

服务器硬盘是磁盘资源中最慢的组件,在企业数据中心,仔细设计存储子系统,不要让它成为主要的性能瓶颈。

建议:

使用SAN,即使预算不允许,也要确保磁盘资源争用不会导致虚拟机瘫痪;

应将宿主机操作系统安装到专用硬盘上(不是专用卷),确保宿主操作系统不会与虚拟机抢夺磁盘资源。

RAID阵列是满足虚拟服务器性能必须的,RAID 1或RAID 10(提供更好的容错)。

优先考虑磁盘转速10K RPM的硬盘,比7500 RPM贵但性能表现好;

热插拔的SCSI硬盘(否则换硬盘得关闭系统),尤其当多个虚拟服务共享一个存储阵列时;

监控指标:

每秒I/O数(IOPS或TPS)

吞吐量(thoughput)

平均IO数据尺寸

磁盘活动时间百分比

服务时间(磁盘读或写执行的时间,包括寻道、旋转时延和数据传输等),如果该值超过20ms,一般认为会对上层应用产生影响。

I/O等待队列长度

等待时间(队列中排队的时间)

 

2.内存和CPU

监控指标:

CPU使用率

CPU空闲率(判断CPU是否瓶颈的方法1,运行队列大于CPU核数3~4倍)

内存使用率(判断内存是否为瓶颈,至少有10%的可用内存,内存使用率上限85%)

 

3.宿主操作系统

独立的虚拟化产品,VMware、Hyper-V

保留宿主操作系统中必须的进程

确保宿主操作系统上防病毒软件不要扫描虚拟硬盘与虚拟机相关的任何文件

宿主操作系统的处理器调度方法

空闲时间安排碎片整理

————————————————

版权声明:本文为CSDN博主「偶窝age」的原创文章,遵循CC 4.0 BY-SA版权协议,转载请附上原文出处链接及本声明。

原文链接:https://blog.csdn.net/weixin_37991446/article/details/108089819

 

posted @ 2023-03-24 14:13  天翼云开发者社区  阅读(121)  评论(0编辑  收藏  举报