OpenStack 虚拟机监控方案确定
Contents [hide] |
---|
监控方案调研过程
选择监控方案:
1. 虚拟机里内置监控模块
测试collectd+rrdtool,获取到比较好的监控效果,但是collectd生成的rrd文件是以主机名作为监控存储目录的,如果在openstack中有2个以上的机器相同名字,存储到ceph中将是一个问题。并且需要在主机中开启该agent服务。可变因素过多(如用户禁用该服务)。
2. 通过libvirt获取虚拟机数据监控。
a.测试openstack的自待组件ceilometer
使用过程中获取到实例的cpu,磁盘读写,网络读写数据。但是没有内存,磁盘空间数据。缺点一。在dashboard中实现后发先,请求超时严重,缺点二。
b. sina的kanyun
使用过程中获取到数据不正确。cpu使用率,内存使用率均不正确。
c. 我们自己根据libvirt的api开发cpu使用率,内存使用率,磁盘空间,磁盘读写,网络出入。
工作量过大,还有风险是:对cpu使用率的计算公式,共存的使用率计算公式(查看当前python的libvirt的api并没有已使用内存接口,可能为libvirt版本问题)等都需要熟悉,对计算数值的验证准确度都需要验证.
d. 天成云的监控方案
该方案为collectd+libvirt+rrdtool+cgp,该方案之前能监控虚拟机的CPU使用率,网络出入,磁盘读写,负载。有良好的图表呈现。