- 服务器上架到机柜
- 基础设施监控
服务器温度,风扇转速 ipmitool命令,只能用在物理机存储的监控(df ,fdisk, iotop)
cpu(lscpu,uptime,top,htop,glances) 内存情况(free) 网络(iftop) - 应用监控
mysql redis
nginx
php-fpm
python
一个完善且理想的监控系统,得有如下特点
-
监控系统能够自定义监控的内容,自己通过脚本采集所需的数据
-
数据需要存入到数据库,日后对该数据进行分析计算
-
监控系统可以简易,快速的部署到服务器
-
数据可视化直观清晰
异常告警通知
-
可以定义复杂度告警逻辑,做到监控项之间的关联告警,例如程序之间的依赖检测,而不是只单独检测某一个目标
-
告警可以确认响应,让运维组内的人知道已经有人在处理告警问题了
-
告警内容可以自定义,能够写入一些简单的分析,便于运维人员直观了解数据,否则还得去服务器查看
-
报警后,可以预处理一些任务,如自我修复,重启,采集数据等
协同工作、
-
监控系统有强大的API,提供给研发同学调用,其他系系统调用
-
监控数据是开放性,数据结构主流,便于解析。
-
监控可视化可以简易的插件使用,而非复杂的js文件