常见监控简介
一 监控架构
1.1 组成
客户端:数据采集部分
服务端:数据存储分析告警展示
1.2 采集模式
被动模式:服务器端到客户端采集数据,对服务器的开销较大,适合小规模的监控环境。
主动模式:客户端主动上报数据到服务器端,对服务器的开销较小,适合大规模的监控环境。
1.4 协议
专用客户端采集
公用协议采集:SNMP/SSH/Telnet
1.5 架构
C/S架构:被监控节点较少,产生的数据较少。
C/P/S架构:被监控节点较多,监控类型复杂,产生的数据和网络连接开销很大,跨地域等环境下。
二 常见监控软件
流量监控:MTRG、Cacti、SmokePing、Graphite等
性能告警:Nagios、Zabbix、Zenoss、Core、Ganglia、OpenTSDB等
三 常见监控内容
监控项目
|
描述
|
主机监控
|
CPU、内存、磁盘的剩余空间/利用率和I/O、SWAP使用率、系统UP时间、进程数、负载
|
网卡监控
|
Ping的往返时间及包成功率、网卡流量,包括流入/流出量和错误的数据包数
|
文件监控
|
监控文件大小、Hash值,匹配查询、字符串存在与否
|
URL监控
|
监测制定URL访问过程中的返回码、下载时间及文件大小,支持内容匹配
|
应用程序
|
端口和内存使用率、CPU使用率、服务状态、请求数、并发连接数、
消息队列的字节数、Client事务处理数、Service状态等
|
数据库
|
指定的表空间、游标数、Session数、事务数、死锁数、缓冲池命中率、库Cache命中率、
当前连接数、进程的内存利用率等性能参数
|
日志
|
错误日志匹配,特定字符串匹配
|
硬件
|
温度、风扇转速、电压等
|
四 其他需求
4.1 时间需求
监控系统应根据实际情况,实时/非实时的采集和展示数据,包括历史趋势数据展示、分析,容量报表、可用性报告等。
4.2 告警需求
支持多种方式,邮件、短信、IM和其他接口,具有可定制化功能。
只是对告警内容分析自动处理,防止误报、漏报、抖动等。