cpu负载告警处理
cpu负载告警首先排查cpu以及内存压力,若cpu以及内存压力并不大,则执行命令ps -eTo stat,pid,tid,ppid,comm --no-header | sed -e 's/^ *//' | perl -nE 'chomp;say if (m!^\S*[RD]+\S*!)'
使用ps
以及docker ps -q | xargs docker inspect --format '{{.State.Pid}}, {{.Id}}, {{.Name}}, {{.GraphDriver.Data.WorkDir}}' | grep xxxxxxxxx
获得负载异常的pod名称,重启该pod后执行watch w
观察负载是否已下降至合理范围
此问题通常是cpu io-wait过高导致,一般出现在网关、logstash等pod初始化读取数据时由于io读写负载骤增导致。