问题现象:
现场反馈nodemanager频繁重启定位思路: 通过分析nodemanager日志,寻找重启原因,未发现有用的信息,因此考虑通过分析系统日志,系统日志主要包括以下两部分: /var/log/messages和/var/log/messages/dmesg.log,最终在dmesg.log中发现以下信息:
结论: pod真实需要的资源超过了物理机分配的资源,所以需要调整资源分配