PBS ERROR: torque spool filesystem full
查看/var/spool/torque/发现所谓的spool filesystem并未占据太多存储,于是尝试重启pbs_mom
systemctl restart pbs_mom
但重启无效,pbsnodes依然显示问题节点ERROR: torque spool filesystem full
原因在于,产生了pbs_mom僵尸进程(zombie),导致无法重启,查找pbs_mom僵尸进程,并kill掉
ps aux|grep pbs_mom
再启动即可
systemctl start pbs_mom