最近有点忙,加上数据库好久没有问题了,没有检查数据库的备份情况,今天一检查,我的妈呀。。9天没有备归档了,3T的日志,asm存储中空间刚好3T多,再拖一天归档空间就满了,好几个生产系统就死翘翘了!!真是后怕呀,差点一身冷汗。。
赶紧找原因,为什么每天的定时归档没有执行呢,定时任务是正常的呀,查看每天的备份日志,发现14到23号之间没有记录,实在想不出来为什么,甚至想到不是有人把我的定时任务停了一段时间,但想不出这样修改的理由。。
先上网搜索一番。。为什么crontab不执行了,出来的大多是因为环境变量没设置、权限不对等,但我的定时任务已经正常执行了好久了呀。。还是检查crontab运行日志吧,vi /var/log/cron,发现日志中FAILED to authorize user with PAM (Authentication token is no longer valid; new one required),提示授权无效,突然想到昨天操作系统oracle密码提示过期修改了一下,呜呜。。真相大白!!
总结:1.日常巡检不到位,还是得赶紧做个自动巡检工具。
2.数据库管理不规范,没有关于asm的空间告警。
3.oracle密码过期后会导致crontab 定时任务执行失败。