关于计划任务的一个小需求

关于计划任务的一个小需求

  周五临下班的时候,领导给我下发了一个需求。因为最近搞应急演练的预案,提到这玩意,他还要我弄个PPT来说明= =(作为好几年没写过PPT的我,真的有点当场想把他祭天的想法,内心戏拉满。。。算了,上班再搞吧)

  这是一个技术需求,所以听到还是内心很平静的,想想也是有必要。至于PPT就。。。提到都是泪,明天做咯

  之前做了网站的很多监控脚本,最最最重要,也是他最最最关心的是 ——》 防内容篡改的监控!(当然实际是监控脚本其实他都想做起来的)。

  目前就有一个风险:如果挂上去的定时脚本没有运行了,或者中途异常退出了,那么我们是收不到报警说脚本是没有跑的,还会认为应用系统完全没有问题!!

  crontab 没有如期执行,有可能是因为账号密码过期(这个遇到最多),会导致当前账号下的计划任务都不会执行。又或者,计划任务进程莫名其妙挂了,不管你是超管还是普通用户,全部定时脚本,全部瘫痪,这个也遇到过。

  我心中大概有解决方法的,但是觉得肯定有更佳,更好的办法的,所以希望集思广益,有兴趣探讨的朋友可以给我留言。

  先说说我想到的解决方法(还没做,估计要等后天也就是周二,才有时间做)。明天先做PPT且还有个文档要我写(运营的家伙说没空)

  初判每个监控脚本一天要跑多少次,譬如一小时跑一次的,那每次成功跑完一次,就把当前时间,及一条成功跑脚本的记录写到一个文件上(eg,2021年1月31日 xx时xx分,xx脚本成功跑完)。然后第二天或者当天快结束的时候,用另一个脚本去查看这个文件有没有达到预期写入的时间记录数,也就是一天应该是有24次的记录,但是发现少了,那就是有个时间点没跑,就要发没跑脚本的监控了。这个脚本我想着应该是放到另外一台机器上比较好,跟这跑监控脚本的机器是同一网段的,而且比较可靠的服务器去调,当然也可以做两手准备,本机和另外的机器一起搞。现在也是个初想,要写完脚本测试过才知道难易程度。

  至于计划任务的进程死掉导致定时任务没跑的情况,肯定不能是本机去写脚本去发现了,得用另外的机器去调(也是内网能通)

  好了,先说到这里,等做完再补具体代码哈~~~

  

 

  

posted @ 2021-01-31 19:14  windysai  阅读(71)  评论(0编辑  收藏  举报