一个不用的域名到期导致整个服务器上其他网站都无法访问的线上事故
一大早接到小伙伴反应说网站打不开了,第一反应是打开浏览器输入一下网址看看,果然无法访问了,出大问题了。
打开服务器,上线进行排查,CPU,内存使用稳定,没有异常。
任务管理器一看nginx不在了,重启nginx以为万事大吉。生产事故轻轻松松搞定。结果网站还是无法访问,怎么可能呢?任务管理器里面还是没有nginx的进程。
这下慌了,不应该啊。 最近没有上来动过nginx的配置,怎么就启动不起来呢,再试几次还是不行。 找log。。。
打开nginx的log,找到error.log文件,打开一看
host not found in upstream "www.chunjuyouth.com" in E:\nginx\conf/nginx.conf:66
映入眼帘的是这个域名,最近到期了,问过boss,这个域名不用了,不要续费了,于是就一直没管这个事,今天这个域名解析被取消掉了,nginx尝试访问上游系统,做域名解析的时候就报错了,于是甩了一个error日志后自己就关闭了,关闭了,关闭了。。。。
太不友好了吧,竟然自己挂了,给个error日志,其他网站你继续给我转发啊,赶紧找到这个网站对应的配置文件,删除这段配置,重启nginx,一切正常。