开发、运维过程中解决问题的通用步骤
在日常开发过程中,我们常常会遇到各种各样的bug,如果是开发阶段遇到问题,可以慢慢排查。但如果是线上的应用出现问题,那么每一分每一秒都是及其宝贵的。因此,我们需要更加快速地定位并解决问题。
本文章所介绍的就是自己在开发过程中总结出来的排查问题通用步骤。按照这些步骤来,可以更加快速地定位问题,让我们不至于手足无措。
一个问题的定位过程,整体上可以分为以下7步。
报错信息是我们的第一手资料,里面会列出错误的大致信息,例如错误码,错误文件名和行号。
通过错误信息我们可以定位到服务。
定位服务后,首先确定服务状态是否正常。这一步看似可有可无,但如果遇到了,你可能会傻里傻气地浪费几个小时查源码。
确定服务状态正常后,就可以确定是服务内部错误,那么接着就是定位日志。雅思词汇确定日志所在的文件夹、日志的名字(企业应用中日志有很多种类,通常按种类+日志命名)。
定位到日志后就可以分析日志了。通常的做法是自下而上地搜索报错信息或者错误码,这样可以最快地定位错误的位置。
定位到日志中错误的相信信息后,就可以结合业务逻辑分析出错原因。如果可能的原因有多个,则需要一一排查。
针对出错原因给出相应的解决方案。
上述步骤只是一个通用模板,不同的应用可能还有一些其他步骤,但大致的流程应该差别不大。