第九章 故障排除
成功排除故障的十个步骤
1.定义问题,建立一个清晰的问题陈述,目标是获取技术问题和成功标准的一两句摘要。
2.确定问题的影响,企业利益相关者不会知道技术细节,你需要确定问题所造成的财物影响。
3.占用正确的资源,可能是内部资源或者外部资源,以便问题得到有效的技术和人力支持。
4.确定潜在的原因,会见所有必要的各方,陈述问题和任何故障排除的步骤。
5.规划和协调整个团队的工作,指定计划列出每个可能导致问题的假设和一些场景,让相关有经验和技术的人去验证或推翻假设。
6.选择一个沟通计划和审查,写好文档,对谁将继续管理,最终用户和技术团队达成一致。
7.确定根本原因,经过多次可重复孤立的迭代,应该可以推翻或验证一些假设,并进一步找到解决方案。
8.确定解决方案,确定和定义解决方案,理解问题的原因。
9.测试和实施,即使在测试或预生产环境不存在这些问题,也要在那些环境中实施修复方法,做好版本回退方案。
10.审查,事后分析将有助于防治问题进一步复发或未来出现的新问题。