DEVOPS与SRE思想感想初稿
DEVOPS: 促进开发、技术运营、质量保障部门之间的沟通、协作。整合DEV(开发)和 IT运维(OPS)之间通过自动化交付产品和架构变更,使得构建、测试、发布能更快捷、频繁可靠。
SRE:网站可靠性工程师,从字面意思来理解,就是保障网站、现有服务的稳定运行。
在DEVOPS基础上,将SRE的思想与之相结合,二者互补,通过打破内部组织之间的障碍,更快地交付更稳定的产品:
1.内部组织间的壁垒,可以利用交互工具打破,通过工具确保大家最终的想法跟做法一致(比如会议沟通,大家的思维很发散,但是会议要记录最终结果,挨个确认,白字黑字最具有权威性,避免日后忘记造成的意见不一致)
2.线上故障不可能完全避免,重点关注故障的发生,最大力度制定措施避免下次再犯(通过故障回溯,总结故障后制定应对方案)
3.迭代方式要基于本公司的情况,选择对现有业务影响泛微最小、回滚最快的方式(基于客户的最优体验层面考虑,制定一系列的方案【什么时间发布、发布后出现问题的实时响应等】,代码迭代的目的是为了修复现有的不足,让客户更加信赖和喜欢我们的产品,这一宗旨不可偏离)
4.利用自动化工具减少手工劳动力(脚本、第三方开源工具、自己开发的工具,只要利于自己工作的都可以借鉴)
5.上线后在测试过程中,衡量系统稳定性、可靠性(查看监控,设定告警上限指标)