摘要:
。。。 阅读全文
摘要:
SRE的根基起码应该包括:SLO、监控、告警、减少琐事和简单化。 SLO(服务质量目标):用于描述服务可靠性的程度。 SRE的职责并不只是将“所有工作”都自动化,并保持“on-call”状态。 一.入门 系统成熟度级别划分: 1.一个处于开发中的绿地应用,目前还没做过任何生产部署。 2.一个生产系统 阅读全文
摘要:
问题: 1.已知的那些所谓最佳实践方案都高度依赖于环境,无法进行广泛的应用。运维团队的工作该怎样良好的开展,也是一个尚未解决的大问题; 2.业界经常将运维视为一个成本中心,想要取得实质性的改变变的举步维艰; 3.上述原因推动了IT领域的工作改革,解决这些问题的最新方案有了两个独立的称谓-DevOps 阅读全文
摘要:
致力于设定清晰的、量化的服务承诺 通过有限的监控指标,持续地觉知上述化数值 轮值人员时待命,以保障实现所做出的服务目标承诺,同事避免过度人为干预,谨防自动化形同虚设 阅读全文