摘要:
背景 《SRE Google运维解密》里提到SRE自动化系统的一个bug导致几乎所有的数据中心机器被成功下线并进行硬盘擦除。当然这本书出版之后又业界也进行了很多的演进。在我们团队现在很难发生这样的事情。因为团队内人人要遵循的一个设计原则是:原则上禁止批量操作。如需批量,需要有审核流程。批量设置上限。 阅读全文
积分与排名
- 积分 - 450846
- 排名 - 1663
随笔档案 (241)
- 2023年7月(1)
- 2023年6月(1)
- 2022年4月(7)
- 2022年3月(5)
- 2022年2月(4)
- 2022年1月(7)
- 2021年12月(3)
- 2021年11月(8)
- 2021年10月(8)
- 2021年9月(3)
- 2021年8月(2)
- 2021年4月(2)
- 2020年12月(1)
- 2020年11月(4)
- 2020年10月(1)
- 2020年9月(4)
- 2020年6月(4)
- 2020年5月(3)
- 2020年4月(1)
- 2020年3月(1)
- 2019年10月(7)
- 2019年9月(3)
- 2019年8月(3)
- 2019年7月(1)
- 2019年6月(10)
- 2019年5月(8)
- 2019年4月(13)
- 2019年3月(13)
- 2019年2月(8)
- 2019年1月(3)
- 2018年12月(1)
- 2018年11月(1)
- 2018年9月(1)
- 2018年8月(7)
- 2018年7月(5)
- 2018年6月(5)
- 2018年5月(9)
- 2018年4月(3)
- 2018年3月(2)
- 2018年2月(4)
- 2018年1月(3)
- 2017年12月(1)
- 2017年11月(4)
- 2017年10月(3)
- 2017年9月(6)
- 2017年8月(5)
- 2017年7月(2)
- 2017年6月(8)
- 2017年5月(11)
- 2017年4月(8)
- 2017年3月(9)
- 2017年2月(4)
- 更多
最新评论
- 1. Re:工程师常用的6种最佳实践
感触颇深
- --SHANGUAN
- 2. Re:工程师常用的6种最佳实践
香蕉吧啦
- --IDOER
- 3. Re:工程师常用的6种最佳实践
受益匪浅
- --康凯1984
- 4. Re:系统设计的11个考虑
厉害拉
- --最菜的程序员001
- 5. Re:手撕spring核心源码,彻底搞懂spring流程
哈哈~已经关注公众号了
- --续断