摘要: > 作为运维工程师,了解并利用常用的技术网站可以极大地提高工作效率和解决问题的能力。本篇整理了一些常用的技术网站,有的可能需要才能访问。这些网站提供了各种与运维相关的资源、工具和社区支持,包括技术文档、教程、工具、社区讨论等: ### 1. Stack Overflow 这是一个广受欢迎的技术问答社 阅读全文
posted @ 2023-06-25 17:17 不背锅运维 阅读(640) 评论(0) 推荐(0) 编辑
摘要: > 当K8S发生故障时,往往需要迅速而精确地定位问题,并及时采取行动。那么,当遇到K8S故障时,应该从哪几个方面入手排查问题呢?本篇就来聊聊这个话题,让我们一起来探寻关键的排查方向。 # 第一方面:审视集群状态 K8S的集群状态是排查故障的关键起点。使用kubectl get nodes命令来检查节 阅读全文
posted @ 2023-06-25 17:11 不背锅运维 阅读(95) 评论(0) 推荐(0) 编辑
摘要: > 所谓的“不背锅”,我希望强调的是运维工程师应该避免因自身问题所带来的过度承担责任和不必要的风险,欢迎留言并留下你的看法。 下面总结的几点: 1. 清晰的职责边界 1. 定期维护好运维文档 1. 临时修改配置文件也要做好备份 1. 定期备份重要数据 1. 发布变更到生产之前一定要发布到测试环境严格 阅读全文
posted @ 2023-06-25 17:05 不背锅运维 阅读(54) 评论(0) 推荐(0) 编辑