07 2022 档案

摘要:本文是一篇比较有价值的、介绍SRE的文章。国内的所谓SRE职责其实并不明确,大部分其实还是干普通运维的事。但文中介绍的谷歌的运作方式起点还是相对比较高的,无论对SRE、对开发,甚至对公司都有很高的要求。正如本文所述,谷歌的方式并不一定适合其他公司,但其SRE的建设经验仍然能够带来一定的启发。在阅读本 阅读全文
posted @ 2022-07-22 13:36 charlieroro 阅读(988) 评论(0) 推荐(0) 编辑
摘要:Airbnb的动态kubernetes集群扩缩容 本文介绍了Airbnb的集群扩缩容的演化历史,以及当前是如何通过Cluster Autoscaler 实现自定义扩展器的。最重要的经验就是Airbnb是如何一步步演化到当前架构的,其驱动因素又是什么。 译自:Dynamic Kubernetes Cl 阅读全文
posted @ 2022-07-20 13:30 charlieroro 阅读(554) 评论(0) 推荐(0) 编辑
摘要:通过memberlist库实现gossip管理集群以及集群数据交互 概述 memberlist库的简单用法如下,注意下面使用for循环来执行list.Join,原因是一开始各节点都没有runing,直接执行Join会出现连接拒绝的错误。 package main import ( "fmt" "gi 阅读全文
posted @ 2022-07-12 09:04 charlieroro 阅读(1872) 评论(0) 推荐(1) 编辑
摘要:简单聊聊运维监控的其他用途 说到监控,一般都会聊到这三个基本维度:metrics、log和tracing,以及这几种常用的工具:Prometheus+grafana+alertmanager、ELK、jaeger。 监控通常来展示应用或集群的运行状态,配合告警来达到维护系统稳定性的目的。但除此之外, 阅读全文
posted @ 2022-07-02 22:55 charlieroro 阅读(629) 评论(0) 推荐(0) 编辑