导航

随笔分类 -  架构

摘要:这篇文章是2017年6月 百度 谭待的分享, 对为什么应该有架构师委员会,以及如何工作讲的非常详细。 谭待 ,百度主任架构师,百度搜索架构整体技术负责人。 主要研究分布式系统和搜索引擎,是百度BVC代理计算和Matrix私有云的主要设计者,两获百度最高奖。 主持设计了百度新一代搜索架构,同时也主导了 阅读全文

posted @ 2021-12-24 11:20 蝈蝈俊 阅读(76) 评论(0) 推荐(0) 编辑

摘要:当我们设计复杂系统时,生产环境系统的可观察性是必须的,期望通过观察告诉我们什么时候,哪里出现了问题。平时了解服务运行状况。异常时,可发现服务故障,并定位故障原因。事后,对异常点做分析,看是否在高峰期发生,或者持续更久,是否会出事故,如何解决。运维黄金指标观察那些指标,按照《SRE:Google运维解密》中描述的, 监控的四个黄金指标如后: 延迟、流量、错误、饱和度。四类运维监控指标的监控项这四类监... 阅读全文

posted @ 2020-07-17 11:08 蝈蝈俊 阅读(2101) 评论(0) 推荐(1) 编辑

摘要:简单区分从事故、稳定方面简单理解如下:名词简单理解可靠性不出事故可用性不出事故 出事故后,快速止损稳定性解决故障问题基础上 服务持续稳定、性能稳定总体对比可用性可靠性稳定性英文AvailabilityReliabilityStability关注点关注的是服务总体的持续时间。系统在给定时间内总体的运行时间越长,可用性越高。关注系统可以无故障地持续运行的概率,关注的是故障率。故障的频率越高,可靠性越低... 阅读全文

posted @ 2020-07-13 17:13 蝈蝈俊 阅读(11260) 评论(0) 推荐(2) 编辑

摘要:内容在:http://chuansong.me/n/478502951177 PPT在:http://pan.baidu.com/s/1nvnOEBf 工具 跟 服务 的差别 从工具到服务之间缺失了哪些?工具可以各种方式使用;最常见的就是会出现工具滥用,比如这篇的提到的“Redis被开发人员滥用”、“冷热区分支持”,这些其实都可以靠管理规范解决。说白了,不管是有系统支持,还是人工审核,总之都... 阅读全文

posted @ 2016-08-05 16:32 蝈蝈俊 阅读(609) 评论(0) 推荐(0) 编辑