摘要: 作业是一系列运维操作的抽象定义,任何一个运维操作都可以分解成一步一步的操作步骤和操作对象,不论是发布变更还是告警处理,都是可以分步骤的。 命令: 一个可以独立的操作,最简单的如关服、开服、执行 xx 脚本等;文件分发: 把指定的文件分发到目标机器的目标路径;作业: 一系列命令、文件分发的有序组合,作 阅读全文
posted @ 2020-10-28 17:34 muzinan110 阅读(202) 评论(0) 推荐(0) 编辑
摘要: 那我们做运维平台的意义在哪里呢?对内价值就是降低了多少故障率、提升了多少工作效率、节约了多少人力资源等;最好是不仅将其定位为一个内部辅助系统,需要将其和业务侧的墙打破,介入业务发展的生命周期,这样做才能将运维价值最大化地变现。 运维平台中和业务运营相关密切的功能模块一般有数据分析、弹性伸缩(辅助运营 阅读全文
posted @ 2020-10-28 17:28 muzinan110 阅读(309) 评论(0) 推荐(0) 编辑
摘要: CMDB 的设计有一个最大的误区是想建立一个大而全的属性表,恨不得想把全部运维对象的全部属性都找出来,比如:从零散的运维对象来拼凑 CMDB 基本都是吃力不讨好的,因为这样的设计方式根本没有从业务出发。而真正能解决业务问题的 CMDB 必须回到业务上面来,从核心的三层关系开始组建 CMDB,这三层概 阅读全文
posted @ 2020-10-28 17:25 muzinan110 阅读(594) 评论(0) 推荐(0) 编辑
摘要: 监控系统三要素Metrics 的特点:它自己提供了五种基本的度量类型 Gauge、Counter、Histogram、Timer、Meter。Tracing 的特点:提供了一个请求从接收到处理完毕整个生命周期的跟踪路径,通常请求都是在分布式的系统中处理,所以也叫做分布式链路追踪。Logging 的特 阅读全文
posted @ 2020-10-28 17:15 muzinan110 阅读(1121) 评论(0) 推荐(0) 编辑