基于监控服务打造微服务治理生态体系
基于上一篇《微服务海量日志监控平台》介绍的平台架构,继续架构的优化和能功的扩展,实现服务治理能力。
问题现状态
日志监控平台为我们带来了很多排查解决线上问题的便利。但是从某种程度上讲,只为我们提供了线索,最终的排查和解决还是需要人工去执行参与,所以从运维角度上说,并没有帮助解决问题。由于采集覆盖面和分析问题。监控方面也存在很多问题。大概归纳如下:
- 监控不全面
- 链路不全,缺少应用拓扑
- 无服务健康检测机制
- 缺乏深度分析能力
- 缺乏治理能力
- 人工运维
解决方案
针对现状,我们大致采取以下解决方案:
- 监控源多样化
业务数据、应用、中间件、网络设备、存储设备、物理机、虚拟机、容器、数据库、api等监控
- 丰富可视化内容
使用grafana和kibana提供分析和可视化的 Web 平台。可查找和交互数据,并生成各种维度的分析报表。增加应用拓扑、链路跟踪等可视化
- 服务健康检测
定期调用应用服务的接口检查服务的健康状况,当发现不可用的接口时立即告警并启用熔断功能;当发现异常节点应启动告警并移除该节点
- 实时分析、预测、告警
实时过滤清洗、多维分析采集数据,对当前发生异常进行分析、风险预判。并对分析结果决策告警通知并持久化
- 最终打造服务治理平台
结合现有的技术体系,打造服务治理平台,实现咖啡式运维
监控平台的优化
功能架构优化
多源监控
实时分析预
告警完善
更多可视化
优化扩展监控服务
打造服务治理生态体系
由于业务需求和技术的发展,平台使用的技术各种各样。当前我们的服务架构除了使用Zero Ice外,有的用到了springCloud。需要把这些服务统一对接到治理平台,达到治理能力,降低运维成本,提高版本迭代,实现故障快速定位、灵活资源调整等服务治理价值。
治理平台功能
打造服务治理生态体系
结合服务架构情况,一切从实际出发。围绕监控服务,打通其它管理、控制服务,如网关、配置中心等之间的通讯,形成服务治理生态圈。
【版权声明】
本文版权归作者(深圳伊人网网络有限公司)和博客园共有,欢迎转载,但未经作者同意必须在文章页面给出原文链接,否则保留追究法律责任的权利。如您有任何商业合作或者授权方面的协商,请给我留言:siqing0822@163.com