实现Kubernetes可观测性的3个最佳工具

     一个管理和实施得当的可观测性系统为DevOps提供了细化的洞察力,可用于调试和治愈复杂系统。可观察性将监控、警报和日志与指标可视化及其分析相结合。它允许开发团队详细了解Kubernetes集群和应用程序的实时性能,以便他们能够做出及时和明智的行动。在这篇博客中,我们已经讨论了实现Kubernetes可观察性的三个重要工具。让我们一起来看看吧!

Kubernetes的蓬勃发展
       今天,容器和微服务正在成为灵活的混合云战略的基石。Kubernetes已经彻底改变了容器在公有云和私有数据中心的部署和生命周期管理。它的影响如此深远,以至于最初,Kubernetes被认为是软件生命周期管理的 "万能"。

Kubernetes的动态性质
     然而,事情已经发生了变化。现在,业界最初对Kubernetes的 "炒作 "已经有所平息,很显然,Kubernetes的采用可能是一个艰难的过程。考虑到微服务和容器是云原生难题的一个关键部分。另一部分也是利用其所有好处必须破解的。企业在踏上云原生旅程之前,必须了解这些系统是如何整体运作的。Kubernetes,由于其动态性质,是不可预测的。尽管做出了最大的努力,但这种系统的故障和性能瓶颈是不可避免的,而且可能难以分离。在这样一个复杂的环境中,深入了解企业应用程序的行为变得至关重要,以便立即解决错误和问题,实现无缝和快速的应用程序交付。但是,一个更大的挑战是如何监控Kubernetes集群及其组件。

可观察性的重要性--3个主要支柱
      IT决策者和技术战略家认为,可观察性在软件开发生命周期的计划和操作阶段发挥着重要作用。可观察性的三大支柱--指标、日志和追踪,不仅帮助团队获得对Kubernetes环境的可观察性,而且还为他们提供了对底层基础设施的深入了解,无论使用何种技术栈。根据New Relic关于可观察性的采用和预期趋势的2021年可观察性预测报告,83%的企业同意,最佳的Kubernetes可观察性战略的枢纽是部署一个能够自动收集和关联来自所有可用来源的可观察性数据的解决方案。这说明企业需要一种非侵入性的、无摩擦的方法来跟踪观察能力,以管理云原生堆栈。

      这里有三个重要的Kubernetes可观察性工具,它们已经成为云原生社区内企业的事实行业标准。这些Kubernetes监控工具的实施将为DevOps和SRE团队提供维护Kubernetes环境所需的集群组件的完整可见性。

普罗米修斯--自动收集和存储可观察性数据

      Prometheus是一个开源的监控和警报工具,可以深入了解系统的性能。它是一个云端原生的时间序列数据存储,有一个内置的指标查询语言。该工具内置了对Kubernetes和容器的支持。它可以使用Kubernetes运营商在Kubernetes中轻松运行,也可以以独立模式运行。

     Prometheus使用导出器将第三方数据引入其数据存储。有许多现成的导出器作为普罗米修斯的一部分进行维护。这些包括。
-用于Prometheus的Elasticsearch统计数字exporter 。
-用于MySQL服务器指标的exporter 。
-以及用于Prometheus的Kafka exporter。

     Prometheus从Kubernetes节点、容器、pod、服务和运行在Kubernetes中的用户应用程序中刮取指标。为了让Prometheus从应用程序中刮取指标,开发人员需要通过HTTP在指标端点暴露指标。Prometheus使用高效的PromQL查询语言,并与主要数据库和指标收集器代理(如Elasticsearch和Metricbeat)集成。

在某些情况下,团队需要监控那些不能报废的组件。使用Prometheus推送网关(Prometheus的一个组件),团队可以为极其简短的工作收集指标,并将时间序列直接推送到Prometheus数据存储中。

    普罗米修斯由相互关联的组件组成,其中包括:

普罗米修斯服务器。它作为系统的 "大脑",收集各种指标并将其存储在一个时间序列数据库中。
普罗米修斯客户端库。这些帮助用户通过以Prometheus能够理解的格式发送指标和数据来整合他们建立的服务。
Prometheus Alertmanager。这个Prometheus组件在工具检测到异常情况和性能问题时向指定用户发送警报和通知。
普罗米修斯可视化工具。这些有助于以人类可读的格式显示指标和数据。用户还可以将普罗米修斯与Grafana集成,Grafana是一个用于分析和数据可视化的开源网络应用。

      用Prometheus收集数据有助于DevOps团队对完整的基础设施和在Kubernetes集群中运行的容器进行细致的了解。为了确保Kubernetes集群在生产中的高效性能,产品团队必须实时了解各种指标,了解各种问题,如内存或存储短缺、节点、网络健康、应用程序错误等。

通过深入了解应用程序的组件使用情况,这个K8s监控工具有助于跟踪应用程序的性能,以确定瓶颈和摆脱瓶颈的方法。

dzone-1

Grafana-可观察性数据的可视化
有时,原始指标(未经处理的数据)并不能为可观察性数据的可视化提供最佳服务。原因是它们通常由时间序列和基于文本的数据组成,其中有成千上万的事件,人类无法解读。

Grafana是一个可以轻松部署在Kubernetes中的可观察性平台,通过处理原始指标来帮助解决这个问题。根据Grafana的文档,这个工具 "允许团队查询、可视化、警报和理解指标,无论它们存储在哪里"。Grafana通过其官方和社区建立的仪表盘来管理和执行所有这些。这些仪表盘可以被下载并导入Grafana实例中。

Grafana是一个强大的数据可视化和分析工具,支持警报和通知。该工具与主要的时间序列数据库(Prometheus、InfluxDB)、Elasticsearch、SQL数据库、云监控服务等都有集成。它通过指标聚合和强大的仪表盘进行操作,使Kubernetes的观察能力成为一项简单的任务。

你可以在这里阅读更多关于Grafana、它的组件以及如何监控Kubernetes集群的信息。

dzone-2

BuildPiper--全面了解Kubernetes集群的情况
       BuildPiper是一个Kubernetes和微服务应用交付平台,提供Kubernetes集群的360度视图。通过BuildPiper,整个Kubernetes集群的可见性和异常检测被重新设计,让团队在简单的几次点击中获得深入的分析。

这个Kubernetes监控工具有一个服务概览仪表板,使DevOps团队能够查看和观察构建和部署的细节,还有一个服务Kubernetes仪表板,提供深入的集群观察能力,监测性能、健康状态、CPU和内存分配、节点可用性、日志和其他重要指标。所提供的360度视图清楚地显示了集群组件的性能、健康状态、可用性和功能。它提供了完整的节点可视性,以便能够查看节点的健康状态。吊舱健康功能显示容器的实时健康状态,突出环境变量和K8s集群中存在的吊舱的体积挂载。 此外,在这个监控工具的帮助下,团队可以跟踪NameSpaces、Ingress和Kubernetes集群的其他K8s资产的实时状态。

dzone-3

Kubernetes是强大的,但需要管理和做好监测
      由于Kubernetes的短暂性和不断变化的性质,Kubernetes监控系统要求有能力自动识别变化,并持续监控事件、日志、pod健康状态等,不受任何干扰。探索如何监控Kubernetes集群的解决方案,了解寻找故障的指标,扫描集群健康状态,并找出解决这些问题的方法,是企业经常面临的一些常见问题。 因此,在选择Kubernetes部署平台或Kubernetes监控工具时,重要的是你选择的解决方案要有能力跟踪这些指标,并清楚地说明集群内部到底发生了什么,以实现无忧的Kubernetes部署。


今天先到这儿,希望对云原生,技术领导力, 企业管理,系统架构设计与评估,团队管理, 项目管理, 产品管管,团队建设 有参考作用 , 您可能感兴趣的文章:
领导人怎样带领好团队
构建创业公司突击小团队
国际化环境下系统架构演化
微服务架构设计
视频直播平台的系统架构演化
微服务与Docker介绍
Docker与CI持续集成/CD
互联网电商购物车架构演变案例
互联网业务场景下消息队列架构
互联网高效研发团队管理演进之一
消息系统架构设计演进
互联网电商搜索架构演化之一
企业信息化与软件工程的迷思
企业项目化管理介绍
软件项目成功之要素
人际沟通风格介绍一
精益IT组织与分享式领导
学习型组织与企业
企业创新文化与等级观念
组织目标与个人目标
初创公司人才招聘与管理
人才公司环境与企业文化
企业文化、团队文化与知识共享
高效能的团队建设
项目管理沟通计划
构建高效的研发与自动化运维
某大型电商云平台实践
互联网数据库架构设计思路
IT基础架构规划方案一(网络系统规划)
餐饮行业解决方案之客户分析流程
餐饮行业解决方案之采购战略制定与实施流程
餐饮行业解决方案之业务设计流程
供应链需求调研CheckList
企业应用之性能实时度量系统演变

如有想了解更多软件设计与架构, 系统IT,企业信息化, 团队管理 资讯,请关注我的微信订阅号:

MegadotnetMicroMsg_thumb1_thumb1_thu[2]

作者:Petter Liu
出处:http://www.cnblogs.com/wintersun/
本文版权归作者和博客园共有,欢迎转载,但未经作者同意必须保留此段声明,且在文章页面明显位置给出原文连接,否则保留追究法律责任的权利。 该文章也同时发布在我的独立博客中-Petter Liu Blog。

posted on 2022-07-09 17:56  PetterLiu  阅读(503)  评论(0编辑  收藏  举报