高并发系统设计(二十四):服务端监控要怎么做?
除了运维团队对于机器CPU、内存、磁盘、网络等基础监控,还要完成应用程序对数据库的链接、服务报错异常、以及请求超时等问题能做到及时发现。
监控四个指标
分别是延迟,通信量、错误和饱和度。
-
延迟指的是请求的响应时间。比如,接口的响应时间、访问数据库和缓存的响应时间。
-
通信量可以理解为吞吐量,也就是单位时间内,请求量的大小。比如,访问第三方服务的请求量,访问消息队列的请求量。
-
错误表示当前系统发生的错误数量。这里需要注意的是, 我们需要监控的错误既有显示的,比如在监控Web服务时,出现4 * *和 5 * *的响应码;也有隐示的,比如,Web服务虽然返回的响应码是200,但是却发生了一些和业务相关的错误(出现了数组越界的异常或者空指针异常等),这些都是错误的范畴。
-
饱和度指的是服务或者资源到达上限的程度(也可以说是服务或者资源的利用率),比如说CPU的使用率,内存使用率,磁盘使用率,缓存数据库的连接数等等。
除了以上细节上的监控之外,还有一些监控开源了解下
监控手段还是不少的,Grafana 连接时序数据库,Skywalking,CNCF Prometheus等,APM系统 另外还可以结合Nginx、 Flume 、Kafka 、ELK 等日志收集做自己的系统分析
分类:
高并发架构系统学习
【推荐】国内首个AI IDE,深度理解中文开发场景,立即下载体验Trae
【推荐】编程新体验,更懂你的AI,立即体验豆包MarsCode编程助手
【推荐】抖音旗下AI助手豆包,你的智能百科全书,全免费不限次数
【推荐】轻量又高性能的 SSH 工具 IShell:AI 加持,快人一步
· Linux系列:如何用heaptrack跟踪.NET程序的非托管内存泄露
· 开发者必知的日志记录最佳实践
· SQL Server 2025 AI相关能力初探
· Linux系列:如何用 C#调用 C方法造成内存泄露
· AI与.NET技术实操系列(二):开始使用ML.NET
· 被坑几百块钱后,我竟然真的恢复了删除的微信聊天记录!
· 没有Manus邀请码?试试免邀请码的MGX或者开源的OpenManus吧
· 【自荐】一款简洁、开源的在线白板工具 Drawnix
· 园子的第一款AI主题卫衣上架——"HELLO! HOW CAN I ASSIST YOU TODAY
· Docker 太简单,K8s 太复杂?w7panel 让容器管理更轻松!
2018-10-23 redis队列实现