摘要: 背景 最近组内有一些关于系统监控与报警的讨论!一些同学觉得现在系统的error log太多了,由于每次打印error log,都会导致一次报警,导致每天都会收到大量报警,报警的噪声很大,很容易忽略有价值的报警。 下面是这次讨论的一些想法: 1. 应该在代码开发阶段,对error log慎重打印,只在 阅读全文
posted @ 2019-09-17 18:54 xsirfly 阅读(266) 评论(0) 推荐(0) 编辑
摘要: 背景 在kafka的消费者中,如果消费某条消息出错,会导致该条消息不会被ack,该消息会被不断的重试,阻塞该分区的其他消息的消费,因此,为了保证消息队列不被阻塞,在出现异常的情况下,我们一般还是会ack该条消息,再另外对失败的情况进行重试 目标 实现一个完善的重试逻辑,一般需要考虑一下几个因素: 1 阅读全文
posted @ 2019-09-17 14:21 xsirfly 阅读(6009) 评论(0) 推荐(0) 编辑