一篇文章带你了解如何测试消息队列
是什么
探讨消息队列的测试,那首先就要了解消息队列是什么。
消息队列是一种应用程序之间传递消息的异步通信机制。这里传递的消息指的是需要传输的数据,可以是一些文本、字符串或对象等信息。
简述一下消息队列工作模式:
- 消息的生产者将数据存放到消息队列中,消费者进行接收处理。生产者和消费者分开,彼此不受影响
- 消息被储存在消息队列中,消息队列把数据进行持久化直到它们已经被完全处理,确保消息传递的可靠性和顺序性
- 消息队列可以有多个消费者,提高系统处理能力,支持快速水平扩展
用哪里
根据消息队列的特性,消息队列有以下几种最常用的应用场景。
异步处理
非实时的业务场景,可以采用异步处理来提高系统的吞吐量和响应时间。
系统解耦
通过消息队列,可以将不同系统或模块之间的依赖关系解除,使得它们可以独立地进行开发和部署。
消息队列能够隔离故障,当某个系统发生故障时,不会影响到其他服务,提高了系统的整体稳定性。
限流削峰
在大促、秒杀等活动中,瞬时流量可能会非常大,业务系统直接处理,就会压力太大就会导致大量系统异常,业务失败甚至系统崩溃。通过将请求信息保存到消息队列中,将压力转移到MQ中,并由后端服务异步处理这些存储在消息队列中的消息,可以有效地缓解系统压力。
怎么测
测试前:技术方案评审
QA在参与RD的技术方案评审中,就需要考虑以下三点:要不要用;用的地方合不合适;用哪款
要不要用消息队列
在系统设计中,需不需要使用消息队列,可以参考上文提到的消息队列最常用的应用场景中的一些场景。比如系统需要处理大量并发的请求,并且请求处理时间比较长,就可以使用消息队列进行一步处理。又或者系统多个模块之间需要通信,但是又不希望相互之间之间调用接口或者方法,就可以使用消息队列进行解耦。
当然,使用消息队列也会有一些挑战。
首先就是数据一致性的问题,数据一致性也是测试的一项重点。消费的重复消费、消息丢失、分布式系统中消息事务性和数据库操作一致性都会带来数据一致性的挑战。其次系统中使用消息队列是也会增加系统维护复杂性,同时也会增加一定的成本支出。
在实际的技术设计中,需要具体根据实际的业务场景判断是否使用消息队列。
消息队列应用的场景是否合理
在技术评审中,QA要根据实际的业务场景,思考设计方案中的消息队列中使用场景是否合理。
使用的消息队列产品是否合理
消息队列也有不同的产品,我们在使用消息队列时,也需要根据我们的业务场景选择合适的场景。常用的消息队列产品有三类,分别是基于内存的消息队列、基于磁盘的消息队列、分布式消息队列。
Kafka适合大规模数据处理,RabbitMq适合轻量级应用,等等。具体可以根据自己的业务特性来选择。
测试中:业务中测试
是否能传达
消息发送
- 不同类型(如文本、字符串、二进制数据等)的消息能否成功发送到队列
- 消息属性的是否生效,比如过期时间
- 消息发送频率控制,验证系统能否处理高频率的消息发送
消息接收
- 消息队列的连接测试
- 消息接收的确认
- 消息接收的顺序性
是否能正常传达
消息的重发机制
- 消息重发机制:故意使消费者接收消息失败,检查消息队列是否能够自动重发消息
- 参数设置是否有效:测试重发次数、重发间隔等参数的设置是否有效
- 幂等性处理,为防止消息重复处理,系统需实现幂等性,确保消息多次重发不会影响业务逻辑。
消息的防丢失验证
- 消息队列应确保消息在系统重启后能够从存储中恢复,保证消息不丢失
- 摸拟故障场景,验证消息队列在系统故障后能否正确恢复消息状态,保证数据一致性
是否能高性能传达
吞吐量
- 消息处理速率:衡量消息队列在单位时间内能处理的消息数量,反映系统处理消息的能力。
- 并发用户:测试在不同并发用户数下,消息队列的吞吐量表现,确保系统稳定运行。
- 系统资源占用:监控在高吞吐量下系统资源(如 CPU、内存)的使用情况,评估资源效率。
延迟处理
- 在不同压力下,消息从发送到被处理的平均时间,确保有消息队列的链路能满足整个系统的需要
- 网络传输延迟,消息在不同网络条件下,测试从发送端到接收端的延迟时间,从而评估网络对消息队列的影响
- 在高负载的压力下,测试消息队列的延迟,确保高压力下系统的稳定性
可扩展性测试
- 水平扩展
- 在高负载情况下,增加消息队列的节点数量,测试系统的性能和吞吐量能否线性提升
- 垂直扩展
- 提升单个节点的硬件资源,观察消息队列的性能变化
是否能安全传达
- 数据加密
- 选择合适的加密算法,既能确保数据传输和存储的安全性,又能不过多消耗资源
- 消息防篡改,验证消息在传输和存储过程中是否能够防止被篡改
- 访问控制
- 权限和角色控制,被授权的用户和角色才能访问消息队列资源
测试后:监控报警配置
在上线之前,为确保系统稳定运行,需与研发(RD)及产品团队紧密协作,统一报警配置,并制定详尽的紧急情况应对标准操作流程(SOP)。此过程中,质量保障(QA)团队将负责核对监控报警系统,确保已配置与消息队列相关的监控项及报警机制,并验证其有效性。监控内容应全面覆盖,包括但不限于消息队列的每秒查询率(QPS)、服务器的性能指标等关键信息。针对这些监控指标,QA团队和RD团队协作需合理设定阈值,并配置相应的报警规则,以便及时发现并响应潜在问题。