隐患——redis-py的blpop可能由于网络波动导致收不到信息

我们在使用Redis做消息队列的时候,常常使用列表这个数据结构,并写出如下的代码:

复制代码
import redis

import time



client = redis.Redis()

while True:

    data = client.lpop('key')

    if not data:

        time.sleep(5 * 60)

        continue

    parse(data)
复制代码

这个意思是说,如果Redis的名为 key的列表里面有数据,那么就不停取出来,并把取出的数据传入 parse函数进行处理。如果列表里面没有数据,那么就等待5分钟再次检查。

这种方式,如果列表始终为空,那么将会每5分钟检查一次。

但使用这种方式有一个问题,例如刚刚检查完列表发现是空的,程序开始等待5分钟。但是检查完成的1秒以后,新信息抵达列表。此时信息无法被立刻消费,必需要等满5分钟才行。

为了解决实时性的问题,使用了列表的阻塞式弹出命令 blpop,于是代码变为:

复制代码
import redis



client = redis.Redis()

while True:

    data = client.blpop('key')

    parse(data[1])
复制代码

如果列表里面没有数据,程序就会卡在 data=client.blpop('key')这一行,直到列表里面有了新的数据,再立刻弹出送进后面的逻辑。

这种方法在测试的时候完美运行,于是就放到了生成环境使用。

一个周末过去了,周一上班时,同事反馈写到Redis里面的信息不能被正常消费了。

但是我发现程序正常运行,并没有出现任何异常。

于是我找 redis-py的作者 AndyMcCurdy询问原因,他给我的回复如下图所示。

 

 

 

意思是说,在使用 blpop的时候,如果中途因为网络波动或者某些其他原因导致连接池失效,那么就永远接收不到信息了,虽然 redis-py有连接状态检查的功能,但是由于程序是阻塞的, redis-py的连接状态检查功能不能正常使用。

为了解决这个问题,就需要 blpop的超时功能。让 blpop每几分钟就断开,检查一下网络,再重新连上。

于是代码变为:

复制代码
import redis



client = redis.Redis()

while True:

    data = client.blpop('key', timeout=5 * 60)

    if not data:

        continue

    parse(data[1])
复制代码

设置超时时间为5分钟,如果5分钟内列表没有收到信息(无论是真的列表一直没有数据,还是连接池断开了),都会返回 None,此时只需要重新执行 blpop,在执行的瞬间会检查连接的状态,如果连接池有问题,那么它会重新连接。

如果5分钟内有数据,那么 blpop就会立刻把数据弹出来。

通过添加超时时间,解决了数据实时性和网络连接丢失的问题。

posted @   阿布_alone  阅读(472)  评论(0编辑  收藏  举报
编辑推荐:
· AI与.NET技术实操系列:基于图像分类模型对图像进行分类
· go语言实现终端里的倒计时
· 如何编写易于单元测试的代码
· 10年+ .NET Coder 心语,封装的思维:从隐藏、稳定开始理解其本质意义
· .NET Core 中如何实现缓存的预热?
阅读排行:
· 分享一个免费、快速、无限量使用的满血 DeepSeek R1 模型,支持深度思考和联网搜索!
· 25岁的心里话
· 基于 Docker 搭建 FRP 内网穿透开源项目(很简单哒)
· ollama系列01:轻松3步本地部署deepseek,普通电脑可用
· 闲置电脑爆改个人服务器(超详细) #公网映射 #Vmware虚拟网络编辑器
历史上的今天:
2018-11-22 day26 网络通讯的整个流程
TOP
点击右上角即可分享
微信分享提示