简单限流

简单限流

​ 限流算法在分布式领域是一个经常被提起的话题,当系统的处理能力有限时, 如何阻止计划外的请求继续对系统施压, 这是一个需要重视的问题。

​ 除了控制流量, 限流还有一个应用目的是用于控制用户行为, 避免垃圾请求。比如在用户的发帖、回复、点赞等行为都要严格受控,一般要严格限定某行为在规定时间内允许的次数, 超过了次数那就是非法行为。对非法行为, 业务必须规定适当的惩处策略。

如何使用Redis来实现简单的限流策略?

​ 首先我们来看一个常见的简单限流策略。 系统要限定用户的某个行为在指定的时间里只能允许发生N次, 如何使用Redis的数据结构来实现这个限流功能?

​ 先定义这个接口, 理解了这个接口的定义, 就应该能明白我们期望达到的功能。

# 指定用户user_id的某个行为action_key在特定的时间内period只允许发生一定的次数
max_count
def is_action_allowed(user_id, action_key, period, max_count):
    return true

# 调用这个接口, 一分钟内只允许最多回复5个帖子
can_reply = is_action_allowed('david', 'reply', 60, 5)
if can_reply:
    do_reply()
else:
    raise ActionThresholdOverflow()

解决方案

​ 这个限流需求中存在一个滑动时间窗口, 相信zset数据结构的score值, 是不是可以通过score来圈出这个时间窗口来。而且只需要保留这个时间窗口, 窗口之外的数据都可以砍掉。那这个zset的value填什么比较合适呢?它只需要保证唯一性即可, 用uuid会比较浪费空间, 那就改用毫秒时间戳吧。

​ 用一个zset结构记录用户的行为历史, 每一个行为都会作为一个zset中的一个key保存下来, 同一个用户同一种行为用一个zset记录。

​ 为了节省内存, 我们只需要保留时间窗口的行为记录, 同时如果用户是冷用户, 滑动时间窗口内的行为是空记录, 那么这个zset就可以从内存中移除, 不在占用空间。

​ 通过统计滑动窗口内的行为数量与阈值max_count进行比较就可以得出当前的行为是否允许。代码表示如下:

import time
import redis

client = redis.StrictRedis()

def is_action_allowed(user_id, action_key, period, max_count):
    key = 'hist:%s'%(user_id, action_key)
    # 毫秒时间戳
    now_ts = int(time.time()*1000)
    #client 是StrictRedis实例
    with client.pipeline() as pipe: 
        # 记录用户行为, value和score都是毫秒时间戳
        pipe.zadd(key, now_ts, now_ts)
        # 移除时间窗口之前的行为记录, 剩下的都是时间窗口内的
        pipe.zremrangebyscore(key, 0, now_ts - peroid*100)
        # 获取窗口内的行为数量
        pipe.zcard(key)
        # 设置zset过期时间,避免冷用户持续占用内存, 过期时间应该等于时间窗口的长度, 最多宽限1s
        pipe.expire(key, period + 1)
        # 批量执行
        _, _, current_count, _ = pipe.excute()
    # 比较数量是否超标
    return current_count <= max_count

for i in range(20):
    pirnt(is_action_allowed('david', 'reply', 60, 5))
        

​ 这个代码的整体思路就是: 每一个行为到来时, 都维护一次窗口时间。 将窗口时间外的记录全部清理掉, 只保留窗口内的记录。zset集合中只有score值非常重要, value值没有特别意义, 只要需要保证它的唯一的就可以了。

​ 因为这几个连续的Redis操作都是针对同一个key的, 使用pipeline可以显著提升Redis存取率。但是这种方案也有缺点, 因为它要记录时间窗口内所有的行为记录, 如果这个量恨到, 比如限定60s内操作不得超过100w次这样的参数, 它是不适合做这样的限流的,因为会消耗大量的存储空间。

posted @ 2020-09-07 16:02  phper-liunian  阅读(135)  评论(0编辑  收藏  举报