记一次线上数据库删除百万级数据

背景

不知道有没有读者经历过删除线上数据库记录，反正这事对我来说是挺有压力的。激动的心，颤抖的手，万一删错了数据就麻烦了，影响数量大，领导会批评，还有复盘自己批评，想想就头大。那么就要在删除数据之前做好计划，避免删数据时发生意料之外的事情。记录一次删除线上数据。

业务以半年为一个周期，每一个周期体验参与用户在40w左右。新一期开始后过期体验用户的数据较大，会让数据库增删改查速度变慢，但这一部分数据对业务已经没有帮助了，所以要清理过期体验用户的数据。

一共要清理5张表：
A：数量 36w
B：数量 36w
C：数量 140w
D：数量 36w
E：数量 72w

要求

对于大量数据的查询和删除不能使用一条语句完成，会造成数据库阻塞，特别是删除数据时会锁表或锁行。要减少对线上正常业务的影响，在删除数据的同时不能影响数据库正常增删改查，而且不能让数据库查询等待过长而导致API返回超时。所以查询和删除都需要分批完成。

删除数据底层流程

简单的说明一下在删除数据时MySQL数据底层流程。
MySQL数据库分为两个部分：server层和存储引擎，如下图：

在删除一条记录时，流程分别是：

客户端连接到server层
分析器对sql语句进行词法分析和语法分析，知道是一条删除语句
优化器选择合适的索引去查找待删除的记录
执行器调用存储引擎删除所有记录
存储引擎将维护的数据内存里的记录标记为已删除
存储引擎根据刷盘规则将内存的记录写到磁盘中

以上就是删除一条语句的过程，因为每一个sql语句是一个事务，每一个事务都涉及到加锁，所以在以上的删除流程中，锁的使用是这样的：

如果查询待删除记录走的是索引，那么会将所有删除记录行加锁
如果查询待删除记录没有走索引，那么将会将整张表都锁起来，直到删除完成

删除实施

针对最多140w的数据，肯定不能一次性删除，否则锁表的时间会让其他业务无法进行，同时要在删除时使用行锁而不是表锁。所以删除分为两步走：

使用分块查询，将所有记录的主键查询出来
根据主键分批删除，同时每一次删除间隔一定时间，异常捕获不影响删除流程

经过5张表的删除，得出以下脚本删除时对数据库影响较小

# 分批查询，只查询id
def chunk_model(model, conditions, start_id=0, chunk_size=500):
    while True:
        models = list(
            model.select(model.id)
            .where(model.id > start_id, *conditions)
            .order_by(model.id.asc())
            .limit(chunk_size)
        )
        if not models:
            break

        yield models
        start_id = models[-1].id


import time
from app.camp.models import UserPlan

plan_id_list = [33,34]

delete_id_list = []
for chunk_data in chunk_model(UserPlan, [UserPlan.plan_id.in_(plan_id_list)]):
    print(chunk_data[0].id)
    for data in chunk_data:
        delete_id_list.append(data.id)

# 分批删除
for id_index in range(0, len(delete_id_list), 1000):
    print(id_index)
    try:
        delete_ids = delete_id_list[id_index:id_index+1000]
        UserPlan.delete().where(UserPlan.id.in_(delete_ids)).execute()
        time.sleep(0.5)
    except Exception as e:
        print(id_index, e)

最多的140w数据耗时在10分钟左右，全程数据库无波动，业务没有影响。

posted @ 2022-07-16 15:28 金色旭光阅读(1587) 评论(0) 收藏举报

刷新页面返回顶部

金色旭光

记一次线上数据库删除百万级数据

背景

要求

删除数据底层流程

删除实施

公告