测试平台系列(63) 软删除之殇
大家好~我是
米洛
!
这是一个完整的接口测试平台系列教程
,希望能和大家一起学习,从0到1打造一个开源平台。
欢迎关注我的公众号测试开发坑货
,获取最新文章教程!
回顾
上一节我们基本上搞定了数据构造器
的增删改等操作,这一篇我们来讲讲软删除
相关的内容。
什么是软删除
先声明一下,我没有
查阅关于具体软删除
的资料,大家有兴趣的可以自己去搜索下,我说的都是自己的理解。
删除数据,一般来说我们是从数据库
或其他存储介质里面删除数据,举个🌰栗子:
我们需要把数据表
里面的用户A删除掉,那我们最常见
的方式就是:
delete from user where name='A';
这个我理解的话,就是物理删除
,删除了以后,我们的数据表里面不再有这条数据的信息
,如果还需要这个用户,则需要重新insert一遍。
那软删除
又是什么呢?软删除也可以叫做逻辑删除
,比如我们给User表定义一个字段: deleted_at(代表这条数据删除的时间),如果这个字段不为空,说明用户未被删除
, 反之则说明用户已经被删除了
。因为只是逻辑上的"删除",并不是真正删掉了这条数据,所以又叫做逻辑删除。
软删除的优点
软删除对比物理删除的话,好处在哪呢?我认为有以下几个方面:
- 数据未被
真实删除
,数据更可靠 - 可以通过把删除的时间戳赋予给deleted_at,从而知道删除的时间,无形之中记录了用户的删除操作
- 对于用户而言和物理删除没什么区别
- 拥有天然的回收站功能
软删除的缺点
上面提到了软删除
的好处,这里就来说说软删除让人又爱又恨
的地方。
-
查询数据更加复杂
查询条件需要带入deleted_at is null,否则会查询出
被删除
的数据。除了这个以外,还有一个比较棘手的问题,且听我慢慢道来。
索引之殇
索引这块是一个比较棘手
的问题,特别是当我们有唯一索引的时候,我们先来看一种场景。
-
用户表
我们的用户表里面有email字段,但email大家都懂的,是
不可以重复
的,所以我们需要给它加上唯一索引
。
场景一
来看第一种场景,我们为用户表创建了一条数据:
email -> 123456@qq.com
deleted_at -> null
我们这时候要删除这条数据
,但因为软删除的原因我们会写这样的sql:
update user set deleted_at = now() where email='12345@qq.com';
你以为这就没事儿了吗?
接下来的事情就让人脑崩
了,由于唯一索引email_uidx
的存在,我没法再新插入一条email=123456@qq.com的数据了。
执行插入语句
的时候,会报duplicate index的错误,相信大家也不少见。
那这个问题怎么解决呢?我们来看看场景二
。
试着解决一下
为了解决场景一的唯一索引
问题,我们想到了联合索引
,啥子叫联合唯一索引呢?就是多个字段同时相同的时候,数据才算重复,也就是触发duplicate index
报错。
于是我们创建一个联合唯一索引:
ALTER TABLE user ADD UNIQUE INDEX(email, deleted_at);
这时候,我们再来看场景一:
- 创建用户
email=12345@qq.com
deleted_at=null
接着,我们删除之,这时候它变成了:
email=12345@qq.com
deleted_at=2021-09-12 20:13:00
然后我们继续添加12345@qq.com
的用户,发现可以添加了
。
你以为这就完事
了?那我们再看看场景二:
场景二
这个比较简单,我们insert2条相同的数据:
insert into user (email, deleted_at) values ('12345@qq.com', null);
insert into user (email, deleted_at) values ('12345@qq.com', null);
好久没写sql,也不知道写的对不对,凑合看,大概是这么个意思。
这时候奇迹出现了
,可以发现2条数据都插入成功了,也就是说,之前的email的唯一性
得不到保证了。
这是为什么呢?
原来,当联合索引里面有字段为null的时候,联合索引会自动失效
。
那这个真的是非常难受
,可谓是修复了一个bug又导致了另一个bug。
解决方案一
其实我们可以把deleted_at
设置为和主键一样的自增id,每当被删除的时候就+1,恢复的时候也+1,默认为0,这样也不会因为默认为NULL而引发唯一索引失效。
解决方案二
我们可以把deleted_at
设置为时间戳,默认为0(代表未删除),一般来说,手动操作删除操作
时间戳肯定有细微变化,这样索引将不会生效,也就是不会影响到之前的数据。
但也有一个缺点: 如果一个数据被删除多次,数据库将存在许多
相同的被删除的数据,当然一般人也不会做辣么无聊的事情。
class Model(Base):
deleted_at = Column(BIGINT, nullable=False, default=0)
可以看到deleted_at如此定义,当有删除操作的时候,我们设置deleted_at = time.time()即可。
import time
model.deleted_at = time.time()
大家如果有更合适的方案,也欢迎一起探讨
感激不尽!