代码改变世界

"Regexp AND LIKE"优化方法

2023-06-21 15:25  abce  阅读(65)  评论(0编辑  收藏  举报

与大多数数据库一样,MariaDB允许在WHERE子句中使用正则表达式进行查询。虽然这功能很强大,但在数据库中使用regexp的一个问题是它无法利用索引。原因很简单:查询优化器无法理解正则表达式,也无法对它们的返回值做出假设。

这篇文章提出了一个微不足道但反直觉的优化,有时可以解决这个限制。

对于下面的查询:

SELECT id, code FROM product WHERE code RLIKE '^AB[[:digit:]]+';

匹配以AB开头,后面至少跟着一个数字的文本。

正如开头所说,regexp使用不上索引。

如果查询条件是

WHERE code LIKE 'AB%'

就可以用上索引。但是不能检查后面是否跟的是数字。

但如过将条件改成这样呢?

SELECT id, code
    FROM product 
    WHERE code LIKE 'AB%' AND code RLIKE '^AB[[:digit:]]+';

大多数场景下.mariadb会:
·mariadb通过索引来检查like表达式,这可以过滤出大部分的行
·满足like条件的结果行,继续检查是否满足正则表达式

这样修改后,即使用不上索引,速度也不会比原来的sql慢多少。