模糊查询如何按匹配度排序？

前言

不知道你有没有使用过Mysql的like语句，进行模糊查询？

不知道你有没有将查询结果，进行分页处理？

模糊查询，加上分页处理，会有意想不到的坑，不信我们继续往下看。

我之前提供过一个品牌查询接口，给前端品牌选择控件使用的。

当时为了性能考虑，怕前端控件因为一次性加载太多的品牌，而导致页面卡死。

因此，对品牌查询接口做了分页处理。

刚开始品牌表的数据比较少，没有出现什么问题。

后来，产品加需求了，在品牌下拉选择控件中，让用户可以输入自定义品牌。

在用户添加品牌前，需要先查一下，如果该品牌存在，则使用已有品牌。如果不存在，则新增品牌。（这里是精确匹配）

这个需求很简单，很容易实现了。

后来，产品又加需求了，需要按名称模糊查询品牌。

该功能上线后，使用了很长一段时间，也没啥问题。

突然，在不经意的某一天，这个功能却出问题了。

到底怎么回事呢？

1.案发现场

某一天下午，运营找到测试反馈一个问题说：明明品牌苏三，已经存在了，但用户输入关键字：苏三时，系统没有让用户直接选择已有品牌，而是添加了一个叫：苏三的自定义的品牌。

我过去一看，还真的有问题。

不一会儿，就定位到原因了，初步判断是分页的问题。

搜索关键字：苏三，竟然出现了好几页的数据，把我惊呆了，品牌表怎么多了这么多数据了。

我查了数据库，其实数据量并不是特别多，但有些品牌名称比较特殊，有些品牌名称是多个品牌名称拼接而成的，比如：苏三,李四或者苏三,李四,王五，这是一个品牌。

其实是品牌名称建的不规范导致的问题，但已经没法让运营修改品牌了，只能通过技术手段解决目前的问题。

查询第一页的数据sql：

select * from brand where name like '%苏三%' 
order by edit_date desc limit 5;

执行结果：

我们可以看到，图中并没有等于苏三这两个字的数据。

注意：为了好演示，这里给的每页大小是5，真实的场景并非如此。

查询第二页的数据sql：

select * from brand where name like '%苏三%' 
order by edit_date desc limit 5,5;

执行结果：

从图中看到，在第二行，出现了正好等于苏三这两个字的数据。

用户搜索关键字：苏三时，前端页面在调用品牌查询接口，pageNo默认是1。由于能够匹配关键字的数据太多了，第一页返回不完，需要多页才能全部返回。

前端获取到第一页的数据后，跟关键字：苏三做比较，发现没有等于苏三的品牌。

这样就会在下拉控件中，自动添加一个品牌：苏三，同时在右边增加自定义标签。

这样就出问题了，明明苏三这个品牌是有的，但用户还能自定义一个苏三，而不是直接选择。

2.思考123

苏三这个关键字，通过模糊查询可以查询出来，但由于品牌接口做了分页，全匹配的品牌：苏三，出现在第二页了，才导致问题的产生。

如果要解决这个问题，让它出现在第一页不就OK了？

这时候，就有下面几种解决方案。

2.1 方案1

分页查询品牌接口，pageSize是5。

我们为什么不把pageSize调大一点？比如改成：200、500等。

这样通过苏三关键字，进行模糊查询的时候，结果基本都在第一页。

这样就能非常快速的解决问题。

但有个缺点就是：如果这次调大了pageSize，但后面查询关键字的品牌又出现在第二页怎么办？

不可能一直改pageSize吧？

2.2 方案2

把分页查询接口的数据，拆分成两部分：

精确查询
模糊查询

在代码中做处理的时候，先根据关键字精确查询，即sql中使用name='苏三'，这种方式查询一次数据。

如果没查出数据，则再直接用like '%苏三'进行模糊查询。

如果查出了一条数据，则把它放在返回结果集合中的第一位置。接下来，使用like '%苏三'进行模糊查询的时候，再加上条件 name <> '苏三'。将查出的结果，从第二个位置往后放。

这样可以拼接出你想要的集合。

但有个缺点，就是代码耦合性太大了。

2.3 方案3

之前，品牌苏三在第二页，最根本的原因是使用了edit_time字段进行逆序的。

也就是说，修改时间越大的越排在前面，而品牌苏三的修改时间很小，所以排在第二页了。

如果想品牌苏三，排在第一页，修改一下排序规则，不就搞定了？

可以改成按：id或者name字段排序。

用id字段排序，不太合适，虽说用了雪花算法，但跟修改时间类似，先插入的数据，会越小。

select * from brand where name like '%苏三%' 
order by id desc limit 5;

用它排序的结果，跟使用修改时间排序差不了太多。

看来，只能使用name字段排序了。

3.如何排序？

我们在sql中直接对name字段，进行升序或者降序吗？

显然不是。

使用name字段降序：

select * from brand where name like '%苏三%' 
order by name desc limit 5;

执行结果：

图中并没有看到我们想要的数据。

其实，使用name字段升序，也可能在第一页查不出我们所想要的数据。

到底该如何处理呢？

假如，我们有这样一种排序：

全匹配显示在最前面，比如：苏三。
数据左半部分匹配，右边按字母排序，比如：苏三1、苏三2、苏三说技术。
从中间开始匹配，比如：1苏三、2苏三。
第2步和第3步，还要根据字符长度排序，字符短的排在前面，比如：1苏三、1苏三1、苏三说技术。

如果我们能实现上面的这种排序方式，这个问题就能完美解决了。

说起来容易，做起来难。

难道要先全匹配：name='苏三'，再有匹配：name like '苏三%'，再左匹配：name like '%苏三'，把查询三次的结果组装起来？

显然这种做法有点low。

要实现上面我们设想的排序方式，在es中更好处理一下，但在mysql中要怎么处理呢？

4.解决方案

其实，我们可以换一种思路，根据字符的长度排序。

mysql给我们提供了很多非常有用的函数，比如：char_length。

通过该函数就能获取字符长度。

sql调整如下：

select * from brand where name like '%苏三%' 
order by char_length(name) asc limit 5;

name字段使用关键字模糊查询之后，再使用char_length函数，获取name字段的字符长度，然后按长度升序。

仅这一个骚操作，就搞定需求了：

我们所期待的：苏三，终于排在第一个了。同时由于该sql做了分页的，即使name字段在查询时丢失了索引，执行效率也不会太低。

业务上的需求搞定了。

但追求完美的我们，好奇，想看看第二页是什么情况：

select * from brand where name like '%苏三%' 
order by char_length(name) asc limit 5,5;

执行结果：

并没有按照我们设想的剧本进行下去，我们之前假设的3条排序中，第2条和第3条都没有满足。

这时该怎么办？

答：可以使用mysql中的locate函数，通过它可以匹配的关键字，在字符串中的位置。

使用locate函数改造之后sql如下：

select * from brand where name like '%苏三%' 
order by char_length(name) asc, locate('苏三',name) asc limit 5,5;

执行结果：

完美，终于出现我们想要的结果了。

除此之外，还可以使用：instr和position函数，它们的功能跟locate函数类似，在这里我就不一一介绍了，感兴趣的小伙伴可以找我私聊。

5. 总结

其实，模糊查询和分页，如果分开用，一般是没问题的。

但如果它们要一起使用，一定要考虑排序问题。

如果只是按照简单的时间或者id排序，有些特殊的业务场景，没办法满足，很容易出现bug。

当然解决上面问题，还有其他办法，比如：pageSize调大一点，或者把全匹配放到第一页。

但更优的方案，是通过mysql的函数来解决问题。

我们可以通过mysql提供的：char_length、locate、instr和position函数等，来实现很多复杂的排序功能。

最后说一句(求关注，别白嫖我)

如果这篇文章对您有所帮助，或者有所启发的话，帮忙扫描下发二维码关注一下，您的支持是我坚持写作最大的动力。
求一键三连：点赞、转发、在看。
关注公众号：【苏三说技术】，在公众号中回复：面试、代码神器、开发手册、时间管理有超赞的粉丝福利，另外回复：加群，可以跟很多BAT大厂的前辈交流和学习。

posted @ 2022-09-14 11:40 苏三说技术阅读(4894) 评论(31) 编辑收藏举报

刷新页面返回顶部

微信搜：苏三说技术

关注我的同名公众号：【苏三说技术】，回复：进大厂，免费领取10万字的面试宝典。推荐一个宝藏八股文网站：www.susan.net.cn

模糊查询如何按匹配度排序？

前言

1.案发现场

2.思考123

2.1 方案1

2.2 方案2

2.3 方案3

3.如何排序？

4.解决方案

5. 总结

最后说一句(求关注，别白嫖我)

公告

微信搜：苏三说技术

关注我的同名公众号：【苏三说技术】，回复：进大厂，免费领取10万字的面试宝典。 推荐一个宝藏八股文网站：www.susan.net.cn

模糊查询如何按匹配度排序？

前言

1.案发现场

2.思考123

2.1 方案1

2.2 方案2

2.3 方案3

3.如何排序？

4.解决方案

5. 总结

最后说一句(求关注，别白嫖我)

公告

关注我的同名公众号：【苏三说技术】，回复：进大厂，免费领取10万字的面试宝典。推荐一个宝藏八股文网站：www.susan.net.cn