mysql 模糊匹配优化(全文索引)

背景：

批量插入单词时，存在单词匹配例句，批量插入时，like匹配批量插入时几十个单词挨个模糊匹配，接口超时，因为是后台管理系统，不打算接入ES，并且允许接口一定程度的慢，但接口超时得解决

方案：

1、正则表达式匹配，同样慢得令人发指

2、添加全文索引

只有Innodb和myisam存储引擎能用全文索引（innodb支持全文索引是从mysql5.6开始的）

  CREATE FULLTEXT INDEX   index   ON  table(`content`);

查看执行计划,确认走了索引

三种类型的全文搜索方式

natural language search（自然语言搜索）

通过MATCH AGAINST 传递某个特定的字符串来进行检，默认方式

boolean search（布尔搜索）

为检索的字符串增加操作符，如“+”表示必须包含，"-"不包含，"*" 表示通配符，即使传递的字符串较小或出现在停词中，也不会被过滤掉

query expansion search（查询扩展搜索）

搜索字符串用于执行自然语言搜索，然后，搜索返回的最相关行的单词被添加到搜索字符串，并且再次进行搜索，查询将返回来自第二个搜索的行

但是具体到执行时间，并没有太大得差别，难道问题不是出在这个like匹配上？

SELECT
        sentence 
           FROM
           table a
           WHERE
          sentence LIKE      CONCAT('%','one',' %' )
           LIMIT 0,5;

--  0.0109 s

SELECT
           sentence
           FROM
           table a
           WHERE
     match(sentence) against('one')
           LIMIT 0,5;
-- 0.0049 s

后来恍然大悟，因为limit 得原因关键字太简单，查询5条，很快就能匹配上，满足5条直接返回。

经过测试，生僻一点的单词，like 大约需要消耗2s，全文索引匹配耗时并没有改变。

posted @ 2020-04-03 18:31 小哥z 阅读(3353) 评论(0) 收藏举报

刷新页面返回顶部

mysql 模糊匹配优化(全文索引)

三种类型的全文搜索方式

公告