使用EXISTS代替JOIN优化查询速度
在最近的开发中, 碰到一个特别慢的sql
SELECT DISTINCT s.* FROM pcom_stories s INNER JOIN pcom_story_content sc ON s.story_id = sc.story_id AND sc.language=? INNER JOIN pcom_object_to_tag ot ON s.story_id = ot.obj_id AND ot.obj_type=1 WHERE ot.tag_id IN ( ? , ? , ? , ? , ? , ? ) AND s.fsource_id = ? ORDER BY s.date_time DESC LIMIT ?, ?
在10万左右的数据表中, 执行时间要1至2分钟. 这个查询的目的是生成一个文章标题列表页, 条件有: 1. 在指定的语言类型下, 有文章内容 2. 指定的来源 3. 与标签的映射关系中, 需要被包含在指定的标签集合中 后来经组里的同事提示, 改成了下面这样的写法, 查询时间只到原来的1/10:
SELECT s.* FROM pcom_stories s INNER JOIN pcom_story_content sc ON s.story_id = sc.story_id AND sc.language=? WHERE EXISTS ( SELECT 1 FROM pcom_object_to_tag ot WHERE ot.tag_id IN ( ? , ? , ? , ? , ? , ?) AND s.story_id = ot.obj_id AND ot.obj_type=1 ) AND s.fsource_id = ? ORDER BY s.date_time DESC LIMIT ?, ?
所以, 在需要使用关系表, 又需要使输出值唯一的情况下, 可以尝试使用exists来改进SQL查询