in的对象选择(子查询还是List集合),in 的优化,in与exists

近日查看SQL慢查询日志,发现对于in的查询总是出现超时问题。超时相关SQL语句:select * from flow_ru_bizvar where businessId IN () and status = 0。可以看到在这句SQL中,最耗时的就是因为in的原因。这里in的对象是一个Long类型(businessId)的List。先是从另一个表中,select出相关的businessId,然后再根据这些businessId进行查询。这样做的目的是为了避免表链接而带来的耗时,然而,从结果来看这样的处理结果还是耗时的。所以,关于这两个种方式究竟那种较好,以及各自的使用条件,如何对其两种进行优化。

1.当是集合时,in的处理机制:

 

2.当是子查询时,in的处理机制:

          首先执行子查询,其查询出来的结果作为衍生表(临时表),同时,其原有的索引仍然会起作用。

 

3.in与exists的区别以及使用条件

         exists使用主查询中的表作为驱动表,适用于子查询中的表有索引支持,主查询中的表数据较少时的情况。exists 对主表进行loop,根据主表的值去查看子表的结果(子表的结果为true或false),若子表的结果为true,则返回主表的结果,否则不返回主表的结果。

        

        in使用子查询中的表作为驱动表,适用于主查询中的表有索引支持,子查询中的表数据较少时的情况。其执行流程,将主查询的结果集与子查询的结果集进行内链接。

测试语句:

explain select *
from flow_ru_business
where flow_ru_business.businessId in (select gte_order.businessId from gte_order where gte_order.status = 7);

主查询使用遍历全表而不是遍历索引的原因是:主查询要求返回出所有元素字段,只能查表,如果满足覆盖索引才会遍历索引而不是表。

 

posted @ 2018-08-15 21:57  流沙若水  阅读(1801)  评论(0编辑  收藏  举报