条件中in值过多导致的慢SQL问题

在前段时间的项目中，出现了一个很典型的查询优化问题。在此跟大家分享问题分析及解决方法。

此例中SQL文本大小达1.8MB，如下：

这是一个多表连接的比较复杂的视图，SQL的过滤条件里id列 “in” 了几万个常量（红框部分）。这条语句第一次执行需要12秒，第二次执行时间为毫秒级。

原因分析

上述两次执行时间的差别，说明该语句执行时间主要消耗在SQL硬解析上。由于项目中相关功能的并发量较大，这条慢SQL引发了严重的性能问题。

这个问题比较普遍。主要原因是开发人员图简单，对“in”列表里常量的个数没有评估。常量动辄数万，甚至数十万，这种SQL在并发量较大的情况下就是灾难。

优化思路

1. 创建一个事务级的临时表

CREATE GLOBAL TEMPORARY TABLE TMP_INLIST
(
　　　　ID VARCHAR(100)

) ON COMMIT DELETE ROWS;

--addBatch()批量绑定参数
INSERT INTO TMP_INLIST VALUES(?);
3. 改写SQL语句

select
        count(1)
from
        V_XXXXXXXXXXXXXX t

where
                                        C1= '235432'
                                    and C2= '345436'
    

and
        (
                C3  = 'SADFDSGADFDSAFDSAFSAD'
             or C3 is null
        )
    and
        (
          id in (select id from TMP_INLIST)
        );