MySQL 表连接策略 NLJ vs BNL
select * from t1 join t2 on t1.c = t1.c
这样的语句,mysql优化器会选择t_a或t_b作为驱动表, 使用straight_join来指定 左边的表为驱动表。如果字段c上有建立索引,MySQL会使用 Index Nested-Loop Join 策略处理join,否则会使用Block Nested-Loop Join 来处理。
什么是Index Nested-Loop Join
如果连接表的字段上索引,会使用index nested-loop join 算法,会这样处理:
- 从驱动表t1取出记录一行记录R;
- 根据连接字段去t2搜索;
- 取出匹配的t2记录,跟R组成一行,作为结果集的一部分。
- 重复值执行以上步骤,直到扫描完t1
在这个过程中,驱动表是走全表扫描,而被驱动表是走树搜索
- 使用join语句,性能比强行拆成多个单表执行SQL语句的性能要好;
- 如果使用join语句的话,需要让小表做驱动表。
什么是 Block Neste-Loop Join
由于连接字段没有索引,这次不能通过走树索引去查询t2表了。查询过程如下:
- 扫描t1,顺序读数据放入join_buffer, 如果join_buffer满了,则分多次存入。
- 扫描t2,与join_buffer中的记录对比
- 清空join_buffer
- 重复上面步骤,直到t1扫描完成。
这个过程中,t2会被扫描多次,减少t1加载进join_buffer的次数,可以优化查询效率。join_buffer_size 参数控制了join_buffer的大小,如果join很慢,尝试改大这个join_buffer_size。
驱动表会被分多次放进join_buffer_size, 因此驱动表越小越好
Block Nested-Loop join 会占用大量的系统资源,如果在explain结果中,看到Block Nested Loop,尝试在连接的字段加索引吧