MySQL 子查询(四)子查询的优化、将子查询重写为连接

  MySQL 5.7 ref ——13.2.10.10优化子查询

十、子查询的优化

  开发正在进行中,因此从长远来看,没有什么优化建议是可靠的。以下列表提供了一些您可能想要使用的有趣技巧。See also Section 8.2.2, “Optimizing Subqueries, Derived Tables, and View References”.

  10.1 优化子查询中行的数量或顺序

SELECT * FROM t1 WHERE t1.column1 IN
  (SELECT column1 FROM t2 ORDER BY column1);

SELECT * FROM t1 WHERE t1.column1 IN
  (SELECT DISTINCT column1 FROM t2);

SELECT * FROM t1 WHERE EXISTS
  (SELECT * FROM t2 LIMIT 1);

  10.2 用子查询替换连接

SELECT DISTINCT column1 
FROM t1 WHERE t1.column1 IN (
    SELECT column1 FROM t2
);

  用上面的语句替换这下面的:

SELECT DISTINCT t1.column1 
FROM t1, t2
WHERE t1.column1 = t2.column1;

  10.3

  某些子查询可以转换为连接,以便与不支持子查询的旧版MySQL兼容。但是,在某些情况下,将子查询转换为连接可能会提高性能。

  10.4 子句从外部移动到子查询内部

  例如,用上面的查询代替下面的:

SELECT * FROM t1
WHERE s1 IN (SELECT s1 FROM t1 UNION ALL SELECT s1 FROM t2);

/*代替*/

SELECT * FROM t1
WHERE s1 IN (SELECT s1 FROM t1) OR s1 IN (SELECT s1 FROM t2);

  另一个例子:

SELECT (SELECT column1 + 5 FROM t1) FROM t2;

/*代替*/

SELECT (SELECT column1 FROM t1) + 5 FROM t2;

 

  10.5 使用行子查询而不是相关子查询。

SELECT * FROM t1
  WHERE (column1,column2) IN (SELECT column1,column2 FROM t2);

/*代替*/

SELECT * FROM t1
  WHERE EXISTS (SELECT * FROM t2 WHERE t2.column1=t1.column1
                AND t2.column2=t1.column2);

  

  10.6

  使用 

NOT (a = ANY (...))

  而不是

a <> ALL (...)

 

  10.7

  使用 

x = ANY (table containing (1,2))

  而不是

x=1 OR x=2.

 

  10.8

  使用

=ANY

  而不是

EXISTS

 

  10.9

  对于始终返回一行的不相关子查询,IN 总是慢于 =

SELECT * FROM t1
  WHERE t1.col_name = (SELECT a FROM t2 WHERE b = some_const);

/*代替*/

SELECT * FROM t1
  WHERE t1.col_name IN (SELECT a FROM t2 WHERE b = some_const);

 

  这些技巧可能会导致程序变得更快或更慢。使用像BENCHMARK() 函数这样的MySQL工具,您可以了解在您自己的情况下有什么帮助。See Section 12.15, “Information Functions”.

  MySQL自己也会做出一些优化:

  • MySQL只执行一次不相关的子查询。使用EXPLAIN确保给定的子查询确实不相关。
  • MySQL会重写IN,ALL,ANY和SOME子查询,这样是为了尝试提高子查询中的select-list列被索引的可能性。
  • MySQL使用索引查找函数替换以下形式的子查询,EXPLAIN将其描述为特殊的连接类型(unique_subquery或index_subquery:
    ... IN (SELECT indexed_column FROM single_table ...)
  • MySQL使用包含MIN()或MAX()的表达式增强以下表单的表达式,除非涉及NULL值或空集:
    value {ALL|ANY|SOME} {> | < | >= | <=} (uncorrelated subquery)

    例如,对这个WHERE子句

    WHERE 5 > ALL (SELECT x FROM t)

    优化器可能会像这样对待:

    WHERE 5 > (SELECT MAX(x) FROM t)

  

  See also MySQL Internals: How MySQL Transforms Subqueries.

 

十一、将子查询重写为连接

  有时,除了使用子查询之外,还有其他方法可以测试一组值中的成员资格。

  同样,在某些情况下,不仅可以将查询重写为没有子查询的语句,还可能比使用子查询更加高效。IN()构造器就是如此。

  例如,这个查询:

SELECT * FROM t1 WHERE id IN (SELECT id FROM t2);

  可以被重写为:

SELECT DISTINCT t1.* FROM t1, t2 WHERE t1.id=t2.id;

 

  查询:

SELECT * FROM t1 WHERE id NOT IN (SELECT id FROM t2);
SELECT * FROM t1 WHERE NOT EXISTS (SELECT id FROM t2 WHERE t1.id=t2.id);

  可以被重写为:

SELECT table1.*
  FROM table1 LEFT JOIN table2 ON table1.id=table2.id
  WHERE table2.id IS NULL;

 

  LEFT [OUTER] JOIN可以比等效子查询更快,因为服务器可能能够更好地优化它——这个事实并非仅针对MySQL Server。

  在SQL-92之前,外连接不存在,因此子查询是执行某些操作的唯一方法。今天,MySQL Server和许多其他现代数据库系统提供了广泛的外连接类型。

 

  MySQL Server支持多表DELETE语句,可用于根据一个表甚至多个表中的信息同时有效地删除行。还支持多表UPDATE语句。See Section 13.2.2, “DELETE Syntax”, and Section 13.2.11, “UPDATE Syntax”.

 

 

 

  

posted @ 2019-06-03 00:37  爆炸的果核  阅读(6442)  评论(0编辑  收藏  举报