超全面常用的数据库优化方案

一、数据库设计优化篇

1.1 选取最合适的的字段属性

关系型数据库可以支持大数据量的存取，但是一般来说表越小，它执行的速度也就会越快。因此，在新建表的时候，在满足我们业务需求的基础上，尽可能的将字段的宽度设置的小一点。

例如，在定义邮政编码这个字段时，如果将其设置为CHAR(100),显然给数据库增加了不必要的空间，甚至使用VARCHAR这种类型也是多余的，因为CHAR(6)就可以很好的完成任务了。相同的，如果TINYINT能满足我们的业务需求，那我们没有必要使用INT或者BIGINT。

1.2数据库索引

索引是提高数据库性能最常用的方法，它可以大大提高数据库查询的效率，尤其是在查询语句当中包含有MAX(),MIN()和ORDER BY这些函数和语句的时候，性能提高更为明显。

通常情况，索引应建立在那些将用于JOIN连接,WHERE判断和ORDERBY排序的字段上。尽量不要对数据库中某个含有大量重复的值的字段建立索引。如用户表中的性别字段就不适合创建索引（因为性别只有男或女两个值），在这样的字段上创建索引不仅不会提高数据库查询的效率，反而有可能降低数据库的性能。

索引并不是越多越好，索引固然可以提高相应的SELECT的效率，但同时也降低了INSERT及UPDATE 的效率，因为INSERT或UPDATE 时有会更新索引，所以怎样建索引需要慎重考虑，视具体情况而定。一个表的索引数最好不要超过6个，若太多则应考虑一些不常使用到的列上建的索引是否有必要。

二、SQL语句优化篇

2.1 尽量避免使用子查询，可以使用JOIN链接查询替代

常用的关系型数据库都支持子查询，子查询使用SELECT语句创建一个查询结果，然后把这个结果作为一张临时表用在另一个查询中。使用子查询可以一次完成多步SQL操作，也可以避免事务或者表锁死，且写起来比较容易。但是使用子查询MYSQL会在内存中创建一张临时表供外层查询使用，所以会降低查询的效率。这时候我们可以使用JOIN链接操作来替代子查询。

2.2 UNION All能满足业务需求不要使用UNION

如果我们需要将两个或者多个SELECT语句的结果作为合并为一个整体显示出来，我们可以用UNION或者UNION ALL关键字。UNION(联合)和UNION ALL的作用是将多个结果合并在一起显示出来。

两者的区别是：

UNION会自动压缩多个结果集合中的重复结果，而UNION ALL 则将所有的结果全部显示出来，不管是不是重复。所以当UNION ALL能满足业务需求的时候，尽量使用UNION ALL而不用UNION。

2.3 WHERE子句尽量避免使用!=或<>操作符

在WHERE子句中使用!=或<>操作符，查询条件不会使用索引，会进行全表查询。即影响查询效率。

2.4 WHERE子句使用OR的优化

通常情况我们可以使用UNION ALL或UNION的方式替换OR会得到更好的效果。因为WHERE子句中使用了OR，将不会使用索引。

例如:SELECT ID FROM TABLENAME WHERE ID = 1 OR ID = 2 ;
优化:SELECT ID FROM TABLENAME WHERE ID = 1 UNION ALL SELECT ID FROM TABLENAME WHERE ID = 2 ;

2.5 WHERE子句使用IN或NOT IN优化

IN和NOT IN也要慎用，否则可能会导致全表扫描。

可用以下方案替换:

方案一:BETWEEN AND替换IN
例如:SELECT ID FROM TABLENAME WHERE ID IN(1,2,3);
优化:SELECT ID FROM TABLENAME WHERE ID BETWEEN 1 AND 3;

方案二:EXISTS替换IN
例如:SELECT ID FROM TABLEA WHERE ID IN (SELECT ID FROM TABLEB ) 
优化:SELECT ID FROM TABLEA AS A WHERE ID EXISTS(SELECT 1 FROM TABLEB AS A WHERE B.ID = A.ID)

方案三:LEFT JOIN替换IN
例如:SELECT ID FROM TABLEA WHERE ID IN(SELECT ID FROM TABLEB) 
优化:SELECT ID FROM TABLEA AS A LEFT JOIN TABLEB AS B ON A.ID = B.ID

2.6 WHERE子句中使用IS NULL或IS NOT NULL优化

在WHERE子句中使用IS NULL或IS NOT NULL判断,索引将被放弃使用，会进行全表查询。

例如:SELECT ID FROM TABLENAME WHERE AGE IS NULL 
优化成AGE上设置默认值0，确保表中AGE没有NULL值，
优化：SELECT ID FROM TABLENAME WHERE AGE = 0

2.7 LIKE语句优化

一般情况下不建议使用LIKE操作，特别是数据量较大的表。

例如:SELECT NAME FROM TABLEA WHERE NAME LIKE '%张%';不会使用索引
优化:SELECT NAME FROM TABLEA WHERE NAME LIKE '张%';会使用索引

2.8 WHERE子句中避免对字段进行表达式操作

尽量不要在WHERE子句中的=左边进行函数、算数运算或其他表达式运算，否则系统将无法正确使用索引。

例如:SELECT ID FROM TABLENAME WHERE ID/2 = 50 
优化:SELECT ID FROM TABLENAME WHERE ID = 50*2

例如:SELECT ID FROM TABLENAME WHERE substring(name,1,2) = '欧阳' 
优化:SELECT ID FROM TABLENAME WHERE LIKE '欧阳%'

2.9 一定不要用SELECT * FROM TABLENAME

在定义SQL语句字段列表替换"*"，尽量避免返回无用的时候，要用具体的的字段。

2.10 LIMIT分页优化

MYSQL数据库实现分页一般都会使用LIMIT，但是当偏移量比较大时，LIMIT的效率会非常低，导致查询超时。

如下SQL：
SELECT ID FROM TABLENAME LIMIT 1000,10   执行很快
SELECT ID FROM TABLENAME LIMIT 100000,10 执行很慢

优化方法：
方法一：SELECT ID FROM TABLENAME ORDER BY ID LIMIT 100000,10; 执行很快(因为用了ID主键做索引)
上述方法一是我们最常用的，但是如果表中的数据是千万级别的，即便使用方法一，查询速度可能还是比较慢，这时候我们可以把上一页ID的最大值作为查询条件来实现分页,如方法二。

方法二：SELECT ID FROM TABLENAME WHERE id > @MAXID limit 10;
@MAXID的值是上一页查询结果中ID的最大值。

2.11 EXISTS代替IN

SELECT ID FROM TABLEA WHERE ID IN (SELECT ID FROM TABLEB)

如上SQL，IN执行的时候是在内存中遍历比较，IN(SELECT ID FROM TABLEB)括号中语句只执行一次，把TABLEB表中的所有ID字段缓存起来，之后检查TABLEA表的ID是否与TABLEB表中的ID相等，如果ID相等则将TABLEA表中的记录加入到结果集中，直到遍历完TABLEA表的所有记录。

SELECT ID FROM TABLEA WHERE ID EXISTS(SELECT ID FROM TABLEA.ID= TABLEB.ID)

如上SQL，EXISTS查询是遍历TABLEA中的数据，TABLEA中的每一条数据与TABLEB连表查询，如果有返回结果，则把该记录添加到结果集中，所以当TABLEB的数据量远大于TANLEA时，EXISTS效率大大优于IN.当TABLEA表数据与TABLEB表数据一样大时，IN与EXISTS效率差不多

转载自：超全面常用的数据库优化方案 - 知乎 (zhihu.com)

posted @ 2022-03-22 10:07 !opts 阅读(2012) 评论(0) 收藏举报

刷新页面返回顶部

!Opts's Blog

一心只想搞钱的程序猿

超全面常用的数据库优化方案

一、数据库设计优化篇

二、SQL语句优化篇

公告