超全面常用的数据库优化方案
一、数据库设计优化篇
1.1 选取最合适的的字段属性
关系型数据库可以支持大数据量的存取,但是一般来说表越小,它执行的速度也就会越快。因此,在新建表的时候,在满足我们业务需求的基础上,尽可能的将字段的宽度设置的小一点。
例如,在定义邮政编码这个字段时,如果将其设置为CHAR(100),显然给数据库增加了不必要的空间,甚至使用VARCHAR这种类型也是多余的,因为CHAR(6)就可以很好的完成任务了。相同的,如果TINYINT能满足我们的业务需求,那我们没有必要使用INT或者BIGINT。
1.2数据库索引
索引是提高数据库性能最常用的方法,它可以大大提高数据库查询的效率,尤其是在查询语句当中包含有MAX(),MIN()和ORDER BY这些函数和语句的时候,性能提高更为明显。
通常情况,索引应建立在那些将用于JOIN连接,WHERE判断和ORDERBY排序的字段上。尽量不要对数据库中某个含有大量重复的值的字段建立索引。如用户表中的性别字段就不适合创建索引(因为性别只有男或女两个值),在这样的字段上创建索引不仅不会提高数据库查询的效率,反而有可能降低数据库的性能。
索引并不是越多越好,索引固然可以提高相应的SELECT的效率,但同时也降低了INSERT及UPDATE 的效率,因为INSERT或UPDATE 时有会更新索引,所以怎样建索引需要慎重考虑,视具体情况而定。一个表的索引数最好不要超过6个,若太多则应考虑一些不常使用到的列上建的索引是否有必要。
二、SQL语句优化篇
2.1 尽量避免使用子查询,可以使用JOIN链接查询替代
常用的关系型数据库都支持子查询,子查询使用SELECT语句创建一个查询结果,然后把这个结果作为一张临时表用在另一个查询中。使用子查询可以一次完成多步SQL操作,也可以避免事务或者表锁死,且写起来比较容易。但是使用子查询MYSQL会在内存中创建一张临时表供外层查询使用,所以会降低查询的效率。这时候我们可以使用JOIN链接操作来替代子查询。
2.2 UNION All能满足业务需求不要使用UNION
如果我们需要将两个或者多个SELECT语句的结果作为合并为一个整体显示出来,我们可以用UNION或者UNION ALL关键字。UNION(联合)和UNION ALL的作用是将多个结果合并在一起显示出来。
两者的区别是:
UNION会自动压缩多个结果集合中的重复结果,而UNION ALL 则将所有的结果全部显示出来,不管是不是重复。所以当UNION ALL能满足业务需求的时候,尽量使用UNION ALL而不用UNION。
2.3 WHERE子句尽量避免使用!=或<>操作符
在WHERE子句中使用!=或<>操作符,查询条件不会使用索引,会进行全表查询。即影响查询效率。
2.4 WHERE子句使用OR的优化
通常情况我们可以使用UNION ALL或UNION的方式替换OR会得到更好的效果。因为WHERE子句中使用了OR,将不会使用索引。
例如:SELECT ID FROM TABLENAME WHERE ID = 1 OR ID = 2 ;
优化:SELECT ID FROM TABLENAME WHERE ID = 1 UNION ALL SELECT ID FROM TABLENAME WHERE ID = 2 ;
2.5 WHERE子句使用IN或NOT IN优化
IN和NOT IN也要慎用,否则可能会导致全表扫描。
可用以下方案替换:
方案一:BETWEEN AND替换IN
例如:SELECT ID FROM TABLENAME WHERE ID IN(1,2,3);
优化:SELECT ID FROM TABLENAME WHERE ID BETWEEN 1 AND 3;
方案二:EXISTS替换IN
例如:SELECT ID FROM TABLEA WHERE ID IN (SELECT ID FROM TABLEB )
优化:SELECT ID FROM TABLEA AS A WHERE ID EXISTS(SELECT 1 FROM TABLEB AS A WHERE B.ID = A.ID)
方案三:LEFT JOIN替换IN
例如:SELECT ID FROM TABLEA WHERE ID IN(SELECT ID FROM TABLEB)
优化:SELECT ID FROM TABLEA AS A LEFT JOIN TABLEB AS B ON A.ID = B.ID
2.6 WHERE子句中使用IS NULL或IS NOT NULL优化
在WHERE子句中使用IS NULL或IS NOT NULL判断,索引将被放弃使用,会进行全表查询。
例如:SELECT ID FROM TABLENAME WHERE AGE IS NULL
优化成AGE上设置默认值0,确保表中AGE没有NULL值,
优化:SELECT ID FROM TABLENAME WHERE AGE = 0
2.7 LIKE语句优化
一般情况下不建议使用LIKE操作,特别是数据量较大的表。
例如:SELECT NAME FROM TABLEA WHERE NAME LIKE '%张%';不会使用索引
优化:SELECT NAME FROM TABLEA WHERE NAME LIKE '张%';会使用索引
2.8 WHERE子句中避免对字段进行表达式操作
尽量不要在WHERE子句中的=左边进行函数、算数运算或其他表达式运算,否则系统将无法正确使用索引。
例如:SELECT ID FROM TABLENAME WHERE ID/2 = 50
优化:SELECT ID FROM TABLENAME WHERE ID = 50*2
例如:SELECT ID FROM TABLENAME WHERE substring(name,1,2) = '欧阳'
优化:SELECT ID FROM TABLENAME WHERE LIKE '欧阳%'
2.9 一定不要用SELECT * FROM TABLENAME
在定义SQL语句字段列表替换"*",尽量避免返回无用的时候,要用具体的的字段。
2.10 LIMIT分页优化
MYSQL数据库实现分页一般都会使用LIMIT,但是当偏移量比较大时,LIMIT的效率会非常低,导致查询超时。
如下SQL:
SELECT ID FROM TABLENAME LIMIT 1000,10 执行很快
SELECT ID FROM TABLENAME LIMIT 100000,10 执行很慢
优化方法:
方法一:SELECT ID FROM TABLENAME ORDER BY ID LIMIT 100000,10; 执行很快(因为用了ID主键做索引)
上述方法一是我们最常用的,但是如果表中的数据是千万级别的,即便使用方法一,查询速度可能还是比较慢,这时候我们可以把上一页ID的最大值作为查询条件来实现分页,如方法二。
方法二:SELECT ID FROM TABLENAME WHERE id > @MAXID limit 10;
@MAXID的值是上一页查询结果中ID的最大值。
2.11 EXISTS代替IN
SELECT ID FROM TABLEA WHERE ID IN (SELECT ID FROM TABLEB)
如上SQL,IN执行的时候是在内存中遍历比较,IN(SELECT ID FROM TABLEB)括号中语句只执行一次,把TABLEB表中的所有ID字段缓存起来,之后检查TABLEA表的ID是否与TABLEB表中的ID相等,如果ID相等则将TABLEA表中的记录加入到结果集中,直到遍历完TABLEA表的所有记录。
SELECT ID FROM TABLEA WHERE ID EXISTS(SELECT ID FROM TABLEA.ID= TABLEB.ID)
如上SQL,EXISTS查询是遍历TABLEA中的数据,TABLEA中的每一条数据与TABLEB连表查询,如果有返回结果,则把该记录添加到结果集中,所以当TABLEB的数据量远大于TANLEA时,EXISTS效率大大优于IN.当TABLEA表数据与TABLEB表数据一样大时,IN与EXISTS效率差不多
【推荐】国内首个AI IDE,深度理解中文开发场景,立即下载体验Trae
【推荐】编程新体验,更懂你的AI,立即体验豆包MarsCode编程助手
【推荐】抖音旗下AI助手豆包,你的智能百科全书,全免费不限次数
【推荐】轻量又高性能的 SSH 工具 IShell:AI 加持,快人一步