盘点那些面试中最常问的MySQL问题

MySQL中myisam与innodb的区别

MyISAM：

不支持事务，但是每次查询都是原子的；
支持表级锁，即每次操作对整个表加锁；
存储表的总行数；
一个MYISAM表有三个文件：索引文件、表结构文件、数据文件；
采用非聚集索引，索引文件的数据域存储指向数据文件的指针。辅索引与主索引基本一致，但是辅索引不用保证唯一性。

InnoDb：

支持ACID的事务，支持事务的四种隔离级别；
支持行级锁及外键约束：因此可以支持写并发；
不存储总行数；
一个InnoDb引擎存储在一个文件空间（共享表空间，表大小不受操作系统控制，一个表可能分布在多个文件里），也有可能为多个（设置为独立表空，表大小受操作系统文件大小限制，一般为2G），受操作系统文件大小的限制；
主键索引采用聚集索引（索引的数据域存储数据文件本身），辅索引的数据域存储主键的值；因此从辅索引查找数据，需要先通过辅索引找到主键值，再访问辅索引；最好使用自增主键，防止插入数据时，为维持B+树结构，文件的大调整。

两者的适用场景：

因为MyISAM相对简单所以在效率上要优于InnoDB。如果系统读多，写少，对原子性要求低，那么MyISAM最好的选择，且MyISAM恢复速度快，可直接用备份覆盖恢复。
如果系统读少，写多的时候，尤其是并发写入高的时候。InnoDB就是首选了。

myisam与innodb引擎下select count(*)哪个更快，为什么？

统计一张表的总数量，是我们开发中常有的业务需求，通常情况下，我们都是使用 select count(*) from t SQL 语句来完成。随着业务数据的增加，你会发现这条语句执行的速度越来越慢，为什么它会变慢呢？

为什么会变慢？想要得到答案就需要知道 MySQL 是如何统计总数量的，先说一个前提吧，count(*) 的具体实现是由存储引擎实现的，也就是说不同的存储引擎实现的方式不一样。

InnoDB和MyISAM 是我们常用的 MySQL 存储引擎，所以主要对比一下 count(*) 在 InnoDB 和 MyISAM 中的实现：

在 MyISAM 存储引擎中，把表的总行数存储在磁盘上，当执行 select count(*) from t 时，直接返回总数据。
在 InnoDB 存储引擎中，跟 MyISAM 不一样，没有将总行数存储在磁盘上，当执行 select count(*) from t 时，会先把数据读出来，一行一行的累加，最后返回总数量。

知道了 InnoDB 和 MyISAM 引擎 count(*) 实现之后，为什么 select count(*) from t，在 InnoDB 引擎中比 MyISAM 慢？应该有答案了吧，但是这个结论需要有一个前提，就是统计 SQL 不带过滤条件。如果统计数量SQL语句为：select count(*) from t where x = 23，那么在 MyISAM 中就不一定比 InnoDB 快了。

InnoDB 中 count(*) 语句是在执行的时候，全表扫描统计总数量，所以当数据越来越大时，语句就越来越耗时了，为什么 InnoDB 引擎不像 MyISAM 引擎一样，将总行数存储到磁盘上？这跟 InnoDB 的事务特性有关，由于多版本并发控制（MVCC）的原因，InnoDB 表“应该返回多少行”也是不确定的。

不妨用一个例子来说明一下，假设现在 t 表中有 10000 条数据，现在有三个用户同时访问的会话：

会话 A 先启动事务并查询一次表的总行数。
会话 B 启动事务，插入一行后记录后，查询表的总行数。
会话 C 先启动一个单独的语句，插入一行记录后，查询表的总行数。

InnoDB 引擎在 count(*)语句上也做了优化，我们知道，在 InnoDB 存储引擎中是以索引组织表的方式存储数据，主键索引树上的叶子节点存放着所在行的所有的数据，而普通索引树的叶子节点是主键值，所以普通索引树会比主键索引树小很多，但是数量是一样的，也就是说遍历主键索引树和普通索引树得到的结果都是一样的。MySQL 就利用了这一特性，在 InnoDB 中执行 select count(*) from t 语句时，MySQL 优化器会找到最小的那棵索引树来遍历，这样可能就可以减少加载次数，在一定程度上提升了 count(*)的执行效率。

MySQL INT和CHAR隐式类型转换需要注意什么？

主要记住下面两点：

① 当查询字段是INT类型，如果查询条件为CHAR，将查询条件转换为INT，如果是字符串并且前导都是数字，将截取前导数字用来比较，如果没有前导数字，则转换为0。

② 当查询字段是CHAR/VARCHAR类型，如果查询条件为INT，将查询字段转换为INT再进行比较，可能会造成全表扫描。

有如下一张测试表product，id为int类型，name为varchar类型。

+----+----------+
| id | name   |
+----+----------+
|  1 | apple   |
|  2 | banana |
|  3 | 99cat   |
+----+----------+

情况1：

// 查询条件转化为数字1再比较
mysql> select * from product where id = '1abc23';
+----+---------+
| id | name  |
+----+---------+
|  1 | apple  |
+----+---------+

情况2：

// 查询字段全部转化成数字，id:1和id:2字段值转化为0，id:3转化成99，再比较
mysql> select * from product where name=0;
+----+----------+
| id | name   |
+----+----------+
|  1 | apple   |
|  2 | banana |
+----+----------+

MySQL 如何高效率随机获取N条数据？

假设表叫做mm_account。

ID连续的情况下（注意不能带where，否则结果不好）：

SELECT *
FROM `mm_account` AS t1 JOIN (SELECT ROUND(RAND() * (SELECT MAX(id) FROM `mm_account`)) AS id) AS t2
WHERE t1.id >= t2.id
ORDER BY t1.id ASC LIMIT 4;

ID不连续的情况下：

SELECT * FROM `mm_account` 
WHERE id >= (SELECT floor(RAND() * (SELECT MAX(id) FROM `mm_account`)))  and city="city_91" and showSex=1
ORDER BY id LIMIT 4;

如果有一个字段叫id，最快的方法如下（随机获取5条）：

SELECT * FROM mm_account 
WHERE id >= ((SELECT MAX(id) FROM mm_account)-(SELECT MIN(id) FROM mm_account)) * RAND() + (SELECT MIN(id) FROM mm_account)
limit 5;

如果带where语句，上面就不适合了，带where语句请看下面：

SELECT *
FROM `mm_account` AS t1 JOIN (SELECT ROUND(RAND() * (
(SELECT MAX(id) FROM `mm_account` where id<1000 )-(SELECT MIN(id) FROM `mm_account` where id<1000 ))+(SELECT MIN(id) FROM `mm_account` where id<1000 )) AS id) AS t2
WHERE t1.id >= t2.id
ORDER BY t1.id LIMIT 5;

说说你知道的MySQL的索引类型，并分别简述一下各自的场景

普通索引：没有任何限制条件的索引，该索引可以在任何数据类型中创建。

唯一索引：使用UNIQUE参数可以设置唯一索引。创建该索引时，索引列的值必须唯一，但允许有空值。通过唯一索引，用户可以快速地定位某条记录，主键索引是一种特殊的唯一索引。

全文索引：仅可用于 MyISAM 表，针对较大的数据，生成全文索引耗时耗空间。

空间索引：只能建立在空间数据类型上。这样可以提高系统获取空间数据类型的效率。仅可用于 MyISAM 表，索引的字段不能为空值。使用SPATIAL参数可以设置索引为空间索引。

单列索引：只对应一个字段的索引。

多列索引：在表的多个字段上创建一个索引。该索引指向创建时对应的多个字段，用户可以通过这几个字段进行查询，想使用该索引，用户必须使用这些字段中的一个字段。

参考：

盘点那些面试中最常问的MySQL问题

posted @ 2021-12-02 13:29 残城碎梦阅读(215) 评论(0) 收藏举报

刷新页面返回顶部

残城碎梦

盘点那些面试中最常问的MySQL问题

公告