mysql面试题
MySQL凭借着它不错的性能、不错的稳定性、数据的安全性常年稳居行业老二宝座,成为互联网公司首选数据库。
越来越多的DBA和后端同学在工作中少不了和MySQL打交道,也经常会产生这样的疑问:
为什么我写的sql语句性能这么低?
为什么明明我建了索引却没有用到索引?
为什么突然我的数据就成了乱码?
为什么我备份的文件在主库恢复,数据无法同步到从库?
为什么我的数据库数据不多,却占了很多的空间?
生产中我应该选择哪种隔离级别?
生产中都在使用innodb存储引擎,我却对它一无所知?
我应该怎么规划缓冲池才能让数据库性能更高?
为什么我做表数据迁移这么慢?
为什么我写的sql会造成那么多的锁冲突、死锁?
为什么我不能将数据恢复到任意时间点?
为什么我不能解决公司主从复制架构中的故障?
吧啦吧啦一大堆问题……
在面试中MySQL的一些知识更成为躲不过的问题,比如b+tree索引、MVCC、隔离级别的实现、锁的使用,主从复制,MySQL性能优化、事务两阶段提交等等都成为了面试考题重灾区。下面来看下我总结的面试题。
一、为什么用自增列作为主键
1、如果我们定义了主键(PRIMARY KEY),那么InnoDB会选择主键作为聚集索引。
如果没有显式定义主键,则InnoDB会选择第一个不包含有NULL值的唯一索引作为主键索引。
如果也没有这样的唯一索引,则InnoDB会选择内置6字节长的ROWID作为隐含的聚集索引(ROWID随着行记录的写入而主键递增,这个ROWID不像ORACLE的ROWID那样可引用,是隐含的)。
2、如果表使用自增主键,那么每次插入新的记录,记录就会顺序添加到当前索引节点的后续位置(主键插入性能最高,因为是顺序的),当一页写满,就会自动开辟一个新的页
3、如果使用非自增主键(如果身份证号或学号等),由于每次插入主键的值近似于随机,因此每次新纪录都要被插到现有索引页得中间某个位置
此时MySQL不得不为了将新记录插到合适位置而移动数据,甚至目标页面可能已经被回写到磁盘上而从缓存中清掉,此时又要从磁盘上读回来,这增加了很多开销,同时频繁的移动、分页操作造成了大量的碎片,得到了不够紧凑的索引结构,后续不得不通过OPTIMIZE TABLE来重建表并优化填充页面。
二、为什么在字段上添加索引能提高查询效率
1、添加索引的字段的值,是存放在索引构建的b+tree的叶子节点上,并经过排序存放;
2、如有相关查询进来,会通过索引创建的b+tree获取数据所在的数据页(b+tree与二分查找法配合,只需几次io消耗就可以找到对应的数据页);
3、找到数据页后,将页加载到buffer pool中,再内存中从数据页中获取具体数据;
三、B+树索引和哈希索引的区别
B+树是一个平衡的多叉树结构,从根节点到每个叶子节点的高度差值不超过1,而且同层级的节点间有指针相互链接,是有序的,如下图:
哈希索引就是采用一定的哈希算法,把键值换算成新的哈希值,检索时不需要类似B+树那样从根节点到叶子节点逐级查找,只需一次哈希算法即可,是无序的,如下图所示:
四、哈希索引的优势:
等值查询,哈希索引具有绝对优势(前提是:没有大量重复键值,如果大量重复键值时,哈希索引的效率很低,因为存在所谓的哈希碰撞问题。);MySQL中在缓冲池中会开启自适应哈希索引。
五、说说你对MySQL聚集索引的理解
1、聚集索引的选择:
会优先选择显示创建的主键作为聚集索引;
如果没有则选择第一个创建的非空唯一索引作为聚集索引;
如都没有则系统会创建一个实例级别的rowid作为聚集索引。
2、聚集索引的特点:
聚集索引的键值顺序决定了表数据行的物理顺序;
叶子节点上存放的是整行数据;
一张表只能创建一个聚集索引。
六、说说MySQL如何优化普通索引的写操作
如一个普通索引的插入操作,对于非聚集索引叶子节点的插入不再是顺序的了,这时就需要离散地访问非聚集索引页,由于随机读取的存在而导致了插入操作性能下降。
MySQL通过insert buffer(插入缓冲)这个特性,来优化普通索引的写入操作。
对于非聚集索引的插入操作,不是每一次直接插入到索引页中,而是先判断插入的非聚集索引页是否在缓冲池中,若在,则直接插入;若不在,则先放入到一个Insert Buffer对象中。然后再以一定的频率和情况进行Insert Buffer和辅助索引页子节点的merge(合并)操作,这时通常能将多个插入合并到一个操作中(因为在一个索引页中),这就大大提高了对于非聚集索引插入的性能。
七、说说前缀索引使用的注意事项
建前缀索引时,最重要的是定义好长度,把握好度,即可节省内存使用,又可以减少额外的查询成本;前缀索引会对覆盖索引产生影响
八、说说索引影响着哪些方面
索引关乎着MySQL性能,影响着方方面面;
最主要的有这几点:提升读性能;减少锁等待和死锁;主从复制中sql线程利用索引进行回放,减少主从延迟。
九、什么情况下应不建或少建索引
首先大家要知道索引的用处:索引就是用来从大量数据中获取少部分数据
1、经常更新的字段
2、重复值比较高的字段
3、不经常查询的字段
4、如果表中记录数特别特别少,就不建议在表中字段上创建索引;但是如果达到万级别以上,还是建议创建索引
十、如何限制某ip段下的某个ip用户不允许登录
利用用户ip精确匹配的特点;假如原先用户ergou@'192.168.58.%',重新创建一个用户,如ergou@'192.168.58.51',并重新设置密码;这样就会用户通过用户ergou登录,就会匹配到ergou@'192.168.58.51'。
十一、delete与truncate区别
1、delete是逻辑删除,按行删除数据,效率低,支持回滚;但是大家要知道delete只是做了一个删除的标记,具体的删除是由purge线程完成删除,这才会释放空间
2.truncate是物理删除,释放空间,速度快,不支持回滚
十二、生产中为什么建议字段使用not null约束
1、从性能来说,空值会存放在b+tree的左边,造成索引性能下降
2、空值需要更多的存储空间,多1个字节(null列上建立索引后)
3、造成统计结果的不准确,count(*)会统计允许为null的字段,count(某字段)不含null值
十三、什么情况下使用不到索引
1、where条件:
列进行计算:
explain select * from orders where o_custkey=o_custkey+1;
列使用函数:
explain select * from orders where o_custkey=ceil(o_custkey);
列进行隐式转换:
explain select * from emp where ename=007;
2、联合索引:用到范围查询,只能用到部分索引
3、联表查询:
关联条件字符集不同,不走索引
关联条件的列类型不同,不走索引
4、其他情况:
。select * from emp;
。查询结果集大于数据量的30%,不走索引
explain select * from emp where empno > 7000;
。索引本身失效
。like '%s'
explain select * from emp where ename like '%s';
。not in(111,9999) 普通索引,如果是主键索引,会被优化为范围查询,可以利用索引
explain select * from emp where empno not in(111, 9999);
。!=
explain select * from emp where empno != 9999;
十六、四种隔离级别
读未提交(read-uncommitted)RU,产生脏读
读已提交(read-committed)RC,不会产生脏读,产生不可重复读;
可重复读(repeatable-read)RR,不会产生脏读,不会产生不可重复读;会产生幻读(但是innodb默认会阻止产生幻读,通过锁实现);
可串行化(serializeable),不会产生脏读,不会产生不可重复读;不会产生幻读;完美符合事务,但性能最低
十七、MVVC
MySQL InnoDB存储引擎,实现的是基于多版本的并发控制协议——MVCC (Multi-Version Concurrency Control)
MVCC最大的好处:读不加锁,读写不冲突。在读多写少的OLTP应用中,读写不冲突是非常重要的,极大的增加了系统的并发性能,现阶段几乎所有的RDBMS,都支持了MVCC。
MVCC由数据页中的事务id、回滚指针+undo日志,read view构成
十八、事务两阶段提交
阶段1:写redo log,事务处于prepare
阶段2:写binlog,事务处于commit
写binlog成功有xid事件,会将xid写入redo log
十九、binlog与redo log区别
①redo log是innodb存储引擎独有的,binlog是不区分存储引擎
②记录内容不同,redo log是物理逻辑日志,记录页的变化过程;binlog是逻辑日志,记录事务具体操作的内容
③写入时间不同,先写入redo log,再写入binlog
④redo log是循环使用文件,binlog每次新增一个文件
二十、如何快速将一张大表迁移到其他数据库实例
二十一、事务是如何实现的
二十二、MySQL在RR隔离级别下如何阻止幻读
二十三、生产如何尽量避免死锁
二十四、不同隔离级别下、不同索引下innodb行锁的粒度是什么样的
二十五、mysqldump备份原理
二十六、innodb存储引擎行锁冲突问题
二十七、MySQL在备份时,怎么做到一致性备份
二十八、主从复制原理
二十九、主从复制架构的瓶颈
三十、如何减少主从复制延迟
三十一、过滤复制会产生哪些问题
三十二、主从复制中断如何处理
三十三、1062或者1032错误,如何解决
三十四、如何将数据库回档到任意的一天
三十五、说说5.7和8.0在主从复制方面的改进
三十六、DML变慢的原因