Mysql 知识点

一、二叉树、B树、B+树
二叉树具有以下性质：左子树的键值小于根的键值，右子树
的键值大于根的键值。二叉树的查询效率就低了。

平衡二叉树（AVL树）在符合二叉查找树的条件下，还满足任何节点的两个子树的高度最大差为1。

平衡多路查找树（B-Tree），系统从磁盘读取数据到内存时是以磁盘块（block）为基本单位的，位于同一个磁盘块中的数据会被一次性读取出来。InnoDB存储引擎中有页（Page）的概念，页是其磁盘管理的最小单位，默认16K。InnoDB每次申请磁盘空间时都会是若干地址连续磁盘块来达到页的大小16KB。

缺点：每个节点中不仅包含数据的key值，还有data值。而每一个页的存储空间是有限的，如果data数据较大时将会导致每个节点（即一个页）能存储的key的数量很小，当存储的数据量很大时同样会导致B-Tree的深度较大，增大查询时的磁盘I/O次数，进而影响查询效率。

B+Tree相对于B-Tree有几点不同：

非叶子节点只存储键值信息。

所有叶子节点之间都有一个链指针。

数据记录都存放在叶子节点中

在数据库中，B+Tree的高度一般都在2~4层。mysql的InnoDB存储引擎在设计时是将根节点常驻内存的，也就是说查找某一键值的行记录时最多只需要1~3次磁盘I/O操作。

数据库索引采用B+树的主要原因是：B树在提高了IO性能的同时并没有解决元素遍历的我效率低下的问题，正是为了解决这个问题，B+树应用而生。
B+树只需要去遍历叶子节点就可以实现整棵树的遍历。而且在数据库中基于范围的查询是非常频繁的，而B树不支持这样的操作或者说效率太低。

二、聚集索引与非聚集索引

聚集索引：数据行的物理顺序与列值（一般是主键的那一列）的逻辑顺序相同，一个表中只能拥有一个聚集索引,一般指主键。

非聚集索引：除聚集索引外其他都是的，包括普通索引，唯一索引，全文索引。叶子节点并不包含行记录的全部数据，

　　而是存储相应行数据的聚集索引键。使用非聚集索引查询，而查询列中包含了其他该索引没有覆盖的列，
　　那么他还要进行第二次的查询，查询节点上对应的数据行的数据。
　　mysql索引一般建5-8个左右,索引过多，影响数据的操作(insert、update、delete)优化建议使用联合索引。大字段值不建议建索引。

　　创建索引和维护索引需要耗费时间，这个时间随着数据量的增加而增加；
　　索引需要占用物理空间，不光是表需要占用数据空间，每个索引也需要占用物理空间；
　　当对表进行增、删、改、的时候索引也要动态维护，这样就降低了数据的维护速度。

三、如何解决非聚集索引的二次查询问题

如建立符复合索引，只查询复合索引里的列的数据而不需要进行回表二次查询，注意最左原则

四、Mysql 索引失效

1、查询时索引列不能为null值，因为索引是有序的，建索引时无法确定位置。

2、查询时采用is Null,只能全表扫描。

3、数据库数据量较少时，mysql判断全表查询快时将不使用索引。

4、like查询以%开头，类型隐士转换、列参与函数运算、使用or查询，联合索引非最左

五、MySQL中Myisam与Innodb的区别

InnoDB索引是聚簇索引，MyISAM索引是非聚簇索引。
InnoDB的主键索引的叶子节点存储着行数据，因此主键索引非常高效。
MyISAM索引的叶子节点存储的是行数据地址，需要再寻址一次才能得到数据。
InnoDB非主键索引的叶子节点存储的是主键和其他带索引的列数据，因此查询时做到覆盖索引会非常高效。

　　InnoDB支持事物、支持行级锁(基于索引来完成行锁)，Myisam支持表级锁,不支持事物。

　　InnoDB支持MVCC、外键，Myisam不支持,支持全文索引。

　　Myisam查询表较快。

六、Innodb引擎四大特点

插入缓冲（insert buffer),二次写(double write),自适应哈希索引(ahi),预读(read ahead)

参考： https://www.cnblogs.com/zhs0/p/10528520.html

七、Innodb的事务与日志的实现方式

隔离级别：读未提交(RU)、读已提交(RC)、可重复读(RR)、串行，mysql默认可重复读，mysql通过MVCC(多版本控制)和 Next-key lock(间隙锁)解决了幻读。

MVCC原理：通过在每行纪录后面保存三个隐藏的列来实现的。这两个列，一个保存了行的创建时间，一个保存了行的过期时间（或删除时间），当然存储的并不是实际的时间值，而是系统版本号。每开始一个新的事务，系统版本号都会自动递增。事务开始时刻的系统版本号会作为事务的版本号，用来和查询到的每行纪录的版本号进行比较。

MVCC是解决读写并行的幻读，而next-key lock 间隙锁是解决写写并行的幻读。

Mysql日志：

慢查询日志（slow query log）:记录慢查询的日志文件

查询日志（general log）:记录所有对数据库请求的信息

重做日志（redo log）:

回滚日志（undo log）:

二进制日志（binlog）:用于复制，在主从复制中，从库利用主库上的binlog进行重播，实现主从同步

错误日志（errorlog）:

中继日志（relay log）:

事务日志是通过redo和innodb的存储引擎插入缓冲（Innodb log buffer）来实现的，当开始一个事务的时候，会记录该事务的lsn(log sequence number)号; 当事务执行时，会往InnoDB存储引擎的日志

的日志缓存里面插入事务日志；当事务提交时，必须将存储引擎的日志缓冲写入磁盘（通过innodb_flush_log_at_trx_commit来控制），也就是写数据前，需要先写日志。这种方式称为“预写日志方式”。

八、MySQL数据库cpu飙升到500%的话他怎么处理？

列出所有进程，观察所有进程，没有状态变化的(干掉)

查看超时日志或者错误日志

九、你是否做过主从一致性校验，如果有，怎么做的，如果没有，你打算怎么做？

主从一致性校验有多种工具例如checksum、mysqldiff、pt-table-checksum等

十、你们数据库是否支持emoji表情，如果不支持，如何操作？

如果是utf8字符集的话，需要升级至utf8_mb4方可支持

十一、Mysql索引查询优化

1.避免在索引列上使用IS NULL和IS NOT NULL，列字段尽量要有默认值.

2.避免 SELECT *

3.千万不要 ORDER BY RAND()

4.在Join表的时候使用相同的类型并将其索引

5.当只要一行数据时使用 LIMIT 1

6.EXPLAIN 分析你的 SELECT 查询

7.每张表都设置ID

8.不要条件列进行函数处理

9.避免使用 or，like 等字段

10.选取最适用的字段属性，尽可能减少定义字段宽度

11.用EXISTS替代IN、用NOT EXISTS替代NOT IN。

十二、分布式事物理解

1.事物的ACID。原子性、一致性、隔离性、持久性

2.分布式系统中经常出现断电、网络异常、应用宕机等问题导致不一致问题。

3.执行事务的时候数据库首先会记录下这个事务的redo操作日志，然后才开始真正操作数据库，在操作之前首先会把日志文件写入磁盘，那么当突然断电的时候，即使操作没有完成，在重新启动数据库时候，数据库会根据当前数据的情况进行undo回滚或者是redo前滚，这样就保证了数据的强一致性。

4.随着业务扩展，单库无法满足，需对数据库垂直分库，此时单个数据库ACID已经不能适应。

5.CAP定理，一致性，可用性，分区容错性。

6.程序中追求可用性要高于一致性，此时出现BASE定理,基本可用、软状态、最终一致性。

解决方案：

具体详解： https://blog.csdn.net/u010425776/article/details/79516298

两阶段提交
基于可靠消息服务MQ的分布式事务，主流MQ不支持，
TCC（两阶段+补偿）二阶段提交失败，嵌入回滚代码，Confirm/Cancel服务的幂等性保障。增大业务复杂度。
本地消息表：将分布式事务分成多个本地事物，然后通过异步mq发送消息保证一致性。

十三、mysql集群原理及方案

采用主从复制，读写分离，主备模式

主从复制原理：

   采用异步复制模型

十四、什么是索引？
     索引是一种特殊的文件，它们包含着对数据表里所有记录的引用指针。
　  索引可以加快数据检索速度，但是创建索引和维护索引需要耗时，而且还要占用物理空间。
　  类型：主键索引、唯一索引、普通索引、全文索引。索引的数据结构B+树、hash。

十五、创建索引的原则？
　　1.较为频繁查询条件的字段；
　　2.字段区分度、离散值较高的；
　　3.索引字段长度不能太长；
　　4.索引的个数不要太多，能复用组合索引尽量复用；
　　5.索引列尽量指定为NOT NULL；
　　
十六、索引下推ICP

索引条件下推，Index Condition Pushdown，简称ICP，是MySQL内部通过索引查询数据的一种优化方法，简单来说就是将原本需要在Server层对数据进行过滤的条件下推到了引擎层去做，在引擎层过滤更多的数据，这样从引擎层发送到Server层的数据就会显著减少，从而优化性能。

1、当 SQL 需要全表访问时，ICP 的优化策略可用于 range, ref, eq_ref, ref_or_null 类型的数据访问方式
　　　　2、只适用于 InnoDB 和 MyISAM 两种存储引擎
　　　　3、在 InnoDB 中，ICP 只适用于二级索引
ICP 的目的就是为了减少回表导致的磁盘 I/O，而 InnoDB 的聚簇索引的叶子节点存放的就是完整的数据记录，只要索引数据被读到内存了，那么索引项对应的完整数据记录也就读到内存了，那么通过索引项获取数据记录的过程就在内存中进行了，无需进行磁盘 I/O；也就说聚簇索引上应用 ICP，不会减少磁盘 I/O，也就没有使用的意义了
　　　　4、不支持覆盖索引
　　　　5、不支持子查询条件的下推
　　　　6、不支持存储过程条件、触发器条件的下推


十七、count 字段区别

1.count(可空字段) 扫描全表，读到server层，判断字段可空，拿出该字段所有值，判断每一个值是否为空，不为空则累加
2.count(非空字段)与count(主键 id) 扫描全表，读到server层，判断字段不可空，按行累加。
3.count(1) 扫描全表，但不取值，server层收到的每一行都是1，判断不可能是null，按值累加。
注意：count(1)执行速度比count(主键 id)快的原因：从引擎返回 id 会涉及到解析数据行，以及拷贝字段值的操作。
4.count(*) MySQL 执行count(*)在优化器做了专门优化。因为count(*)返回的行一定不是空。扫描全表，但是不取值，按行累加。

posted @ 2019-06-04 18:20 作死的学阅读(423) 评论(0) 编辑收藏举报

会员力量，点亮园子希望

刷新页面返回顶部

作死的学

Mysql 知识点

公告