第8章数据库考察点

Mysql 基础考点

事务的原理，特性，事务并发控制

◆常用的字段、含义和区别

◆常用数据库引擎之间区别

什么是事务？

Transaction

◆事务是数据库并发控制的基本单位

◆事务可以看作是一系列SQL语句的集合

◆事务必须要么全部执行成功，要么全部执行失败（回滚）

转账操作是事务使用的一个常见场景

事务的ACID特性

ACID是事务的四个基本特性

牢记四个特性以及它们的含义

◆原子性（Atomicity）：一个事务中所有操作全部完成或失败

◆一致性（Consistency）：事务开始和结束之后数据完整性没有被破坏

◆隔离性（Isolation）：允许多个事务同时对数据库修改和读写

◆持久性（Durability)：事务结束之后，修改是永久的不会丢失

事务的并发控制可能产生哪些问题

如果不对事务进行并发控制，可能会产生四种异常情况

◆幻读（phantom read）：一个事务第二次查出现第一次没有的结果

◆非重复读（nonrepeatable read）:一个事务重复读两次得到不同结果

◆脏读（dirty read）：一个事务读取到另一个事务没有提交的修改

◆丢失修改（lost update）：并发写入造成其中一些修改丢失

四种事务隔离级别

为了解决并发控制异常，定义了4种事务隔离级别

◆读未提交（read uncommitted）：别的事务可以读取到未提交改变

◆读已提交（read committed）：只能读取已经提交的数据

◆可重复读（repeatable read）：同一个事务先后查询结果一样

Mysql InnoDB默认实现可重复读级别

◆串行化（ Serializable）：事务完全串行化的执行，隔离级别最高，执行效率最低

如何解决高并发场景下的插入重复

高并发场景下，写入数据库会有数据重复问题

◆使用数据库的唯一索引

◆使用队列异步写入

◆使用 redis等实现分布式锁

乐观锁和悲观锁

什么是乐观锁，什么是悲观锁

◆悲观锁是先获取锁再进行操作。一锁二查三更新 select for update

◆乐观锁先修改，更新的时候发现数据已经变了就回滚（check and set）

乐观锁一般通过版本,号或者时间戳实现

◆使需要根据响应速度、冲突频率、重试代价来判断使用哪一种

Mysql常用数据类型-字符串（文本）

Mysql 常用数据类型-数值

Mysql常用数据类型-日期和时间

InnoDB Vs MyISAM

两种引擎常见的区别

◆ MyISAM不支持事务， InnoDB支持事务

◆ MyISAM不支持外键， InnoDB支持外键

◆ MyISAN只支持表锁， InnoDB支持行锁和表锁

Mysql 索引原理及优化常见考题

Mysql 索引

◆索引的原理、类型、结构

◆创建索引的注意事项，使用原则

◆如何排査和消除慢查询

什么是索引？

为什么需要索引？

◆索引是数据表中一个或者多个列进行排序的数据结构

◆索引能够大幅提升检索速度（回顾下你所知道的査找结构）

◆创建、更新索引本身也会耗费空间和时间

什么是 B-Tree？

查找结构进化史

数据结构可视化：https://www.cs.usfca.edu/~galles/visualization/Algorithms.html

Binary Search Tree

AVL Tree

注意这里出现了平衡操作,但是依然无法解决节点太多树高度非常深的问题

查找结构进化史

线性查找：一个个找；实现简单；太慢

二分査找：有序；简单；要求是有序的，插入特别慢

HASH：查询快；占用空间；不太适合存储大规模数据

二叉査找树∶插入和査询很快（log（n）；无法存大规模数据，复杂度退化

平衡树：解决bst退化的问题，树是平衡的；节点非常多的时候，依然树高很高

多路查找树：一个父亲多个孩子节点（度）；节点过多树高不会特别深

多路平衡查找树-B-Tree

什么是B-Tree？

什么是B-Tree，为什么要使用 B-Tree

◆多路平衡查找树（每个节点最多m（m>=2）个孩子称为m阶或者度）

◆叶节点具有相同的深度

◆节点中的数据key从左到右是递增的

B+Tree

B+ 树是B-Tree的变形

◆Mysql 实际使用的B+Tree作为索引的数据结构

◆只在叶子节点带有指向记录的指针（为什么？可以增加树的度）

◆叶子结点通过指针相连。为什么？实现范围查询

问题：是不是树的度越多越好了呢？

根据磁盘块去确定的

Mysq索引的类型

Mysql 创建索引类型

◆普通索引（CREATE INDEX)

◆唯一索引，索引列的值必须唯一（CREATE UNIQUE INDEX)

◆多列索引

◆主键索引（PRIMARY KEY），一个表只能有一个

◆全文索引（FULLTEXT INDEX）， InnoDB不支持

创建索引有哪些需要注意的？

最佳实践

◆非空字段 NOT NULL,Mysql 很难对空值作查询优化

很多互联网公司的建表规范要求索引字段有默认值

◆区分度高，离散度大，作为索引的字段值尽量不要有大量相同值

◆索引的长度不要太长（比较耗费时间）

索引什么时候失效？

记忆口诀：模糊匹配、类型隐转、最左匹配

◆以%开头的LIKE语句，模糊搜索

◆出现隐式类型转换（在 Python这种动态语言查询中需要注意）

◆没有满足最左前缀原则（想想为什么是最左匹配？）

什么是聚集索引和非聚集索引？

什么是聚集索引？什么是非聚集索引？

◆聚集还是非聚集指的是B+Tree叶节点存的是指针还是数据记录

◆MyISAM索引和数据分离，使用的是非聚集索引

◆InnoDB数据文件就是索引文件，主键索引就是聚集索引

非聚集索引

非聚集和聚集索引的文件存储方式

区别是在B+Tree的叶节点存储数据还是指针

聚集索引

聚集索引与辅助索引

辅助索引先找到,主键以后再根据主键找到数据

如何排查慢查询

慢查询通常是缺少索引，索引不合理或者业务代码实现导致

◆slow_query_log_file 开启并且查询慢查询日志

◆通过 explain 排查索引问题

◆调整数据修改索引；业务代码层限制不合理访问

本章回顾

索引的原理是重点

◆索引的原理

◆B+Tree的结构

◆不同索引的区别

SQL语句编写常考题

考点聚焦

SQL语句以考察各种常用连接为重点

◆内连接（INNER JOIN）：两个表都存在匹配时，才会返回匹配行

◆外连接（LEFT/RIGHT JOIN）返回一个表的行，即使另一个没有匹配

◆全连接（FULL JOIN）：只要某一个表存在匹配就返回

内连接

INNER JOIN

◆将左表和右表能够关联起来的数据连接后返回

◆类似于求两个表的“交集”

o select * from a inner join b on a.id=b.id

外连接

外连接包含左连接和右连接

◆左连接返回左表中所有记录，即使右表中没有匹配的记录

◆右连接返回右表中所有记录，即使左表中没有匹配的记录

◆没有匹配的字段会设置成NULL

MysqL中使用 left join和 right join实现

缓存的使用场景

◆为什么要使用缓存？使用场景？

◆Redis的常用数据类型，使用方式

◆缓存使用问题：数据一致性问题；缓存穿透、击穿、雪崩问题

操作时间对比

Redis的使用

Redis和 Memcached主要区别？

Mysql + Redis 就能抗住很多业务需求

请简述 Redis常用数据类型和使用场景？

考察对 Redis使用的掌握程度

◆String（字符串）: 用来实现简单的KV键值对存储，比如计数器

◆List（链表）：实现双向链表，比如用户的关注，粉丝列表

◆Hash（哈希表）：用来存储彼此相关信息的键值对

HSET key filed value

◆Set（集合）存储不重复元素，比如用户的关注者

◆Sorted Set（有序集合）：实时信息排行榜

延伸考点：Redis内置实现

对于中高级工程师，需要了解 Redis各种类型的C底层实现方式

◆String：整数或者sds（Simple Dynamic String）

◆List:ziplist或者 double linked list

ziplist通过一个连续的內存块实现list结构，其中的每个 entry节点头部保存前后节点长度信息，实现双向链表功能

◆Hash:ziplist或者 hashtable

◆Set:Intset或者 hashtable

◆SortedSet:skiplist跳跃表

◆深入学习请参考：《Redis设计与实现》

自我检查：你知道这些数据结构操作的时间和空间复杂度么？

Redis实现的跳跃表是什么结构？

Sorted set为了简化实现，使用 skiplist而不是平衡树实现

Redis 有哪些持久化方式？

Redis支持两种方式实现持久化

◆快照方式：把数据快照放在磁盘二进制文件中，dump.rdb

快照的实现方式是指定时间间隔把 Redis数据库状态保存到一个压缩的二进制文件中

◆AOF（Append Only File）：每一个写命令追加到 appendonly.aof中

◆可以通过修改 Redis配置实现

什么是 Redis事务？

和Mysql的事务有什么不同？

◆将多个请求打包，一次性、按序执行多个命令的机制

◆Redis通过 MULTI, EXEC, WATCH等命令实现事务功能

Python redis-py pipeline=conn.pipeline（transaction=True）

Redis如何实现分布式锁？

◆使用 setnx实现加锁，可以同时通过 expire添加超时时间

◆锁的 value值可以使用一个随机的uuid或者特定的命名

◆释放锁的时候，通过uuid判断是否是该锁，是则执行 delete释放锁

使用缓存的模式？

常用的缓存使用模式

◆ Cache aside：同时更新缓存和数据库

◆Read/Write Through：先更新缓存，缓存负责同步更新数据库

◆ Write Behind Caching：先更新缓存，缓存定期异步更新数据库

数据库和缓存之间的数据一致性

先更新数据库后更新缓存，并发写操作可能导致缓存读取的是脏数据

一般先更新数据库然后删除缓存

缓存使用中的坑

如何解决缓存穿透问题？

大量查询不到的数据的请求落到后端数据库，数据库压力增大

◆由于大量缓存査不到就去数据库取，数据库也没有要查的数据

很多无脑爬虫通过自增id的方式爬取网站，网站查不到相关id的数据

◆解决：对于没查到返回为None的数据也缓存

◆插入数据的时候删除相应缓存，或者设置较短的超时时间

如何解决缓存击穿问题？

某些非常热点的数据key过期，大量请求打到后端数据库

◆热点数据key失效导致大量请求打到数据库增加数据库压力

◆分布式锁：获取锁的线程从数据库拉数据更新缓存，其他线程等待

◆异步后台更新：后台任务针对过期的key自动刷新

如何解决缓存雪崩问题？

缓存不可用或者大量缓存key同时失效，大量请求直接打到数据库

◆多级缓存：不同级别的key设置不同的超时时间

◆随机超时：key的超时时间随机设置，防止同时超时

◆架构层：提升系统可用性。监控、报警完善

Mysql 与 Redis 练习题

Mysql 思考题

索引的理解

◆为什么Mysql数据库的主键使用自增的整数比较好？

◆使用uuid 可以吗？为什么？

◆如果是分布式系统下我们怎么生成数据库的自增id呢？

Redis 应用-分布式锁

Redis的应用之一：实现分布式锁

◆请你基于 Redis编写代码实现一个简单的分布式锁

◆要求：支持超时时间参数

◆深入思考：如果 Redis单个节点宕机了，如何处理？还有其他业界的方案实现分布式锁么？

<wiz_tmp_tag id="wiz-table-range-border" contenteditable="false" style="display: none;">

posted @ 2021-02-10 17:20 元贞阅读(107) 评论(0) 收藏举报

刷新页面返回顶部

第8章 数据库考察点

Mysql 基础考点

什么是事务？

事务的ACID特性

事务的并发控制可能产生哪些问题

四种事务隔离级别

如何解决高并发场景下的插入重复

乐观锁和悲观锁

Mysql常用数据类型-字符串（文本）

Mysql常用数据类型-日期和时间

InnoDB Vs MyISAM

Mysql 索引原理及优化常见考题

Mysql 索引

什么是索引？

什么是 B-Tree？

查找结构进化史

什么是B-Tree？

B+Tree

Mysq索引的类型

创建索引有哪些需要注意的？

索引什么时候失效？

什么是聚集索引和非聚集索引？

非聚集索引

非聚集和聚集索引的文件存储方式

聚集索引

聚集索引与辅助索引

如何排查慢查询

本章回顾

SQL语句编写常考题

内连接

外连接

缓存的使用场景

Redis的使用

Redis和 Memcached主要区别？

请简述 Redis常用数据类型和使用场景？

延伸考点：Redis内置实现

什么是 Redis事务？

Redis如何实现分布式锁？

使用缓存的模式？

缓存使用中的坑

如何解决缓存穿透问题？

如何解决缓存击穿问题？

如何解决缓存雪崩问题？

Mysql 与 Redis 练习题

Mysql 思考题

Redis 应用-分布式锁

公告

第8章数据库考察点