MySQL数据库常见面试题

SQL基础

1.MySQL的数据类型

2.MySQL的SQL语句分类

DDL（Data Definition Language）语句：数据定义语言,这些语句定义了不同的数据段、表、列、索引等数据库对象的定义。常用的语句关键字主要包括create、drop、alter等。

DML（Data Manipulation Language）语句：数据操纵语句，用于添加、删除、更新和查询数据库记录，并检查数据完整性，常用的语句关键字主要包括insert、delete、update和select等。

DCL（Data Control Language）语句：数据控制语句，用于控制不同数据段直接的许可和访问级别的语句。这些语句定义了数据库、表、字段、用户的访问权限和安全级别。主要的语句关键字包括grant、revoke等。

数据库范式

第一范式（1NF）是指在关系模型中，数据库表的每一列都是不可分割的原子数据项，而不能是集合，数组，记录等非原子数据项。
第二范式（2NF）是在1NF的基础上，要求实体的属性完全依赖于主关键字。所谓完全依赖是指不能存在仅依赖主关键字一部分的属性
第三范式（3NF）在2NF基础上，任何非主属性不依赖于其它非主属性（在2NF基础上消除传递依赖）
巴斯-科德范式（BCNF）在3NF基础上，任何非主属性不能对主键子集依赖（在3NF基础上消除对主码子集的依赖）

白话区:
第一范式：每个表应该有唯一标识每一行的主键。
第二范式：在复合主键的情况下，非主键部分不应该依赖于部分主键。
第三范式：非主键之间不应该有依赖关系。
BC范式:排除了任何属性(不光是非主属性，2NF和3NF所限制的都是非主属性)对候选键的传递依赖与部分依赖。

MyISAM与Innodb区别

(1)MyISAM不支持事务,Innodb支持事务

(2)Myisam不支持外键,innodb支持外键

(3)myisam支持表级锁,innodb支持行级锁

(4)innodb 进行select count(*) from tablename时,需要对表进行一次遍历;myisam进行select count(*) from tablename时

(5)myisam删除表时,先将表drop,然后新建一个表;innodb则是将表中数据一条一条的删除

(6)对于包含auto-increment字段的索引,innodb只包含auto-increment字段;而myisam则可以和其他字段一起建立联合索引

(7)myisam搜索引擎查找要比innodb搜索引擎快

(8)innodb中索引没有fulltext类型,而myisam中有fulltext类型

视图

视图（View）是一种虚拟存在的表，对于使用视图的用户来说基本上是透明的。视图并
不在数据库中实际存在，行和列数据来自定义视图的查询中使用的表，并且是在使用视图时
动态生成的
 简单：使用视图的用户完全不需要关心后面对应的表的结构、关联条件和筛选条件，
对用户来说已经是过滤好的复合条件的结果集。
 安全：使用视图的用户只能访问他们被允许查询的结果集，对表的权限管理并不能
限制到某个行某个列，但是通过视图就可以简单的实现。
 数据独立：一旦视图的结构确定了，可以屏蔽表结构变化对用户的影响，源表增加
列对视图没有影响；源表修改列名，则可以通过修改视图来解决，不会造成对访问
者的影响

事务的特性及隔离级别:

1.事务特性--ACID
Atomicity(原子性):要么全做,要么不做,不能只做一半(银行转账)
Consistency(约束性):事务的前后,约束都能满足
Isolation(依赖性):事务之间是独立的,互不影响的
Durability(持久性):事务执行之后,事物的结果可以持久保存

2.事务隔离级别:
read uncommitted:可以读到未提交的事务结果
read committed:只能读已提交事务的结果
repeatable reads:可以读到开启事务时的值
serializable:两个事务同时发生,必定是有先后的

索引

1.什么是索引

索引（Index）是帮助MySQL高效获取数据的数据结构。

2.索引的种类

从逻辑角度

1、主键索引：主键是一种唯一性索引，但它必须指定为“PRIMARY KEY”
2、唯一索引：不允许具有索引值相同的行，从而禁止重复的索引或键值。系统在创建该索引时检查是否有重复的键值，并在每次使用 INSERT 或 UPDATE 语句添加数据时进行检查。
3、组合索引

从物理存储角度
1、聚簇索引（clustered index）：聚簇索引的叶子节点就是数据节点
2、非聚簇索引（non-clustered index）：非聚簇索引的叶子节点仍然是索引节点，只不过有指向对应数据块的指针。

从数据结构角度
1、B+树索引
2、hash索引
3、FULLTEXT索引（InnoDB引擎5.7以后支持）：

3.索引的设计原则

4.索引存在但是不使用索引

(1)如果MySQL估计使用索引比全表扫描更慢,则不使用索引。例如如果列key_part1均匀分布在1~100之间,下列查询使用索引就不是很好

SELECT * FROM table_name where key_part1 > 1 and key_part1 < 90;

(2)如果使用 MEMORY/HEAP 表并且 where 条件中不使用“=”进行索引列，那么不会用到索引。heap 表只有在“=”的条件下才会使用索引。

(3)用 or 分割开的条件，如果 or 前的条件中的列有索引，而后面的列中没有索引，那么涉及到的索引都不会被用到，例如

(4)对于符合索引如果不是第一列,在查询中也不会被MySQL用到

(5)如果like是以%开始,那么索引不会被MySQL使用

(6)如果列类型是字符串，那么一定记得在 where 条件中把字符常量值用引号引起来，否则的话即便这个列上有索引，MySQL 也不会用到的，因为，MySQL 默认把输入的常量值进行转换以后才进行检索。

5.B+Tree索引

B+树：B+树是为磁盘或其他直接存取辅助设备设计的一种平衡查找树。在B+树中，所有记录结点都是按键值的大小顺序存放在同一层的叶子节点上，由各叶子节点指针进行连接。

数据库中B+树索引分为聚集索引和辅助索引,两者内部都是B+树,即高度平衡的,叶子节点存放着所有的数据。聚集索引与辅助索引不同的是，叶子节点存放的是否是一整行的信息。

聚集索引

聚集索引：聚集索引就是按照每张表的主键构造的一棵B+树，同时叶子节点中存放的即为整张表的行记录数据，也将聚集索引的叶子节点称为数据页。

辅助索引

慢查询

1.为什么查询速度会慢

查询性能低下最基本的原因是访问的数据太多。某些查询可能不可避免的需要筛选大量数据，但这并不常见。大部分性能低下的查询都可以减少访问的数据量的方式进行优化。对于低效的查询，我们发现通过下面两个步骤来分析总是很有效：

（1）确认应用程序是否在检索大量超过需要的数据。这通常意味着访问了太多的行，但有时候也可能是访间了太多的列。
（2）确认MYSQL服务器层是否在分析大量超过需要的数据行。

2.慢查询基础

（1）是否向数据库请求了不需要的数据

查询不需要的记录
一个常见的错误是常常会误以为MYSQL会只返回需要的数据，实际上MYSQL却
是先返回全部结果集再进行计算。我们经常会看到一些了解其他数据库系统的人会
设计出这类应用程序。这些开发者习惯使用这样的技术，先使用SELECT语句查询大
量的结果，然后获取前面的N行后关闭结果集（例如在新闻网站中取出100条记录，
但是只是在页面上显示前面10条）。他们认为MYSQL会执行查询，并只返回他们
需要的10条数据，然后停止查询。实际情况是MYSQL会查询出全部的结果集，客
户端的应用程序会接收全部的结果集数据，然后抛弃其中大部分数据。最简单有效
的解决方法就是在这样的查询后面加上LIMIT。
多表关联时返回全部列
如果你想查询所有在电影Academy Dinosaur中出现的演员，千万不要按下面的写法
编写查询:

ysql> select FRO sakila. Actor
MER torn sakila. fin actor usimg(actor. id
-2 INBROR, 5azla to. Mt
-) WERE sakila. Film. Title - 'acadery Dinosaur';
这将返回这三个表的全部数据列。正确的方式应该是像下面这样只取需要的列:
my5ql> SELECT sakila. Actor. " fro sakila. Actor. . ;

总是取出全部列
每次看到SELECT *的时候都需要用怀疑的眼光审视，是不是真的需要返回全部的
列?很可能不是必需的。取出全部列，会让优化器无法完成索引覆盖扫描这类优化，
还会为服务器带来额外的I/O、内存和CPU的消耗。因此，一些DBA是严格禁止
SELECT *的写法的，这样做有时候还能避免某些列被修改带来的问题。
当然，查询返回超过需要的数据也不总是坏事。在我们研究过的许多案例中，人们
会告诉我们说这种有点浪费数据库资源的方式可以简化开发，因为能提高相同代码
片段的复用性，如果清楚这样做的性能影响，那么这种做法也是值得考虑的。如果
应用程序使用了某种缓存机制，或者有其他考虑，获取超过需要的数据也可能有其
好处，但不要忘记这样做的代价是什么。获取并缓存所有的列的查询，相比多个独
立的只获取部分列的查询可能就更有好处。
重复查询相同的数据
如果你不太小心，很容易出现这样的错误——不断地重复执行相同的查询，然后每
次都返回完全相同的数据。例如，在用户评论的地方需要查询用户头像的URL,那
么用户多次评论的时候，可能就会反复查询这个数据。比较好的方案是，当初次查
的的时候将这个数据缓存起来，需要的时候从缓存中取出，这样性能显然会更好

（2）MySQL是否在扫描额外的记录

响应时间

扫描行数

返回的行数

3.查看慢查询日志

慢查询日志记录了包含所有执行时间超过参数 long_query_time（单位：秒）所设置值的 SQL
语句的日志。获得表锁定的时间不算作执行时间。
(1) 文件位置和格式
当用--log-slow-queries[=file_name]选项启动 mysqld（MySQL 服务器）时，慢查询日志开始被
记录。和前面几种日志一样，如果没有给定 file_name 的值，日志将写入参数 DATADIR（数
据目录）指定的路径下，默认文件名是 host_name-slow.log。
(2) 日志的读取
和错误日志、查询日志一样，慢查询日志记录的格式也是纯文本，可以被直接读取。下例中
演示了慢查询日志的设置和读取过程。
(2.1)首先查询一下 long_query_time 的值。

mysql> show variables like 'long%';
+-----------------+-------+
| Variable_name | Value |
+-----------------+-------+
| long_query_time | 10 | 
+-----------------+-------+
1 row in set (0.00 sec)

（2.2）为了方便测试，将修改慢查询时间为 2 秒。

mysql> set long_query_time=2;
Query OK, 0 rows affected (0.02 sec)

（2.3）依次执行下面两个查询语句。
第一个查询因为查询时间低于 2 秒而不会出现在慢查询日志中：

mysql> select count(1) from emp;
+----------+
| count(1) |
+----------+
| 131075 | 
+----------+
1 row in set (0.00 sec)

第二个查询因为查询时间大于 2 秒而应该出现在慢查询日志中：

mysql> select count(1) from emp t1,dept t2 where t1.id=t2.id;
322
+----------+
| count(1) |
+----------+
| 33555200 | 
+----------+
1 row in set (11.31 sec)

（2.4）查看慢查询日志。

[root@localhost mysql]# more localhost-slow.log
/usr/sbin/mysqld, Version: 5.0.41-community-log (MySQL Community Edition (GPL)). started 
with:
Tcp port: 3306 Unix socket: /var/lib/mysql/mysql.sock
Time Id Command Argument
# Time: 070810 23:43:55
# User@Host: root[root] @ localhost []
# Query_time: 297 Lock_time: 0 Rows_sent: 0 Rows_examined: 26214
use test;
# Query_time: 11 Lock_time: 0 Rows_sent: 1 Rows_examined: 512
select count(1) from emp t1,dept t2 where t1.id=t2.id;

从上面日志中，可以发现查询时间超过 2 秒的 SQL，而小于 2 秒的则没有出现在此日志中。
如果慢查询日志中记录内容很多，可以使用 mysqldumpslow 工具（MySQL 客户端安装自带）
来对慢查询日志进行分类汇总。下例中对日志文件 bj37-slow.log 进行了分类汇总，只显示汇
总后摘要结果：

[zzx@bj37 data]$ mysqldumpslow bj37-slow.log
[root@localhost mysql]# mysqldumpslow localhost-slow.log
Reading mysql slow query log from localhost-slow.log
Count: 1 Time=297.00s (297s) Lock=0.00s (0s) Rows=0.0 (0), root[root]@localhost
select count(N) from emp t1,emp t2 where t1.id<>t2.id
Count: 2 Time=11.00s (22s) Lock=0.00s (0s) Rows=1.0 (2), root[root]@localhost
select count(N) from emp t1,dept t2 where t1.id=t2.id
Count: 1 Time=9.00s (9s) Lock=0.00s (0s) Rows=0.0 (0), root[root]@localhost
select count(N) from emp t1,emp t2 where t1.id=t2.id
Count: 2 Time=3.00s (6s) Lock=0.00s (0s) Rows=1.0 (2), root[root]@localhost
select count(N) from emp t1,dept t2 where t1.id=t2.id and t1.id=N

对于 SQL 文本完全一致，只是变量不同的语句，mysqldumpslow 将会自动视为同一个语句进
行统计，变量值用 N 来代替。这个统计结果将大大增加用户阅读慢查询日志的效率，并迅
速定位系统的 SQL 瓶颈。
注意：慢查询日志对于我们发现应用中有性能问题的 SQL 很有帮助，建议正常情况下，打开此
日志并经常查看分析。
(3) 其他选项
在 MySQL 5.1 中，通过--log-slow-admin-statements 服务器选项，可以请求将慢管理语句，例
如 OPTIMIZE TABLE、ANALYZE TABLE 和 ALTER TABLE 写入慢查询日志

MySQL优化

1.优化SQL语句

(1)通过show status命令了解各种SQL的执行效率

例如show status like 'Com_%'

Com_select：执行select操作的次数，一次查询只累加1.
Com_insert：执行insert操作的次数，对于批量插入的INSERT操作，只累加一次。
Com_updated：执行UPDATE操作的次数。
Com_deleted：执行delle操作的次数。

Innodb_rows_read：select查询返回的行数.
Innodb_rows_inserted：执行INSERT操作插入的行数。
Innodb_rows_updated：执行UPDATE操作更新的行数
Innodb_rows_deleted：执行DELETE操作删除的行数。

Connections:：图连接MYSQL服务器的次数。
Uptime：服务器工作时间。
Slow_queries：慢查询的次数。

(2)定位性效率较低的SQL语句

通过慢查询日志定位那些执行效率较低的sql语句，用--log-slow-queries[=file_name]选
项启动时，mysqld写一个包含所有执行时间超过long_query_time秒的SQL语句的日志
文件。
慢查询日志在查询结束以后才纪录，所以在应用反映执行效率出现问题的时候慢查
询日志并不能定位问题，可以使用show processlist命令查看当前mysql在进行的线程，
包括线程的状态、是否锁表等，可以实时地查看SOL的执行情况，同时对一些锁表操
作进行优化。

(3)通过Explain分析低效SQL的执行计划

Explain解析的每一列含义:

select_type:表示select的类型，常见的取值有simple(简单表，即不使用表连接
或者子查询）、PRIMARV(主查询，即外层的查询）、UNION(UNION中的第二个或
中的第二个或者后面的查询语句）、SUBQUERY (子查询中的第一个SHLECT)等。
table:输出结果集的表。
type:表示表的连接类型，性能由好到差的连接类型为
　　system(表中仅有一行，即常量表)、
　　const(单表中最多有一个匹配行，例如primary key或者unique index).
　　eq_ref(对于前面的每一行，在此表中只查询一条记录，简单来说，就是多表连接中使用primary key或者unique index)、
　　ref(与eq_ref类似，区别在于不是使用primary key或者unique index,而是使用普通的索引)、
　　ref_or_null(与ref类似，区别在于条件中包含对NULL的查询）、
　　index_merge(索引合并优化)、
　　unique_subquery (in的后面是一个查询主键字段的子查询）、
　　index_subquery(与unique_Subquery类似，区别在于in的后面是查询非唯一索引字段的子查询）、
　　range(单表中的范围查询）、
　　index(对于前面的每一行，都通过查询索引来得到数据）、
　　all(对于前面的每一行都通过全表扫描来得到数据）。
possible_keys:表示查询时，可能使用的索引
key:表示实际使用的索引。
key_len:索引字段的长度。
rows:扫描行的数量。
extra:执行情况的说明和描述。

(4)确定问题并采取相应的优化措施

2.MySQL如何使用索引

posted @ 2018-01-31 22:29 KristinLee 阅读(1442) 评论(0) 收藏举报

刷新页面返回顶部

Kristin