MySQL的索引，事务与存储引擎

一.MySQL索引

1.1索引概念

●索引是一个排序的列表，在这个列表中存储着索引的值和包含这个值的数据所在行的物理地址（类似于C语言的链表通过指针指向数据记录的内存地址）。

●使用索引后可以不用扫描全表来定位某行的数据，而是先通过索引表找到该行数据对应的物理地址然后访问相应的数据，因此能加快数据库的查询速度。

●索引就好比是一本书的目录，可以根据目录中的页码快速找到所需的内容。

●索引是表中一列或者若干列值排序的方法。

●建立索引的目的是加快对表中记录的查找或排序

1.2索引的作用

●设置了合适的索引之后，数据库利用各种快速定位技术，能够大大加快查询速度，这是创建索引的最主要的原因。

●当表很大或查询涉及到多个表时，使用索引可以成千上万倍地提高查询速度。

●可以降低数据库的IO成本，并且索引还可以降低数据库的排序成本。

●通过创建唯一(键)性索引，可以保证数据表中每一行数据的唯一性。

●可以加快表与表之间的连接。

●在使用分组和排序时，可大大减少分组和排序的时间。

1.2.1索引的副作用

●索引需要占用额外的磁盘空间。
对于 MyISAM 引擎而言，索引文件和数据文件是分离的，索引文件用于保存数据记录的地址。
而 InnoDB 引擎的表数据文件本身就是索引文件。
●在插入和修改数据时要花费更多的时间，因为索引也要随之变动。

1.3索引的分类

①普通索引

最基本的索引类型，没有唯一性之类的限制。

②唯一索引

与普通索引类似，但区别是唯一索引列的每个值都唯一。
唯一索引允许有空值（注意和主键不同）。如果是用组合索引创建，则列值的组合必须唯一。添加唯一键将自动创建唯一索引。

③主键索引

是一种特殊的唯一索引，必须指定为“PRIMARY KEY”。
一个表只能有一个主键，不允许有空值。添加主键将自动创建主键索引。

④组合索引

可以是单列上创建的索引，也可以是在多列上创建的索引。需要满足最左原则，因为select语句的 where条件是依次从左往右执行的，所以在使用select 语句查询时where条件使用的字段顺序必须和组合索引中的排序一致，否则索引将不会生效。

⑤全文索引

适合在进行模糊查询的时候使用，可用于在一篇文章中检索文本信息。
在 MySQL5.6 版本以前FULLTEXT 索引仅可用于 MyISAM 引擎，在 5.6 版本之后 innodb 引擎也支持 FULLTEXT 索引。
全文索引可以在 CHAR、VARCHAR 或者 TEXT 类型的列上创建。每个表只允许有一个全文索引。

1.4索引的创建方法

①直接给表创建索引

②通过修改表创建索引

③创建表的时候创建索引

1.5索引创建原则

索引虽可以提升数据库查询的速度，但并不是任何情况下都适合创建索引。因为索引本身会消耗系统资源，在有索引的情况下，数据库会先进行索引查询，然后定位到具体的数据行，如果索引使用不当，反而会增加数据库的负担。
●表的主键、外键必须有索引。因为主键具有唯一性，外键关联的是子表的主键，查询时可以快速定位

●记录数超过300行的表应该有索引。如果没有索引，需要把表遍历一遍，会严重影响数据库的性能。

●经常与其他表进行连接的表，在连接字段上应该建立索引。

●唯一性太差的字段不适合建立索引。

●更新太频繁地字段不适合创建索引。

●经常出现在 where 子句中的字段，特别是大表的字段，应该建立索引。

●索引应该建在选择性高的字段上。

●索引应该建在小字段上，对于大的文本字段甚至超长字段，不要建索引。

二.MySQL事务

2.1事务的概念

MySQL 事务主要用于处理操作量大，复杂度高的数据。比如说，在人员管理系统中，要删除一个人员，即需要删除人员的基本资料，又需要删除和该人员相关的信息，如信箱，文章等等。这样，这些数据库操作语句就构成一个事务！

●事务是一种机制、一个操作序列，包含了一组数据库操作命令，并且把所有的命令作为一个整体一起向系统提交或撤销操作请求，即这一组数据库命令要么都执行，要么都不执行。

●事务是一个不可分割的工作逻辑单元，在数据库系统上执行并发操作时，事务是最小的控制单元。

●事务适用于多用户同时操作的数据库系统的场景，如银行、保险公司及证券交易系统等等。

●事务是通过事务的整体性以保证数据的一致性。

说白了，所谓事务，它是一个操作序列，这些操作要么都执行，要么都不执行，它是一个不可分割的工作单位。

2.2事务的特点（ACID）

ACID，是指在可靠数据库管理系统（DBMS）中，事务(transaction)应该具有的四个特性：

①原子性（Atomicity）

●原子性：指事务是一个不可再分割的工作单位，事务中的操作要么都发生，要么都不发生。

事务是一个完整的操作，事务的各元素是不可分的。
事务中的所有元素必须作为一个整体提交或回滚。
如果事务中的任何元素失败，则整个事务将失败。

案例:
A给B转帐100元钱的时候只执行了扣款语句，就提交了，此时如果突然断电，A账号已经发生了扣款，B账号却没收到加款，在生活中就会引起纠纷。这种情况就需要事务的原子性来保证事务要么都执行，要么就都不执行。

②一致性（Consistency）

●一致性：指在事务开始之前和事务结束以后，数据库的完整性约束没有被破坏。

当事务完成时，数据必须处于一致状态。
在事务开始前，数据库中存储的数据处于一致状态。
在正在进行的事务中，数据可能处于不一致的状态。
当事务成功完成时，数据必须再次回到已知的一致状态。

案例:
对银行转帐事务，不管事务成功还是失败，应该保证事务结束后表中A和B的存款总额跟事务执行前一致。

③隔离性（Isolation）

●隔离性：指在并发环境中，当不同的事务同时操纵相同的数据时，每个事务都有各自的完整数据空间。

对数据进行修改的所有并发事务是彼此隔离的，表明事务必须是独立的，它不应以任何方式依赖于或影响其他事务。
修改数据的事务可在另一个使用相同数据的事务开始之前访问这些数据，或者在另一个使用相同数据的事务结束之后访问这些数据。

④持久性（Durability）

●持久性：在事务完成以后，该事务所对数据库所作的更改便持久的保存在数据库之中，并不会被回滚。

指不管系统是否发生故障，事务处理的结果都是永久的。
一旦事务被提交，事务的效果会被永久地保留在数据库中。

这是可靠数据库所应具备的几个特性。

2.3事务之间的相互影响分类

事务之间的相互影响分为四种：

①脏读(读取未提交数据)

脏读指的是读到了其他事务未提交的数据，未提交意味着这些数据可能会回滚，也就是可能最终不会存到数据库中，也就是不存在的数据。读到了并一定最终存在的数据，这就是脏读。

②不可重复读(前后多次读取，数据内容不一致)

一个事务内两个相同的查询却返回了不同数据。这是由于查询时系统中其他事务修改的提交而引起的。

③幻读(前后多次读取，数据总量不一致)

一个事务对一个表中的数据进行了修改，这种修改涉及到表中的全部数据行。同时，另一个事务也修改这个表中的数据，这种修改是向表中插入一行新数据。那么，操作前一个事务的用户会发现表中还有没有修改的数据行，就好象发生了幻觉一样。

④丢失更新

两个事务同时读取同一条记录，A先修改记录，B也修改记录（B不知道A修改过），B提交数据后B的修改结果覆盖了A的修改结果。

2.4事务的隔离级别

①read uncommitted（未提交读）

读取尚未提交的数据：不解决脏读
允许脏读，其他事务只要修改了数据，即使未提交，本事务也能看到修改后的数据值。也就是可能读取到其他会话中未提交事务修改的数居。

②read committed（提交读）

读取已经提交的数据：可以解决脏读
只能读取到已经提交的数据。Oracle等多数数据库默认都是该级别〈不重复读)。

③repeatable read（可重复度）

重读读取：可以解决脏读和不可重复读 —mysql默认的
可重复读。无论其他事务是否修改并提交了数据，在这个事务中看到的数据值始终不受其他事务影响

④serializable

串行化：可以解决脏读不可重复读和虚读—相当于锁表
完全串行化的读，每次读都需要获得表级共享锁，读写相互都会阻塞。

mysql默认的事务处理级别是 repeatable read ；

而Oracle和SQL Server是 read committed。

三.MySQL存储引擎

3.1存储引擎概述

MySQL中的数据用各种不同的技术存储在文件中，每一种技术都使用不同的存储机制、索引技巧、锁定水平并最终提供不同的功能和能力，这些不同的技术以及配套的功能在MySQL中称为存储引擎。
存储引擎是MySQL将数据存储在文件系统中的存储方式或者存储格式。

MySQL数据库中的组件，负责执行实际的数据I/O操作。
MySQL系统中，存储引擎处于文件系统之上，在数据保存到数据文件之前会传输到存储引擎，之后按照各个存储引擎的存储格式进行存储。

3.2MyiSAM

MyISAM不支持事务，也不支持外键约束，只支持全文索引，数据文件和索引文件是分开保存的。
MyISAM访问速度快，对事务完整性没有要求，适合查询、插入为主的应用场景。

3.2.1MyISAM在磁盘上存储成三个文件文件名和表名都相同，但是扩展名分别为

.frm是表的定义文件
.MYD是数据文件
.MYI是索引文件

InnoDB的存储

.frm是表的定义文件
.idb是数据文件

3.2.2表级锁定形式

数据在更新时锁定整个表
数据库在读写过程中相互阻塞
串行操作，按照顺序操作，每次在读或写的时候会把全表锁起来
会在数据写入的过程阻塞用户数据的读取
会在数据读取的过程中阻塞用户的数据写入

特性：数据单独写入或读取，速度过程较快且占用资源相对少

MyIsam 是表级锁定，读或写无法同时进行
好处是：分开执行时，速度快、资源占用相对较少（相对）

3.2.3MyISAM 表支持 3 种不同的存储格式

（1）静态(固定长度)表

静态表是默认的存储格式。静态表中的字段都是非可变字段，这样每个记录都是固定长度的，这种存储方式的优点是存储非常迅速，容易缓存，出现故障容易恢复；缺点是占用的空间通常比动态表多。
固定长度10
存储非常迅速，容器缓存，故障之后容易恢复

（2）动态表

动态表包含可变字段（varchar），记录不是固定长度的，这样存储的优点是占用空间较少，但是频繁的更新、删除记录会产生碎片，需要定期执行 OPTIMIZE TABLE 语句或 myisamchk -r 命令来改善性能，并且出现故障的时候恢复相对比较困难。

（3）压缩表

压缩表由 myisamchk 工具创建，占据非常小的空间，因为每条记录都是被单独压缩的，所以只有非常小的访问开支。

3.2.4MyISAM适用的生产场景

公司业务不需要事务的支持
单方面读取或写入数据比较多的业务
MyISAM存储引擎数据读写都比较频繁场景不适合
使用读写并发访问相对较低的业务
数据修改相对较少的业务
对数据业务一致性要求不是非常高的业务
服务器硬件资源相对比较差

MyIsam：适合于单方向的任务场景、同时并发量不高、对于事务要求不高的场景

3.3InnoDB

3.3.1InnoDB概述

支持事务，支持4个事务隔离级别
MySQL从5.5.5版本开始，默认的存储引擎为InnoDB
读写阻塞与事务隔离级别相关
能非常高效的缓存索引和数据
表与主键以簇的方式存储
支持分区、表空间，类似oracle数据库
支持外键约束，5.5前不支持全文索引，5.5后支持全文索引
对硬件资源要求还是比较高的场合
行级锁定，但是全表扫描仍然会是表级锁定（select ），如update table set a=1 where user like '%lic%'。

InnoDB 中不保存表的行数，如 select count(*) from table; 时，InnoDB 需要扫描一遍整个表来计算有多少行，但是 MyISAM 只要简单的读出保存好的行数即可。

注意：当 count(*)语句包含 where 条件时 MyISAM 也需要扫描整个表

对于自增长的字段，InnoDB 中必须包含只有该字段的索引，但是在 MyISAM 表中可以和其他字段一起建立组合索引
清空整个表时，InnoDB 是一行一行的删除，效率非常慢。MyISAM 则会重建表（truncate）

3.3.2应用场景

业务场景如果并发量大，什么并发量大，读写的并发量大，那我们建议使用InnoDB
如果单独的写入或是插入单独的查询，那我们建议使用没有InnoDB

3.3.3B表级锁和行级锁

表级锁：开销小，加锁快；不会出现死锁；锁定粒度大，发生锁冲突的概率最高，并发度最低；
行级锁：开销大，加锁慢；会出现死锁；锁定粒度最小，发生锁冲突的概率最低，并发度也最高；

3.3.4InnoDB和MyiSAM的特点

①InnoDB：

InnoDB 中存在表锁和行锁，不过行锁是在命中索引的情况下才会起作用。InnoDB 支持事务，且支持四种隔离级别（读未提交、读已提交、可重复读、串行化），默认的为可重复读。

②MyiSAM：

Myisam 只支持表锁，且不支持事务。Myisam 由于有单独的索引文件，在读取数据方面的性能很高。

3.3.5InnoDB和MyiSAM的区别

① InnoDB支持事物，而MyISAM不支持事物

② InnoDB支持行级锁，而MyISAM支持表级锁

③ InnoDB支持MVCC, 而MyISAM不支持（MVCC是指多版本并发控制）

MVCC是在并发访问数据库时，通过对数据进行多版本控制，避免因写锁而导致读操作的堵塞，从而很好的优化并发堵塞问题。

④ InnoDB支持外键，而MyISAM不支持

不同的需求使用不同的存储引擎：

MyIsam：

①适合于单方向的任务场景、同时并发量不高、对于事务要求不高的场景

InnoDB:

①如果业务场景如果并发量大，读写的并发量大，那我们建议使用InnoDB

②如果单独的写入或是插入单独的查询，那我们建议不使用InnoDB

3.4存储引擎操作

3.4.1查看存储引擎

show engines;

3.4.2查看表使用的存储引擎

①方法一

show table status from 库名 where name='表名'\G；

②方法二

use 库名;
show create table 表名;

3.4.3修改存储引擎

①方法一：通过 alter table 修改

use 库名;
alter table 表名 engine=MyISAM;

②通过修改 /etc/my.cnf 配置文件，指定默认存储引擎并重启服务

注意：此方法只对修改了配置文件并重启mysql服务后新创建的表有效，已经存在的表不会有变更。

quit
vim /etc/my.cnf
[mysqld]
default-storage-engine=INNODB

systemctl restart mysqld.service

③通过 create table 创建表时指定存储引擎

use 库名;
create table 表名(字段1 数据类型,...) engine=MyISAM;

四.总结

索引的支持

建立索引在搜索和恢复数据库中的数据时能显著提高性能
不同的存储弓|擎提供不同的制作索引的技术
有些存储弓|擎根本不支持索引

事务处理的支持

提高在向表中更新和插入信息期间的可靠性
可根据企业业务是否要支持事务选择存储引擎

MyiSAM和InnoDB的区别