MySQL 索引、事务与存储引擎
MySQL 索引、事务与存储引擎
1、索引
2、事务
3、存储引擎
1、索引:
索引的概念 :
- 索引是一个排序的列表,在这个列表中存储着索引的值和包含这个值的数据所在行的物理地址(类似于C语言的链表通过指针指向数据记录的内存地址)。
- 使用索引后可以不用扫描全表来定位某行的数据,而是先通过索引表找到该行数据对应的物理地址然后访问相应的数据,因此能加快数据库的查询速度。
- 索引就好比是一本书的目录,可以根据目录中的页码快速找到所需的内容。
- 索引是表中一列或者若干列值排序的方法。
- 建立索引的目的是加快对表中记录的查找或排序。
在有索引的情况下,数据库会先进行索引查询,然后定位到具体的数据行,
没有有索引的情况下扫描全表来定位某行的数据。
索引是一个排序的列表,在这个列表中存储着索引的值和包含这个值的数据所在行的物理地址,
使用索引后,是先通过索引表找到该行数据对应的物理地址然后访问相应的数据,因此能加快数据库的查询速度。
索引的作用 :
- 设置了合适的索引之后,数据库利用各种快速定位技术,能够大大加快查询速度,这是创建所有的最主要的原因。
- 当表很大或查询涉及到多个表时,使用索引可以成千上万倍地提高查询速度。
- 可以降低数据库的IO成本,并且索引还可以降低数据库的排序成本。
- 通过创建唯一性索引,可以保证数据表中每一行数据的唯一性。
- 可以加快表与表之间的连接。
- 在使用分组和排序时,可大大减少分组和排序的时间。
索引的副作用:
- 索引需要占用额外的磁盘空间。
- 对于 MyISAM 引擎而言,索引文件和数据文件是分离的,索引文件用于保存数据记录的地址。
- 而 InnoDB 引擎的表数据文件本身就是索引文件。
- 在插入和修改数据时要花费更多的时间,因为索引也要随之变动。
创建索引的原则依据:
索引随可以提升数据库查询的速度,但并不是任何情况下都适合创建索引。因为索引本身会消耗系统资源,在有索引的情况下,
数据库会先进行索引查询,然后定位到具体的数据行,如果索引使用不当,反而会增加数据库的负担。
- 表的主键、外键必须有索引。因为主键具有唯一性,外键关联的是子表的主键,查询时可以快速定位。
- 记录数超过300行的表应该有索引。如果没有索引,需要把表遍历一遍,会严重影响数据库的性能。
- 经常与其他表进行连接的表,在连接字段上应该建立索引。
- 唯一性太差的字段不适合建立索引。
- 更新太频繁地字段不适合创建索引。
- 经常出现在 where 子句中的字段,特别是大表的字段,应该建立索引。
- 索引应该建在选择性高的字段上。
- 索引应该建在小字段上,对于大的文本字段甚至超长字段,不要建索引。
首先创建表和数据 为下面实验做准备:
mysql -u root -p create database CLASS; use CLASS; create table member (id int(10),name varchar(10),cardid varchar(18),phone varchar(11),address varchar(50),remark text); desc member; insert into member values (1,'lvbu','123','111111','nanjing','this is vip'); insert into member values (4,'caocao','1234','444444','nanjing','this is normal'); insert into member values (2,'liubei','12345','222222','benjing','this is normal'); insert into member values (5,'guanyu','123456','555555','nanjing','this is vip'); insert into member values (3,'zhangfei','1234567','333333','shanghai','this is vip'); select * from member;
索引的分类和创建:
a)普通索引:最基本的索引类型,没有唯一性之类的限制。
直接创建索引
CREATE INDEX 索引名 ON 表名 (列名[(length)]);
#(列名(length)):length是可选项。如果忽略 length 的值,则使用整个列的值作为索引。如果指定使用列前的 length 个字符来创建索引,这样有利于减小索引文件的大小。
#索引名建议以“_index”结尾。
例:create index phone_index on member (phone); select phone from member; show create table member;
修改表方式创建
ALTER TABLE 表名 ADD INDEX 索引名 (列名); 例:alter table member add index id_index (id); select id from member; select id,name from member;
创建表的时候指定索引
CREATE TABLE 表名 ( 字段1 数据类型,字段2 数据类型[,...],INDEX 索引名 (列名)); 例:create table test(id int(4) not null,name varchar(10) not null,cardid varchar(18) not null,index id_index (id)); show create table test;
b)唯一索引:与普通索引类似,但区别是唯一索引列的每个值都唯一。
唯一索引允许有空值(注意和主键不同)。如果是用组合索引创建,则列值的组合必须唯一。
添加唯一键将自动创建唯一索引。
直接创建唯一索引
CREATE UNIQUE INDEX 索引名 ON 表名(列名); 例:select * from member; create unique index address_index on member (address); create unique index name_index on member (name); show create table member;
修改表方式创建
ALTER TABLE 表名 ADD UNIQUE 索引名 (列名); 例:alter table member add unique cardid_index (cardid);
创建表的时候指定
CREATE TABLE 表名 (字段1 数据类型,字段2 数据类型[,...],UNIQUE 索引名 (列名)); 例:create table amd2 (id int,name varchar(20),unique id_index (id)); show creat table amd2;
c)主键索引:是一种特殊的唯一索引,必须指定为“PRIMARY KEY”。
一个表只能有一个主键,不允许有空值。 添加主键将自动创建主键索引。
创建表的时候指定
CREATE TABLE 表名 ([...],PRIMARY KEY (列名)); 例:create table test1 (id int primary key,name varchar(20)); create table test2 (id int,name varchar(20),primary key (id)); show create table test1; show create table test2;
修改表方式创建
ALTER TABLE 表名 ADD PRIMARY KEY (列名);
d)组合索引(单多列索引):可以是单列上创建的索引,也可以是在多列上创建的索引。
CREATE TABLE 表名 (列名1 数据类型,列名2 数据类型,列名3 数据类型,INDEX 索引名 (列名1,列名2,列名3)); select * from 表名 where 列名1='...' AND 列名2='...' AND 列名3='...'; 例:create table amd1 (id int not null,name varchar(20),cardid varchar(20),index index_amd (id,name)); show create table amd1; insert into amd1 values(1,'zhangsan','123123'); select * from amd1 where name='zhangsan' and id=1;
e)全文索引:适合在进行模糊查询的时候使用,可用于在一篇文章中检索文本信息。
在 MySQL5.6 版本以前FULLTEXT 索引仅可用于 MyISAM 引擎,在 5.6 版本之后 innodb 引擎也支持 FULLTEXT 索引。
全文索引可以在 CHAR、VARCHAR 或者 TEXT 类型的列上创建。每个表只允许有一个全文索引。
直接创建索引
CREATE FULLTEXT INDEX 索引名 ON 表名 (列名); 例:select * from member; create fulltext index remark_index on member (remark);
修改表方式创建
ALTER TABLE 表名 ADD FULLTEXT 索引名 (列名);
创建表的时候指定索引
CREATE TABLE 表名 (字段1 数据类型[,...],FULLTEXT 索引名 (列名));
#数据类型可以为 CHAR、VARCHAR 或者 TEXT
使用全文索引查询
SELECT * FROM 表名 WHERE MATCH(列名) AGAINST('查询内容'); 例:select * from member where match(remark) against('this is vip');
f)查看索引
show index from 表名; show index from 表名\G; 竖向显示表索引信息 show keys from 表名; show keys from 表名\G;
字段含义:
table | 表的名称 |
Non_unique | 如果索引不能包括重复词,则为 0;如果可以,则为 1。 |
Key_name | 索引的名称 |
Seq_in_index | 索引中的列序号,从 1 开始。 |
Column_name | 列名称。 |
Collation | 列以什么方式存储在索引中。在 MySQL 中,有值‘A’(升序)或 NULL(无分类)。 |
Cardinality | 索引中唯一值数目的估计值。 |
Sub_part | 如果列只是被部分地编入索引,则为被编入索引的字符的数目。如果整列被编入索引,则为 NULL。 |
Packed | 指示关键字如何被压缩。如果没有被压缩,则为 NULL。 |
Null | 如果列含有 NULL,则含有 YES。如果没有,则该列含有 NO。 |
Index_type | 用过的索引方法(BTREE, FULLTEXT, HASH, RTREE)。 |
Comment | 备注 |
g)删除索引
直接删除索引
DROP INDEX 索引名 ON 表名; 例:drop index name_index on member;
修改表方式删除索引
ALTER TABLE 表名 DROP INDEX 索引名
例:alter table member drop id_index; show index from member;
删除主键索引
ALTER TABLE 表名 DROP PRIMARY KEY;
2、事务:
事务的概念:
- 事务是一种机制、一个操作序列,包含了一组数据库操作命令,并且把所有的命令作为一个整体一起向系统提交或撤销操作请求,即这一组数据库命令要么都执行,要么都不执行。
- 事务是一个不可分割的工作逻辑单元,在数据库系统上执行并发操作时,事务是最小的控制单元。
- 事务适用于多用户同时操作的数据库系统的场景,如银行、保险公司及证券交易系统等等。
- 事务是通过事务的整体性以保证数据的一致性。
- 说白了,所谓事务,它是一个操作序列,这些操作要么都执行,要么都不执行,它是一个不可分割的工作单位。
事务的ACID特点:
ACID,是指在可靠数据库管理系统(DBMS)中,事务(transaction)应该具有的四个特性:原子性(Atomicity)、一致性(Consistency)、隔离性(Isolation)、持久性(Durability)。这是可靠数据库所应具备的几个特性。
原子性:指事务是一个不可再分割的工作单位,事务中的操作要么都执行,要么都不执行。
事务是一个完整的操作,事务的各元素是不可分的。 事务中的所有元素必须作为一个整体提交或回滚。 如果事务中的任何元素失败,则整个事务将失败。
一致性:指在事务开始之前和事务结束以后,数据库的完整性约束没有被破坏。 事务执行前后都是完整的
当事务完成时,数据必须处于一致状态。 在事务开始前,数据库中存储的数据处于一致状态。 在正在进行的事务中,数据可能处于不一致的状态。 当事务成功完成时,数据必须再次回到已知的一致状态。
隔离性:指在并发环境中,当不同的事务同时操纵相同的数据时,互不影响,每个事务都有各自的完整数据空间。 (四个影响四个隔离级别)
对数据进行修改的所有并发事务是彼此隔离的,表明事务必须是独立的,它不应以任何方式依赖于或影响其他事务。 修改数据的事务可在另一个使用相同数据的事务开始之前访问这些数据,或者在另一个使用相同数据的事务结束之后访问这些数据。
持久性:在事务完成以后,该事务所对数据库所作的更改便持久的保存在数据库之中,并不会被回滚。 事务提交后永久保存 不能再被回滚
指不管系统是否发生故障,事务处理的结果都是永久的。 一旦事务被提交,事务的效果会被永久地保留在数据库中。
总结: 原则 , 事务管理中,原子性是基础,隔离性是手段,一致性是目的,持久性是结果。
事务之间的相互影响 :
事务之间的相互影响分为几种,分别为:
- 脏读:一个事务读取了另一个事务未提交的数据,而这个数据是有可能回滚的。
- 不可重复读:一个事务内两个相同的查询却返回了不同数据。这是由于查询时系统中其他事务修改的提交而引起的。
- 幻读:一个事务对一个表中的数据进行了修改,这种修改涉及到表中的全部数据行。同时,另一个事务也修改这个表中的数据,这种修改是向表中插入一行新数据。那么,操作前一个事务的用户会发现表中还有没有修改的数据行,就好象发生了幻觉一样。
- 丢失更新:两个事务同时读取同一条记录,A先修改记录,B也修改记录(B不知道A修改过),B提交数据后B的修改结果覆盖了A的修改结果。
Mysql及事物隔离级别:
- read uncommitted : 读取尚未提交的数据 :不解决脏读
- read committed:读取已经提交的数据 :可以解决脏读
- repeatable read:重读读取:可以解决脏读 和 不可重复读 —mysql默认的
- serializable:串行化:可以解决 脏读 不可重复读 和 虚读—相当于锁表
mysql默认的事务处理级别是 repeatable read ,而Oracle和SQL Server是 read committed 。
a)查询全局事务隔离级别
show global variables like '%isolation%'; SELECT @@global.tx_isolation;
b)查询会话事务隔离级别
show session variables like '%isolation%'; SELECT @@session.tx_isolation; SELECT @@tx_isolation;
c)设置全局事务隔离级别
set global transaction isolation level read committed;
d)设置会话事务隔离级别
set session transaction isolation level read committed;
事务控制语句:
BEGIN 或 START TRANSACTION:显式地开启一个事务。 COMMIT 或 COMMIT WORK:提交事务,并使已对数据库进行的所有修改变为永久性的。
ROLLBACK 或 ROLLBACK WORK:回滚会结束用户的事务,并撤销正在进行的所有未提交的修改。
SAVEPOINT S1:使用 SAVEPOINT 允许在事务中创建一个回滚点,一个事务中可以有多个 SAVEPOINT;“S1”代表回滚点名称。
ROLLBACK TO [SAVEPOINT] S1:把事务回滚到标记点。
案例:
create database SCHOOL; use SCHOOL; create table CLASS( id int(10) primary key not null, name varchar(40), money double ); insert into CLASS values(1,'A',1000); insert into CLASS values(2,'B',1000); select * from CLASS;
a)测试提交事务
begin; update CLASS set money= money - 100 where name='A'; select * from CLASS; commit; quit mysql -u root -p use SCHOOL; select * from CLASS;
b)测试回滚事务
begin; update CLASS set money= money + 100 where name='A'; select * from CLASS; rollback; quit mysql -u root -p use SCHOOL; select * from CLASS;
c)测试多点回滚
begin; update CLASS set money= money + 100 where name='A'; select * from CLASS; SAVEPOINT S1; update CLASS set money= money + 100 where name='B'; select * from CLASS; SAVEPOINT S2; insert into CLASS values(3,'C',1000); select * from CLASS; ROLLBACK TO S1; select * from CLASS;
d)使用set 设置控制事务
SET AUTOCOMMIT=0; #禁止自动提交 SET AUTOCOMMIT=1; #开启自动提交,Mysql默认为1 SHOW VARIABLES LIKE 'AUTOCOMMIT'; #查看Mysql中的AUTOCOMMIT值
如果没有开启自动提交,当前会话连接的mysql的所有操作都会当成一个事务直到你输入rollback|commit;当前事务才算结束。
当前事务结束前新的mysql连接时无法读取到任何当前会话的操作结果。 如果开起了自动提交,mysql会把每个sql语句当成一个事务,然后自动的commit。
当然无论开启与否,begin; commit|rollback; 都是独立的事务。
use SCHOOL; select * from CLASS; SET AUTOCOMMIT=0; SHOW VARIABLES LIKE 'AUTOCOMMIT'; update CLASS set money= money + 100 where name='B'; select * from CLASS; quit mysql -u root -p use SCHOOL; select * from CLASS;
3、存储引擎:
概念:
MySQL中的数据用各种不同的技术存储在文件中,每一种技术都使用不同的存储机制、索引技巧、锁定水平并最终提供不同的功能和能力,
这些不同的技术以及配套的功能在MySQL中称为存储引擎
存储引擎是MySQL将数据存储在文件系统中的存储方式或者存储格式
MySQL常用的存储引擎:
- MyISAM
- InnoDB
MySQL数据库中的组件,负责执行实际的数据I/O操作
MySQL系统中,存储引擎处于文件系统之上,在数据保存到数据文件之前会传输到存储引擎,之后按照各个存储引擎的存储格式进行存储。
MyISAM特点:
- MyISAM不支持事务,也不支持外键约束,只支持全文索引,数据文件和索引文件是分开保存的
- 访问速度快,对事务完整性没有要求 MyISAM 适合查询、插入为主的应用
- MyISAM在磁盘上存储成三个文件,文件名和表名都相同,但是扩展名分别为: .frm 文件存储表结构的定义 数据文件的扩展名为 .MYD (MYData) 索引文件的扩展名是 .MYI (MYIndex)
- 表级锁定形式,数据在更新时锁定整个表 数据库在读写过程中相互阻塞: 会在数据写入的过程阻塞用户数据的读取 也会在数据读取的过程中阻塞用户的数据写入 数据单独写入或读取,速度过程较快且占用资源相对少
MyISAM 表支持 3 种不同的存储格式:
- 静态(固定长度)表 静态表是默认的存储格式。静态表中的字段都是非可变字段,这样每个记录都是固定长度的,这种存储方式的优点是存储非常迅速,容易缓存,出现故障容易恢复;缺点是占用的空间通常比动态表多。
- 动态表 动态表包含可变字段,记录不是固定长度的,这样存储的优点是占用空间较少,但是频繁的更新、删除记录会产生碎片,需要定期执行 OPTIMIZE TABLE 语句或 myisamchk -r 命令来改善性能,并且出现故障的时候恢复相对比较困难。
- 压缩表 压缩表由 myisamchk 工具创建,占据非常小的空间,因为每条记录都是被单独压缩的,所以只有非常小的访问开支。
MyISAM适用的生产场景:
公司业务不需要事务的支持 单方面读取或写入数据比较多的业务 MyISAM存储引擎数据读写都比较频繁场景不适合 使用读写并发访问相对较低的业务 数据修改相对较少的业务 对数据业务一致性要求不是非常高的业务 服务器硬件资源相对比较差
InnoDB特点:
支持事务,支持4个事务隔离级别 MySQL从5.5.5版本开始,默认的存储引擎为 InnoDB
读写阻塞与事务隔离级别相关 能非常高效的缓存索引和数据 表与主键以簇的方式存储 支持分区、表空间,类似oracle数据库 支持外键约束,5.5前不支持全文索引,5.5后支持全文索引
对硬件资源要求还是比较高的场合 行级锁定,但是全 表扫描仍然会是表级锁定,如 update table set a=1 where user like ‘%lic%’;
InnoDB 中不保存表的行数,如 select count() from table; 时,InnoDB 需要扫描一遍整个表来计算有多少行,但是 MyISAM 只要简单的读出保存好的行数即可。需要注意的是,当 count()语句包含 where 条件时 MyISAM 也需要扫描整个表 对于自增长的字段,InnoDB 中必须包含只有该字段的索引,但是在 MyISAM 表中可以和其他字段一起建立组合索引
清空整个表时,InnoDB 是一行一行的删除,效率非常慢。MyISAM 则会重建表
总结:myisam ,innodb 的对比:
MyISAM | InnODB |
不支持 事务 外键 | 支持 事务 读写并发 外键 |
表级锁定 | 行及锁定 |
读写会相互阻塞 | 对硬件资源读取比较高 特别内存高可以提高缓存能力 |
支持全文索引 | |
资源消耗较低 | |
三个文件存储.frm(表结构).MYI(索引文件).MYD(数据文件) | 三个文件存储.frm(表结构).ibd(表数据文件同时也是索引文件)db.oopt(表属性文件) |
三种存储格式 静态表 动态表 压缩表 | |
适合场景 单独的读取或插入 | 适合场景 有事务要求 一致性要求高 读写并发量高的 |
查看系统支持的存储引擎
show engines;
查看表使用的存储引擎
方法一:
show table status from 库名 where name='表名'\G; 例:show table status from SCHOOL where name='CLASS'\G;
方法二:
use 库名; show create table 表名; 例:use SCHOOL; show create table CLASS;
修改存储引擎:
方法一:通过alter table 修改
use 库名; alter table 表名 engine=MyISAM; 例:use SCHOOL; alter table CLASS engine=myisam; show create table CLASS;
方法二:通过修改 /etc/my.cnf 配置文件,指定默认存储引擎并重启服务
quit vim /etc/my.cnf [mysqld] default-storage-engine=INNODB systemctl restart mysqld.service #注意:此方法只对修改了配置文件并重启mysql服务后新创建的表有效,已经存在的表不会有变更。
systemctl restart mysqld.service 修改完记得重启mysql服务
#注意:此方法只对修改了配置文件并重启mysql服务后新创建的表有效,已经存在的表不会有变更。
方法三:通过 create table 创建表时指定存储引擎
use 库名; create table 表名(字段1 数据类型,...) engine=MyISAM; 例:mysql -u root -p use SCHOOL; create table hellolic (name varchar(10),age char(4))engine=myisam;