MySQL--存储引擎的特性
常用存储引擎的对比
特点 | MyISAM | InnoDB | MEMORY | MERGE | NDB |
存储限制 | 有 | 64TB | 有 | 没有 | 有 |
事务安全 | 支持 | ||||
锁机制 | 表锁 | 行锁 | 表锁 | 表锁 | 行锁 |
B树索引 | 支持 | 支持 | 支持 | 支持 | 支持 |
哈希索引 | 支持 | 支持 | |||
全文索引 | 支持 | ||||
集群索引 | 支持 | ||||
数据缓存 | 支持 | 支持 | 支持 | ||
索引缓存 | 支持 | 支持 | 支持 | 支持 | 支持 |
数据可压缩 | 支持 | ||||
空间使用 | 低 | 高 | N/A | 低 | 低 |
内存使用 | 低 | 高 | 中等 | 低 | 高 |
批量插入的速度 | 高 | 低 | 高 | 高 | 高 |
支持外键 | 支持 |
1.MyISAM
- MyISAM不支持事务,也不支持外键,其优势是访问的速度快,对事务完整性没有要求或者以SELECT,INSERT为主的应用基本上可以使用这个引擎来创建表。
- 每个MyISAM在磁盘上存储成3个文件,其文件名都和表名相同,但扩展名分别是:
.frm(存储表定义)
.MYD(MYData,存储数据)
.MYI(MYIndex,存储索引) - 数据文件和索引文件可以放在不同的目录,平均分布IO,获得更快的速度
- 要指定索引文件和数据文件的路径,需要在创建表的时候通过DATE DIRECTORY和INDEX DIRECTORY语句指定。也就是说不同MyISAM表的索引文件和数据文件可以放置到不同的路径下。文件路径需要时绝对路径,并且具有访问权限。
- MyISAM类型的表可能损坏,原因可能是多种多样的,损坏后的表可能不能被访问,会提示需要修复或者访问后返回错误的结果。
MyISAM类型的表提供修复的工具,
可以用CHECK TABLE语句来检查MyISAM表的健康。
用REPAIR TABLE语句修复一个损坏的MyISAM表
表损坏可能导致数据库异常重新启动,需要尽快修复并尽可能的确认损坏的原因 - MyISAM的表还支持3中不同的存储格式,分别是
静态(固定长度)表
动态表
压缩表
其中,静态表是默认的存储格式。
静态表中的字段都是非变长字段,这样每个记录都是固定长度的,这种存储方式的优点是存储非常迅速,容易缓存,出现故障容易修复;缺点是占用的空间通常比动态多。静态表的数据在存储时会按列的宽度定义补足空格,但是在应用访问的时候并不会得到这些空格,这些空格在返回给应用之前已经去掉。
需要注意的是,如果需要保存的内容后面本来就带有空格,那么在返回结果的时候也会被去掉,因为静态表是默认的存储格式。(尾部空格丢失)
动态表中包含变长字段,记录不是固定长度的,这样存储的优点是占用的空间相对较少,但是频繁的更新和删除记录会产生碎片,需要定期执行 OPTIMIZE TABLE语句或myisamchk -r命令来改善性能,并且在出现故障时恢复相对比较困难
压缩表由myisam工具创建,占据非常小的磁盘空间。因为每个记录是被单独压缩的,所有只有非常小的访问开支
2.InnoDB
- InnoDB存储引擎提供了具有提交,回滚和崩溃恢复能力的事务安全。
- 对比MyISAM存储引擎,InnoDB写的处理效率差一些,并且会占用更多的磁盘空间以保留数据和索引。
- InnoDB表的自动增长列可以手工插入,但是插入的值如果是空或者是0,则实际插入的将是自动增长后的值。
可以通过
ALTER TABLE table_name
AUTO_INCREMENT = n
强制设置自动增长列的初始值,默认从1开始,但是该强制的默认值是保留在内存中的,如果该值在使用之前数据库重新启动,那么这个强制的默认值会丢失,就需要在数据库启动以后重新设置。
可以使用 LAST_INSERT_ID()查询当前线程最后插入记录使用的值。
对于InnoDB表,自动增长列必须是索引。如果是组合索引,也必须是组合索引的第一列,但是对于MyISAM表,自动增长列可以是组合索引的其他列,这样插入记录后,自动增长列是按照组合索引的前面几列进行排序后递增的。 - MySQL支持外键的存储引擎只有InnoDB,在创建外键的时候,要求父表必须有对应的索引,子表在创建外键的时候也会自动创建对应的索引。
- 对于InnoDB类型的表,外键的信息可以通过使用
SHOW CREATE TABLE
或 SHOW TABLE STATUS - InnoDB存储表和索引有以下两种方式
1) 使用共享表空间存储,这种方式创建的表的表结构保存在.frm文件中,数据和索引保存在innodb_data_home_dir和innodb_data_file_path定义的表空间中,可以是多个文件
2) 使用多表空间存储,这种方式创建的表的表结构仍然保存在.frm文件中,但是每个表的数据和索引单独保存在.ibd中。如果是个分区表,则每个分区对应单独的.ibd文件,文件名是‘表名+分区名’,可以在创建分区的时候指定每个分区的数据文件的位置,以此来将表的IO均匀分布在多个磁盘上
要使用多表空间的存储方式,需要设置参数innodb_file_per_table,并且重新启动服务后才可以生效,对于新建的表按照多表空间的方式创建,已有的表仍然使用共享表空间存储。如果是将已有的多表空间方式修改会共享表空间的方式,则新建表会在共享表空间中创建,但已有的多表空间的表仍然保存原来的访问方式。所以多表空间的参数生效后,只对新建的表生效。
多表空间的数据文件没有大小限制,不需要设置初始大小,也不需要设置文件的最大限制,扩展大小等参数
对于使用多表空间特性的表,可以比较方便的进行单表备份和恢复操作,但是直接复制.ibd文件是不行的,因为没有共享表空间的数据字典信息,直接复制的.ibd文件和.frm文件恢复是不能被正确识别的,但是可以通过以下命令
ALTER TABLE tbl_name DISCARS TABLESPACE;
ALTER TABLE tbl_name IMPORT TABLESPACE;
将备份恢复到数据库中,但是这样的单表备份,只能恢复到表原来所在的数据库中,而不能恢复到其他的数据库中。如果需要将单表恢复到目标数据库,则需要通过mysqldump和mysqllimport来实现 - 即便在多表空间的存储方式下,共享表空间仍然是必须的,InnoDB吧内部数据词典和在线做日志放在这个文件中
3.MEMORY
- MEMORY存储引擎使用存在于内存中的内容来创建表。每个MEMORY表只实际对应一个磁盘文件,格式是.frm。
- MENORY类型的表访问非常的快,因为他的数据是放在内存中的,并且默认使用HASH索引,但是服务一旦关闭,表中的数据就会丢失。
- 给MENORY表创建索引的时候,可以指定使用HASH索引还是BTREE索引
例:
CREATE INDEX mem_hash USING HASH ON tab_memory (city_id) - 在启动MySQL服务的时候使用--init-file选项,把INSERT INTO ... SELECT 或 LOAD DATA INFILE这样的语句放入这个文件,就可以在服务启动时从持久稳固的数据源装载表
- 服务器需要足够内存来维持所有在同一时间使用的MEMORY表,当不在需要MEMORY表的内容时,要释放被MEMORY表使用的内存,应该执行DELETE FROM 或 TRUNCATE TABLE,或者整个地删除表(使用DROP TABLE操作)
- 每个MEMORY表中可以放置的数据量的大小,受到max_heap_table_size系统变量的约束,这个系统变量的初始值是16MB,可以根据需要加大。此外,在定义MEMORY表示的时候,可以通过MAX_ROWS子句指定表的最大行数。
- MEMORY类型的存储引擎主要用于那些内容变化不频繁的代码表,或者作为统计操作的中间结果表,便于高效的对中间结果分析并得到最终的统计结果。
- 对存储引擎为MEMORY的表进行更新操作要谨慎,因为数据并没有实际写入到磁盘中,所以一定要对下次重新启动服务后如何获得这些修改后的数据有所考虑。
4.MERGE
- MERGE存储引擎是一组MyISAM表组合,这些MyISAM表必须结构完全相同
- MERGE表本身并没有数据,对MERGE类型的表可以进行查询、更新、删除操作,这些操作实际上是对内部的MyISAM表进行的
- 对于MERGE类型表的插入操作,是通过INSERT_METHOD子句定义插入的表,可以有3个不同的值,使用FIRST或LAST值使得插入操作被相应的作用在第一或最后一个表上,不定义这个子句或者定义为NO,表示不能对这个MERGE表执行插入操作。
- 可以对MERGE表进行DROP操作,这个操作只是删除MERGE的定义,对内部的表没有任何影响。
- MERGE表在磁盘上保留两个文件,文件名以表的名字开始,一个.frm文件存储表定义,另一个.MRG文件包含组合表的信息,包括MERGE表由那些表组成,插入新的数据时的依据。可以通过修改.MRG文件来修改MERGE表,但是修改后要通过FLUSH TABLES刷新
- MERGE表不能只能的将记录写到对应的表中,而分区表是可以的。通常我们使用MERGE表来透明的对多个表进行查询和更新操作,而对这种按时间记录的操作日志表则可以透明的进行插入操作
前面的都是MySQL自带的存储引擎,除了这些之外,还有一些常见的第三方存储引擎,在某些特定应用中也有广泛使用, 比如列式存储引擎Infobright、高写性能高压缩的TokuDB就是其中非常有代表性的两种。
5.TokuDB
- TokuDB是一个高性能、支持事务处理的Mysql和MariaDB的存储引擎,具有高扩展性、高压缩率、高效的写入性能,支持大多数在线DDL操作。
- 特性
- 使用Fractal树索引保证高效的插入性能
- 优秀的压缩特性,比InnoDB高近十倍
- Hot Scheme Changes特性支持在线创建索引和添加,删除属性列等DDL操作
- 使用Bulk Loader达到快速加载大量数据
- 提供了主从延迟消除技术
- 支持ACID和MVCC
- 适用场景
- 日志数据,因为日志通常插入频繁且存储量大
- 历史数据,通常不会再有写操作,可以李彤TokuDB的高压缩特性进行存储
在线DDL较频繁的场景,适用TokuDB可以大大增加系统的可用性
$如何选择合适的存储引擎
MyISAM:
如果应用是以读操作和插入操作为主,只有很少的更新和删除操作,并且对事务的完整性,并发性要求不是很高,那么选择这个存储引擎是非常适合的。MyISAM是在Web、数据仓库和其他应用环境下最常使用的存储引擎之一。
InnoDB:
默认的MySQL存储引擎。用于事务处理应用程序,支持外键。如果应用对事物的完整性有比较高的要求,在并发条件下要求数据的一致性, 数据操作除了插入和查询以外,还能包括很多的更新、删除操作,那么InnoDB存储引擎应该是比较合适的选择。InnoDB存储引擎除了有效地降低由类似计费系统或者财务系统等对数据准确性要求比较高的系统,InnoDB都是合适的选择。
MEMORY:
将所有数据保存在RAM中,在需要快速定位记录和其他类似数据的环境下,可提供极快的访问。MEMORY的缺陷是对表的大小有限制,太大的表无法缓存在内存中,其次是要确保表的数据可以恢复,数据库异常终止后表中的数据是可以恢复的。MEMORY表通常用于更新不太频繁的小表,用以快速得到访问结果。
MERGE:
用于将一系列等同的MyISAM表以逻辑方式组合在一起,并作为一个对象引用他们。MERGE表的优点在于可以突破单个MyISAM表大小的限制,并且通过将不同的表分布在多个磁盘上,可以有效的改善MERGE表的访问效率。这对于诸如数据仓储等VLDB环境适合。