MySQL表类型的选择

P131)创建表时的默认引擎是InnoDB,如果要修改默认的存储引擎,可以在参数文件中设置default-table-type。查看当前的默认存储引擎,可以使用一下命令:

创建新表的时候可以通过增加ENGINE关键字设置新建表的存储引擎。也可以通过ALTER TABLE语句,将一个已经存在的表修改成其他的存储引擎。

 


一. MyISAM(P134)

MyISAM不支持事务,不支持外键,其优势是访问速度块,对事务完整性没有要求或者以SELECT、INSERT为主的应用基本上都可以使用这个引擎来创建表。

每个MyISAM在磁盘上存储为3个文件,其文件名都和表名相同,但拓展名分别为:

  • .frm(存储表定义);
  • .MYD(MYData,存储数据);
  • .MYI(MYIndex,存储索引)。

数据文件和索引文件可以放在不同的目录,平均分布IO,获得更快的速度。

MyISAM表还支持3种不同的存储格式,分别是:

  • 静态(固定长度)表;
  • 动态表;
  • 压缩表。

静态表是默认的存储格式,其中的字段都是非变长字段,这样每个记录的长度都是固定的,优点是存储速度非常迅速,容易缓存,出现故障容易恢复;缺点是占用的空间通常比动态表多。静态表的数据在存储时会按照列的宽度定义补足空格,然后在获取的时候将最后的空格全部去掉。

 

动态表中包含变长字段,记录不是固定长度的,这样存储的优点是占用的空间少,但频繁的更新和删除记录会产生碎片,需要定期执行OPTIMIZE TABLE语句或者myisamchk-r命令来改善性能,并且在出现故障时恢复相对困难。

压缩表由myisampack工具创建,占据非常小的磁盘空间。因为每个记录是被单独压缩的,所有只有非常小的访问开支。


 

二. InnoDB(P136)

1. 自动增长列

InnoDB表的自动增长列可以手工插入,但是插入的值如果是空或者0,则实际插入的将是自动增长后的值。

可以通过ALTER TABLE table_name ATUO_INCREMENT=n;语句强制设置自动增长列的初始值,默认从1开始,但是该强制的默认值是保留在内存中的,如果该值在使用之前数据库重启,那么这个强制的默认值就会丢失,就需要在数据库启动以后重新设置。

可以使用select LAST_INSERT_ID();查询当前线程最后插入记录使用的值。如果一次插入了多条记录,那么返回的是第一条记录使用的自动增长值。

对于InnoDB表,自动增长列必须是索引列。如果是组合索引,也必须是组合索引的第一列,但是对于MyISAM表,自动增长列可以是组合索引的其他列,这样插入记录后,自动增长列是按照组合索引的前面几列进行排序后递增的

2. 外键约束

在创建索引时,可以指定在删除、更新父表时,对子表进行相应操作,包括RESTRICT、CASCADE、SET NULL和NO ACTION。

RESTRICTNO ACTION相同,是指限制在子表有关联记录的情况下父表不能更新;

CASCADE表示父表在更新或者删除时,更新或者删除子表对应的记录;

SET NULL则表示父表在更新或者删除的时候,子表的对应字段被SET NULL。

例如:子表外键指定可以是ON DELETE RESTRICT ON UPDATE CASCADE

 

当某个表被其他表创建了外键参照,那么该表的对应索引或者主键禁止被删除。

在导入多个表时,如果需要忽略表之前的导入顺序,可以暂时关闭外键的检查;同样,在执行LOAD DATA和ALTER TABLE操作的时候,可以通过暂时关闭外键约束来加快处理的速度,关闭的命令是SET FOREIGN_KEY_CHECKS=0;,执行完成之后,通过执行SET FOREIGN_KEY_CHECKS=1;语句改回原状态。

对于InnoDB类型的表,外键的信息通过使用show create table或者show table status命令都可以显示。例如:

show table status like ‘city’\G

3. 存储方式(P139)

  • 使用共享表空间:这种方式创建的表结构保存在.frm文件中,数据和索引保存在innodb_data_home_dir和innodb_data_file_path定义的表空间中,可以是多个文件。
  • 使用多表空间存储:这种方式创建的表结构仍然保存在.frm文件中,但是每个表的数据和索引单独保存在.ibd中,如果是个分区表,则每个分区对应单独的.ibd文件,文件名是“表名+分区表”,可以在创建分区的时候指定每个分区的数据文件的位置,以此来将表的IO均匀分布在多个磁盘上

更多信息


 

三. MEMORY(P140)

MEMORY存储引擎使用存在于内存中的内容来创建表。每个MEMORY表只实际对应一个磁盘文件,格式是.frm。MEMORY类型的表访问非常的块,因为它的数据是放在内存中的,并且默认使用HASH索引,但是一旦服务器关闭,表中的数据丢失掉。

 

给MEMORY表创建索引的时候,可以指定使用HASH索引还是BTREE索引;

 

在启动MySQL服务的时候使用-init-file选项,把insert into ...select或load data infile这样的语句放入这个文件中,就可以在服务启动时从持久稳固的数据装载表。(???)

由于维持MEMORY表会耗费系统的内存,所以当不再需要MEMORY表的内容时,应当执行delete from或truncate table(more)或者整个的删除表(使用drop table操作)。

每个MEMORY表中可以放置数据量的大小,收到max_heap_table_size系统变量的约束,这个系统变量的初始值为16MB,可以根据需要调整。定义MEMORY表时,MAX_ROWS子句定义最大行数。

MEMORY表主要用于那些内容变化不频繁的代码表,或者作为统计操作的中间结果表,便于高效的对中间结果进行分析并得到最终的统计结果。


 

四. MERGE(P142)

MERGE存储引擎是一组MyISAM表的组合,这些MyISAM表必须结构完全相同,MERGE表本身并没有数据,对MERGE类型的表可以进行查询、更新、删除操作,这些操作实际上是对内部的MyISAM表进行的。对于MERGE类型表的插入操作,是通过INSERT_METHOD子句定义插入的表,可以有3个不同的值,使用FIRSTLAST值使得插入操作被相应的作用第一或最后一个表上,不定义这个子句或者定义为NO,表示不能对这个MERGE表执行插入操作。

可以对MERGE表进行DROP操作,这个操作只是删除MERGE的定义,对内部的表没有任何的影响。

MERGE表在磁盘上保留两个文件,文件名以表的名字开始,一个.frm文件存储表定义,另一个.MRG文件包含组合表的信息,包括MERGE表由那些表组成、插入新的数据时的依据。可以通过修改.MRG文件来修改MERGE表,但是修改后要通过FLUSH TABLES刷新。

 

查看payment_all的表中的数据会发现是payment_2006和payment_2007表的记录合并后的结果集。向payment_all插入的数据会被插入到payment_2007中。

MERGE表的优点在于可以突破单个MyISAM表的大小限制,并且通过将不同的表分布在多个磁盘上,可以有效的改善MERGE表的访问效率。

posted @ 2017-07-03 17:37  TooLateToLearn!  阅读(6327)  评论(0编辑  收藏  举报