MySQL学习笔记(三)—索引
一、概述
1.基本概念
在大型数据库中,一张表中要容纳几万、几十万,甚至几百万的的数据,而当这些表与其他表连接后,所得到的新的数据数目更是要大大超出原来的表。当用户检索这么大量的数据时,经常会感觉慢。这个时候要提高数据库的检索性能,就必须要用到索引。给表追加合适的索引能极大的改善数据检索的效率,提供数据库性能。
索引是在存储引擎中实现的,因此每种存储引擎的索引都不一定完全相同,而且每种存储引擎也不一定支持所有的索引类型。
所有存储引擎支持每个表至多16个索引,总索引长度至多为256字节。
MySql中的索引的存储类型有两种: B-Tree和Hash,MyISAM和InnoDB存储引擎只支持B-Tree索引。Memory和Heap可以支持Hash和B-Tree索引。
为表设置索引是要付出代价的:
(1)增加了数据库的存储空间。
(2)插入和修改数据时要花费较多的时间(因为索引的位置也要随之变动)。
2.索引的优缺点
(1)优点
a: 通过创建唯一索引,保证数据库表每行数据的唯一性。
b: 大大加快数据查询速度。
c: 在使用分组和排序进行数据查询时,可以显著减少查询中分组和排序的时间。
(2)缺点
a: 维护索引需要耗费数据库资源。
b: 索引需要占用磁盘空间,索引文件可能比数据文件更快达到最大文件尺寸。
c: 当对表的数据进行增删改的时候,因为要维护索引,速度会受到影响。
索引是建立在数据库表中的某些列的上面。在创建索引的时候,应该考虑在哪些列上可以创建索引,在哪些列上不能创建索引。一般来说,应该在这些列上创建索引。
a: 在经常需要搜索的列上,可以加快搜索的速度;
b: 在作为主键的列上,强制该列的唯一性和组织表中数据的排列结构;
c: 在经常用在连接的列上,这些列主要是一些外键,可以加快连接的速度;
d: 在经常需要根据范围进行搜索的列上创建索引,因为索引已经排序,其指定的范围是连续的;
e: 在经常需要排序的列上创建索引,因为索引已经排序,这样查询可以利用索引的排序,加快排序查询时间;
f: 在经常使用在WHERE子句中的列上面创建索引,加快条件的判断速度。
一般来说,不应该创建索引的的这些列具有下列特点
a: 对于那些在查询中很少使用或者参考的列不应该创建索引。这是因为,既然这些列很少使用到,因此有索引或者无索引,并不能提高查询速度。相反,由于增加了索引,反而降低了系统的维护速度和增大了空间需求。
b: 对于那些只有很少数据值的列也不应该增加索引。这是因为,由于这些列的取值很少,例如人事表的性别列,在查询的结果中,结果集的数据行占了表中数据行的很大比例,即需要在表中搜索的数据行的比例很大。增加索引,并不能明显加快检索速度。
c: 对于那些定义为text, image和bit数据类型的列不应该增加索引。这是因为,这些列的数据量要么相当大,要么取值很少。
d: 当修改性能远远大于检索性能时,不应该创建索引。这是因为,修改性能和检索性能是互相矛盾的。当增加索引时,会提高检索性能,但是会降低修改性能。当减少索引时,会提高修改性能,降低检索性能。因此,当修改性能远远大于检索性能时,不应该创建索引。
二、索引的分类
1.普通索引
这是最基本的索引,它没有任何限制,比如上文中为title字段创建的索引就是一个普通索引,MyIASM中默认的BTREE类型的索引,也是我们大多数情况下用到的索引。
#直接创建索引 CREATE INDEX index_name ON TABLE (COLUMN(length)); #修改表结构的方式添加索引 ALTER TABLE table_name ADD INDEX index_name ON (COLUMN(length)); #创建表的时候同时创建索引 CREATE TABLE `table` ( `id` INT (11) NOT NULL AUTO_INCREMENT, `title` CHAR (255) CHARACTER SET utf8 COLLATE utf8_general_ci NOT NULL, `content` text CHARACTER SET utf8 COLLATE utf8_general_ci NULL, `time` INT (10) NULL DEFAULT NULL, PRIMARY KEY (`id`), INDEX index_name (title(length)) ); #删除索引 DROP INDEX index_name ON TABLE;
2.唯一索引
唯一索引是不允许其中任何两行具有相同索引值的索引。
索引列的值必须唯一,但允许有空值,注意和主键不同。
当现有数据中存在重复的键值时,大多数数据库不允许将新创建的唯一索引与表一起保存。数据库还可能防止添加将在表中创建重复键值的新数据。例如,如果在employee表中职员的姓(lname)上创建了唯一索引,则任何两个员工都不能同姓。
#创建唯一索引 CREATE UNIQUE INDEX indexName ON TABLE (COLUMN); #修改表结构 ALTER TABLE table_name ADD UNIQUE indexName ON (COLUMN); #创建表的时候直接指定 CREATE TABLE `table` ( `id` INT (11) NOT NULL AUTO_INCREMENT, `title` CHAR (255) CHARACTER SET utf8 COLLATE utf8_general_ci NOT NULL, `content` text CHARACTER SET utf8 COLLATE utf8_general_ci NULL, `time` INT (10) NULL DEFAULT NULL, PRIMARY KEY (`id`), UNIQUE indexName (title) );
3.全文索引
FULLTEXT索引可以用于全文搜索。只有MYISAM存储引擎支持FULLTEXT索引,并且只支持CHAR、VARCHAR和TEXT类型。
#创建表的适合添加全文索引 CREATE TABLE `table` ( `id` INT (11) NOT NULL AUTO_INCREMENT, `title` CHAR (255) CHARACTER SET utf8 COLLATE utf8_general_ci NOT NULL, `content` text CHARACTER SET utf8 COLLATE utf8_general_ci NULL, `time` INT (10) NULL DEFAULT NULL, PRIMARY KEY (`id`), FULLTEXT (content) ); #修改表结构添加全文索引 ALTER TABLE article ADD FULLTEXT index_content (content); #直接创建索引 CREATE FULLTEXT INDEX index_content ON article (content);
4.复合索引
联合索引又叫复合索引。对于复合索引:Mysql从左到右的使用索引中的字段,一个查询可以只使用索引中的一部份,但只能是最左侧部分。例如索引是key index (a,b,c). 可以支持a | a,b| a,b,c 3种组合进行查找,但不支持 b,c进行查找 .当最左侧字段是常量引用时,索引就十分有效。
利用索引中的附加列,您可以缩小搜索的范围,但使用一个具有两列的索引 不同于使用两个单独的索引。复合索引的结构与电话簿类似,人名由姓和名构成,电话簿首先按姓氏对进行排序,然后按名字对有相同姓氏的人进行排序。如果您知 道姓,电话簿将非常有用;如果您知道姓和名,电话簿则更为有用,但如果您只知道名不姓,电话簿将没有用处。
所以说创建复合索引时,应该仔细考虑列的顺序。对索引中的所有列执行搜索或仅对前几列执行搜索时,复合索引非常有用;仅对后面的任意列执行搜索时,复合索引则没有用处.
ALTER TABLE article ADD INDEX index_titme_time (title(50), time(10));
建立这样的组合索引,其实是相当于分别建立了下面两组组合索引:
–title,time
–title
为什么没有time这样的组合索引呢?这是因为MySQL组合索引“最左前缀”的结果。简单的理解就是只从最左面的开始组合。并不是只要包含这两列的查询都会用到该组合索引,如下面的几个SQL所示:
#会使用到上面的索引 SELECT * FROM article WHREE title='测试' AND time=1234567890; SELECT * FROM article WHREE utitle='测试'; #不会使用上面的索引 SELECT * FROM article WHREE time=1234567890;