MySQL索引

索引是这样工作的:先在索引中找到对应的值,然后根据匹配的索引记录找到对应的行数据。例如此查询,select nick_name from user_info where user_id = 100;如果user_id列上建有索引,MySQL将使用该索引找到user_id为100的行,也就是说,MySQL先在索引上按值进行查找,然后返回所有包含该值的数据行。

 

一、B-Tree索引

谈及索引,如果没有明确指定,默认是B-Tree索引。

B-Tree索引是有序的,适用于全键值、键值范围或键最左前缀查找。

假设有如下数据表:

create table blog_user (

last_name varchar(40) not null,

first_name varchar(40) not null,

dob date not null,

gender enum('m', 'f') not null,

key(last_name, first_name, dob)

);

 

全值匹配:

select * from blog_user where last_name = 'Allen' and first_name = 'Kim' and dob = '2019-10-16';

匹配最左前缀:

select * from blog_user where last_name = 'Allen';

匹配列前缀:

select * from blog_user where last_name like 'A%';

匹配范围值:

select * from blog_user where last_name between 'Allen' and 'Barrymore';

精确匹配某一列并且范围匹配另外一列:

select * from blog_user where last_name = 'Allen' and first_name like 'K%';

只访问索引的查询:

select last_name, first_name, dob from blog_user where last_name like 'A%'; //查询只需要访问索引,无需回表

 

错误使用索引的例子:

select * from blog_user where first_name = 'Kim'; //未按照索引列的最左边开始查找

select * from blog_user where last_name = 'Allen' and dob = '2019-10-16'; //跳过了first_name索引列

Select * from blog_user where last_name = 'Smith' and first_name like 'J%' and dob = '2019-10-16'; //如果查询中有某个列的范围查询,则其右边的列都无法使用索引查找。这个查询只能使用索引的前两列。

 

索引同样适用于order by操作。

 

二、Hash索引

Hash索引基于哈希表实现,只有精确匹配索引所有列的查询才有效。对于每一行数据,存储引擎都会对所有的索引计算一个哈希码,哈希码是一个比较小的值,并且不同键值的行计算出来的哈希码也不一样。Hash索引将所有哈希码存储在索引中,同时在哈希表中保存指向每个数据行的指针。假如有哈希冲突,会使用链表解决冲突。

InnoDB不支持Hash索引,Memory支持。Hash索引只包含Hash值和行指针,不储存字段值,所以不能使用索引中的值来避免读取行(回表),不过访问内存中行的速度很快,所以大部分情况下这一点对性能的影响并不明显。

假设有如下数据表:

create table blog_hash (

last_name varchar(40) not null,

first_name varchar(40) not null,

key using hash(first_name)

) engine = memory;

 

select * from blog_hash where first_name = 'Peter';

MySQL先计算’Peter’的哈希值,并使用该值寻找对应的记录指针,最后比较指针指向的行的值是否为’Peter’,以确保就是要查找的行。

 

Hash索引的限制:

  1. Hash索引是无序的,所以无法用来排序。
  2. Hash索引不支持部分索引列匹配查找。
  3. Hash索引只支持等值比较查询,不支持范围查询。
  4. 哈希冲突很多的话会影响性能。

 

三、空间索引

MyISAM表支持空间索引,可以用作地理数据存储。和B-Tree索引不同,这类索引无需前缀查询。空间索引会从所有维度来索引数据。查询时,可以有效地使用任意维度来组合查询。

 

四、全文索引

全文索引是一种特殊类型的索引,它查找的是文本中的关键词,而不是直接比较索引中的值。全文索引和其他几类索引的匹配方式完全不一样,不能用where匹配。

在相同的列上同时创建全文索引和基于值的B-Tree索引不会有冲突,全文索引适用于match against操作,而不是普通的where条件操作。

 

索引的优点:

  1. 索引大大减少了服务器需要扫描的数据量。
  2. 索引可以帮助服务器避免排序和临时表。
  3. 索引可以将随机I/O变为顺序I/O。

 

参考资料:《高性能MySQL第三版》

posted @ 2019-10-16 18:51  灯无焰  阅读(110)  评论(0编辑  收藏  举报