索引

索引概述：

　　MySQL官方对索引的定义为：索引（index）是帮助MySQL高效获取数据的数据结构（有序）。在数据之外，数据库系统还维护者满足特定查找算法的数据结构，这些数据结构以某种方式引用（指向）数据，这样就可以在这些数据结构上实现高级查找算法，这种数据结构就是索引。
　　

　　一般来说索引本身也很大，不可能全部存储在内存中，因此索引往往以索引文件的形式存储在磁盘上。索引是数据库中用来提高性能的最常用的工具。

索引优势劣势：

　　优势
　　　　1）类似于书籍的目录索引，提高数据检索的效率，降低数据库的IO成本。
　　　　2）通过索引列对数据进行排序，降低数据排序的成本，降低CPU的消耗。
　　劣势

　　　　1）实际上索引也是一张表，该表中保存了主键与索引字段，并指向实体类的记录，所以索引列也是要占用空间的。
　　　　2）虽然索引大大提高了查询效率，同时却也降低更新表的速度，如对表进行INSERT、UPDATE、DELETE。因为更新表时，MySQL 不仅要保存数据，还要保存一下索引文件每次更新添加了索引列的字段，都会调整因为更新所带来的键值变化后的索引信息。

索引结构：

　　索引是在MySQL的存储引擎层中实现的，而不是在服务器层实现的。所以每种存储引擎的索引都不一定完全相同，也不是所有的存储引擎都支持所有的索引类型的。
　　MySQL目前提供了以下4种索引：

　　　　BTREE 索引：最常见的索引类型，大部分索引都支持 B 树索引。
　　　　HASH 索引：只有Memory引擎支持，使用场景简单。
　　　　R-tree 索引（空间索引）：空间索引是MyISAM引擎的一个特殊索引类型，主要用于地理空间数据类型，使用较少。
　　　　Full-text （全文索引）：全文索引也是MyISAM的一个特殊索引类型，主要用于全文索引，InnoDB从Mysql5.6版本开始支持全文索引。
　　MyISAM、InnoDB、Memory三种存储引擎对各种索引类型的支持

　　　　平常所说的索引，如果没有特别指明，都是指B+树（多路搜索树，并不一定是二叉的）结构组织的索引。
　　　　其中聚集索引、复合索引、前缀索引、唯一索引默认都是使用 B+tree 索引，统称为索引。

　　BTREE 结构：

　　　　BTree又叫多路平衡搜索树，一颗m叉的BTree特性如下：
　　　　　　树中每个节点最多包含m个孩子。
　　　　　　除根节点与叶子节点外，每个节点至少有[ceil(m/2)]个孩子。
　　　　　　若根节点不是叶子节点，则至少有两个孩子。
　　　　　　所有的叶子节点都在同一层。
　　　　　　每个非叶子节点由n个key与n+1个指针组成，其中[ceil(m/2)-1] <= n <= m-1

　　　　BTREE树和二叉树相比，查询数据的效率更高，因为对于相同的数据量来说，BTREE的层级结构比二叉树小，因此搜索速度快。

　　B+TREE 结构：

　　　　B+Tree为BTree的变种，B+Tree与BTree的区别为：
　　　　　　1). n叉B+Tree最多含有n个key，而BTree最多含有n-1个key。
　　　　　　2). B+Tree的叶子节点保存所有的key信息，依key大小顺序排列。
　　　　　　3). 所有的非叶子节点都可以看作是key的索引部分。

　　　　由于B+Tree只有叶子节点保存key信息，查询任何key都要从root走到叶子。所以B+Tree的查询效率更加稳定。
　　MySQL中的B+Tree：

　　　　MySql索引数据结构对经典的B+Tree进行了优化。在原B+Tree的基础上，增加一个指向相邻叶子节点的链表指针，就形成了带有顺序指针的B+Tree，提高区间访问的性能。

索引分类：

　　1）单值索引：即一个索引只包含单个列，一个表可以有多个单列索引
　　2）唯一索引：索引列的值必须唯一，但允许有空值
　　3）复合索引：即一个索引包含多个列

索引语法：

　　索引在创建表的时候，可以同时创建，也可以随时增加新的索引。

　　创建索引：CREATE INDEX index_name ON tbl_name(index_col_name,...)

　　查看索引：show index from table_name;

　　删除索引：DROP INDEX index_name ON tbl_name;

　　ALTER命令：

1). alter table tb_name add primary key(column_list);
　　该语句添加一个主键，这意味着索引值必须是唯一的，且不能为NULL
2). alter table tb_name add unique index_name(column_list);
　　这条语句创建索引的值必须是唯一的（除了NULL外，NULL可能会出现多次）
3). alter table tb_name add index index_name(column_list);
　　添加普通索引， 索引值可以出现多次。
4). alter table tb_name add fulltext index_name(column_list);
　　该语句指定了索引为FULLTEXT， 用于全文索引

索引设计原则：

　　索引的设计可以遵循一些已有的原则，创建索引的时候请尽量考虑符合这些原则，便于提升索引的使用效率，更高效的使用索引。
　　　　对查询频次较高，且数据量比较大的表建立索引。

　　　　索引字段的选择，最佳候选列应当从where子句的条件中提取，如果where子句中的组合比较多，那么应当挑选最常用、过滤效果最好的列的组合。
　　　　使用唯一索引，区分度越高，使用索引的效率越高。
　　　　索引可以有效的提升查询数据的效率，但索引数量不是多多益善，索引越多，维护索引的代价自然也就水涨船高。对于插入、更新、删除等DML操作比较频繁的表来说，索引过多，会引入相当高的维护代价，降低DML操作的效率，增加相应操作的时间消耗。另外索引过多的话，MySQL也会犯选择困难病，虽然最终仍然会找到一个可用的索引，但无疑提高了选择的代价。
　　　　使用短索引，索引创建之后也是使用硬盘来存储的，因此提升索引访问的I/O效率，也可以提升总体的访问效率。假如构成索引的字段总长度比较短，那么在给定大小的存储块内可以存储更多的索引值，相应的可以有效的提升MySQL访问索引的I/O效率。
　　　　利用最左前缀，N个列组合而成的组合索引，那么相当于是创建了N个索引，如果查询时where子句中使用了组成该索引的前几个字段，那么这条查询SQL可以利用组合索引来提升查询效率。

创建复合索引:
    CREATE INDEX idx_name_email_status ON tb_seller(NAME,email,STATUS);
就相当于
    对name 创建索引 ;
    对name , email 创建了索引 ;
    对name , email, status 创建了索引 ;

索引的使用：避免索引失效

　　1). 全值匹配（无所谓字段的先后顺序），对索引中所有列都指定具体值。该情况下，索引生效，执行效率高。

　　2). 最左前缀法则

　　　　如果索引了多列，要遵守最左前缀法则。指的是查询从索引的最左前列开始，并且不跳过索引中的列

　　　　如果符合最左法则，但是出现跳跃某一列，只有最左列索引生效

　　3). 范围查询列，不能使用索引。必须精确匹配

　　4). 不要在索引列上进行运算操作，索引将失效。

　　5). 字符串不加单引号，造成索引失效。

　　　　由于，在查询时，没有对字符串加单引号，MySQL的查询优化器，会自动的进行类型转换，造成索引失效。

　　6). 尽量使用覆盖索引，避免select *

　　　　尽量使用覆盖索引（只访问索引列的查询（索引列完全包含查询列）），减少select * 。

　　　　如果查询的列，超出索引的列，也会降低性能。

　　7). 用or分割开的条件，如果or前的条件中的列有索引，而后面的列中没有索引，那么涉及的索引都不会被用到。

　　8). 以%开头的Like模糊查询，索引失效。

　　　　如果仅仅是尾部模糊匹配，索引不会失效。如果是头部模糊匹配，索引失效（可以通过覆盖索引来解决）。

　　　　　　覆盖索引：SQL只需要通过索引就可以返回查询所需要的数据，而不必通过二级索引查到主键之后再去查询数据

　　9). 如果MySQL评估使用索引比全表更慢，则不使用索引。（mysql底层优化）

　　10). is NULL ， is NOT NULL 有时索引失效。原因：如果条件的值为null占表的大部分，mysql底层会判断还不如全表扫描更快，反之not null也一样

　　11). in 走索引， not in 索引失效。

　　12). 单列索引和复合索引。尽量使用复合索引，而少使用单列索引。

　　　　因为如果查询条件包含多个单列索引，只会使用其中一个最优的索引（辨识度最高索引），并不会使用全部索引。

posted @ 2020-04-22 02:03 糖不甜，盐不咸阅读(186) 评论(0) 收藏举报

刷新页面返回顶部

路上的风景

索引

公告