mysql索引

DB哥MySQL高级教程-系统学习MySQL共149课时
加我微信公众号免费学:【DB哥】
文末有MySQL高级课程目录

索引

2.1 索引概述

MySQL官方对索引的定义为:索引(index)是帮助MySQL高效获取数据的数据结构(有序)。在数据之外,数据库系统还维护者满足特定查找算法的数据结构,这些数据结构以某种方式引用(指向)数据, 这样就可以在这些数据结构上实现高级查找算法,这种数据结构就是索引。如下面的==示意图==所示 :

 

左边是数据表,一共有两列七条记录,最左边的是数据记录的物理地址(注意逻辑上相邻的记录在磁盘上也并不是一定物理相邻的)。为了加快Col2的查找,可以维护一个右边所示的二叉查找树,每个节点分别包含索引键值和一个指向对应数据记录物理地址的指针,这样就可以运用二叉查找快速获取到相应数据。

一般来说索引本身也很大,不可能全部存储在内存中,因此索引往往以索引文件的形式存储在磁盘上。索引是数据库中用来提高性能的最常用的工具。

2.2 索引优势劣势

优势

1) 类似于书籍的目录索引,提高数据检索的效率,降低数据库的IO成本。

2) 通过索引列对数据进行排序,降低数据排序的成本,降低CPU的消耗。

劣势

1) 实际上索引也是一张表,该表中保存了主键与索引字段,并指向实体类的记录,所以索引列也是要占用空间的。

2) 虽然索引大大提高了查询效率,同时却也降低更新表的速度,如对表进行INSERT、UPDATE、DELETE。因为更新表时,MySQL 不仅要保存数据,还要保存一下索引文件每次更新添加了索引列的字段,都会调整因为更新所带来的键值变化后的索引信息。

2.3 索引结构

索引是在MySQL的存储引擎层中实现的,而不是在服务器层实现的。所以每种存储引擎的索引都不一定完全相同,也不是所有的存储引擎都支持所有的索引类型的。MySQL目前提供了以下4种索引:

  • BTREE 索引 : 最常见的索引类型,大部分索引都支持 B 树索引。

  • HASH 索引:只有Memory引擎支持 , 使用场景简单 。

  • R-tree 索引(空间索引):空间索引是MyISAM引擎的一个特殊索引类型,主要用于地理空间数据类型,通常使用较少,不做特别介绍。

  • Full-text (全文索引) :全文索引也是MyISAM的一个特殊索引类型,主要用于全文索引,InnoDB从Mysql5.6版本开始支持全文索引。

MyISAM、InnoDB、Memory三种存储引擎对各种索引类型的支持

索引InnoDB引擎MyISAM引擎Memory引擎
BTREE索引 支持 支持 支持
HASH 索引 不支持 不支持 支持
R-tree 索引 不支持 支持 不支持
Full-text 5.6版本之后支持 支持 不支持

我们平常所说的索引,如果没有特别指明,都是指B+树(多路搜索树,并不一定是二叉的)结构组织的索引。其中聚集索引、复合索引、前缀索引、唯一索引默认都是使用 B+tree 索引,统称为 索引。

2.3.1 BTREE 结构

BTree又叫多路平衡搜索树,一颗m叉的BTree特性如下:

  • 树中每个节点最多包含m个孩子。

  • 除根节点与叶子节点外,每个节点至少有[ceil(m/2)]个孩子。

  • 若根节点不是叶子节点,则至少有两个孩子。

  • 所有的叶子节点都在同一层。

  • 每个非叶子节点由n个key与n+1个指针组成,其中[ceil(m/2)-1] <= n <= m-1

以5叉BTree为例,key的数量:公式推导[ceil(m/2)-1] <= n <= m-1。所以 2 <= n <=4 。当n>4时,中间节点分裂到父节点,两边节点分裂。

插入 C N G A H E K Q M F W L T Z D P R X Y S 数据为例。

演变过程如下:

1). 插入前4个字母 C N G A

2). 插入H,n>4,中间元素G字母向上分裂到新的节点

3). 插入E,K,Q不需要分裂

4). 插入M,中间元素M字母向上分裂到父节点G

5). 插入F,W,L,T不需要分裂

6). 插入Z,中间元素T向上分裂到父节点中

7). 插入D,中间元素D向上分裂到父节点中。然后插入P,R,X,Y不需要分裂

8). 最后插入S,NPQR节点n>5,中间节点Q向上分裂,但分裂后父节点DGMT的n>5,中间节点M向上分裂

到此,该BTREE树就已经构建完成了, BTREE树 和 二叉树 相比, 查询数据的效率更高, 因为对于相同的数据量来说,BTREE的层级结构比二叉树小,因此搜索速度快。

2.3.3 B+TREE 结构

B+Tree为BTree的变种,B+Tree与BTree的区别为:

1). n叉B+Tree最多含有n个key,而BTree最多含有n-1个key。

2). B+Tree的叶子节点保存所有的key信息,依key大小顺序排列。

3). 所有的非叶子节点都可以看作是key的索引部分。

由于B+Tree只有叶子节点保存key信息,查询任何key都要从root走到叶子。所以B+Tree的查询效率更加稳定。

 

2.3.3 MySQL中的B+Tree

MySql索引数据结构对经典的B+Tree进行了优化。在原B+Tree的基础上,增加一个指向相邻叶子节点的链表指针,就形成了带有顺序指针的B+Tree,提高区间访问的性能。

MySQL中的 B+Tree 索引结构示意图:

2.4 索引分类

1) 单值索引 :即一个索引只包含单个列,一个表可以有多个单列索引

2) 唯一索引 :索引列的值必须唯一,但允许有空值

3) 复合索引 :即一个索引包含多个列

2.5 索引语法

索引在创建表的时候,可以同时创建, 也可以随时增加新的索引。

准备环境:

 
create database demo_01 default charset=utf8mb4;

use demo_01;

CREATE TABLE `city` (
  `city_id` int(11) NOT NULL AUTO_INCREMENT,
  `city_name` varchar(50) NOT NULL,
  `country_id` int(11) NOT NULL,
  PRIMARY KEY (`city_id`)
) ENGINE=InnoDB DEFAULT CHARSET=utf8;

CREATE TABLE `country` (
  `country_id` int(11) NOT NULL AUTO_INCREMENT,
  `country_name` varchar(100) NOT NULL,
  PRIMARY KEY (`country_id`)
) ENGINE=InnoDB DEFAULT CHARSET=utf8;


insert into `city` (`city_id`, `city_name`, `country_id`) values(1,'西安',1);
insert into `city` (`city_id`, `city_name`, `country_id`) values(2,'NewYork',2);
insert into `city` (`city_id`, `city_name`, `country_id`) values(3,'北京',1);
insert into `city` (`city_id`, `city_name`, `country_id`) values(4,'上海',1);

insert into `country` (`country_id`, `country_name`) values(1,'China');
insert into `country` (`country_id`, `country_name`) values(2,'America');
insert into `country` (`country_id`, `country_name`) values(3,'Japan');
insert into `country` (`country_id`, `country_name`) values(4,'UK');
2.5.1 创建索引

语法 :

CREATE     [UNIQUE|FULLTEXT|SPATIAL]  INDEX index_name 
[USING  index_type]
ON tbl_name(index_col_name,...)


index_col_name : column_name[(length)][ASC | DESC]

示例 : 为city表中的city_name字段创建索引 ;

2.5.2 查看索引

语法:

show index  from  table_name;

示例:查看city表中的索引信息;

 

2.5.3 删除索引

语法 :

DROP  INDEX  index_name  ON  tbl_name;

示例 : 想要删除city表上的索引idx_city_name,可以操作如下:



2.5.4 ALTER命令
复制代码
1). alter  table  tb_name  add  primary  key(column_list); 

    该语句添加一个主键,这意味着索引值必须是唯一的,且不能为NULL
    
2). alter  table  tb_name  add  unique index_name(column_list);
    
    这条语句创建索引的值必须是唯一的(除了NULL外,NULL可能会出现多次)
    
3). alter  table  tb_name  add  index index_name(column_list);

    添加普通索引, 索引值可以出现多次。
    
4). alter  table  tb_name  add  fulltext  index_name(column_list);
    
    该语句指定了索引为FULLTEXT, 用于全文索引
#### 2.6 索引设计原则

​    索引的设计可以遵循一些已有的原则,创建索引的时候请尽量考虑符合这些原则,便于提升索引的使用效率,更高效的使用索引。

- 对查询频次较高,且数据量比较大的表建立索引。

- 索引字段的选择,最佳候选列应当从where子句的条件中提取,如果where子句中的组合比较多,那么应当挑选最常用、过滤效果最好的列的组合。

- 使用唯一索引,区分度越高,使用索引的效率越高。

- 索引可以有效的提升查询数据的效率,但索引数量不是多多益善,索引越多,维护索引的代价自然也就水涨船高。对于插入、更新、删除等DML操作比较频繁的表来说,索引过多,会引入相当高的维护代价,降低DML操作的效率,增加相应操作的时间消耗。另外索引过多的话,MySQL也会犯选择困难病,虽然最终仍然会找到一个可用的索引,但无疑提高了选择的代价。

- 使用短索引,索引创建之后也是使用硬盘来存储的,因此提升索引访问的I/O效率,也可以提升总体的访问效率。假如构成索引的字段总长度比较短,那么在给定大小的存储块内可以存储更多的索引值,相应的可以有效的提升
MySQL访问索引的I/O效率。 - 利用最左前缀,N个列组合而成的组合索引,那么相当于是创建了N个索引,如果查询时where子句中使用了组成该索引的前几个字段,那么这条查询SQL可以利用组合索引来提升查询效率。
创建复合索引:

    CREATE INDEX idx_name_email_status ON tb_seller(NAME,email,STATUS);

就相当于
    对name 创建索引 ;
    对name , email 创建了索引 ;
    对name , email, status 创建了索引 ;

为什么那么多人学MySQL,最后放弃了。因为你走弯路了,没有系统的规划,碎片化的学习,让你对MySQL没有一个整体的认知,而且没有人给你引路指导、纠错,让你很难有进步。

【MySQL课程大纲】备战加薪季,硬核技能来助力!关注我的微信公众号【DB哥】免费学MySQL高级课程

第1章 互联网公司MySQL安装部署
 
1-1互联网公司安装MySQL规范[09:13]
1-2手把手带你安装MySQL5.7.26[18:20]
1-3手把手带你安装MySQL8.0.20[11:52]
1-4.MySQL多实例的二三事[16:10]
 
第2章 MySQL启动时遇到的那些坑
 
2-1生产中的MySQL启动及MySQL启动顺序[17:54]
2-2常见MySQL启动失败案例(1)[22:15]
2-3常见MySQL启动失败案例(2)[21:09]
2-4MySQL数据库用户安全策略[14:44]
2-5找回丢失的用户密码[06:36]
 
第3章 MySQL数据库乱码之字符集
 
3-1MySQL字符集[32:27]
3-2插入中文乱码解决[05:54]
3-3数据库常见字符集及如何选择字符集[03:48]
3-4生产中如何彻底避免出现乱码[04:54]
 
第4章 MySQL用户权限管理
 
4-1MySQL用户权限管理及注意事项[25:53]
4-2你必须知道的MySQL用户知识[14:10]
4-3MySQL用户权限案例(1)[12:19]
4-4MySQL用户权限案例(2)[20:03]
 
第5章 SQL编程与性能
 
5-1SQL编程入门也精彩(1)[26:57]
5-2SQL编程入门也精彩(2)[24:51]
5-3MySQL数据类型与性能(1)[35:42]
5-4MySQL数据类型与性能(2)[21:00]
5-5MySQL约束[32:54]
5-6SQL编程高级之导入测试库及表结构分析[06:56]
5-7SQL编程高级之查询列[14:40]
5-8SQL编程高级之where子句[30:09]
5-9SQL编程高级之group by子句[15:07]
5-10SQL编程高级之order by子句[10:38]
5-11SQL编程高级之limit子句及聚合函数[12:43]
5-12SQL编程高级之多表查询[11:02]
5-13SQL编程高级之子查询[18:56]
5-14SQL编程高级之MySQL巡检案例[13:50]
 
第6章 MySQL索引性能优化
 
6-1MySQL索引与二分查找法[38:23]
6-2剖析b+tree数据结构[34:14]
6-3相辅相成的聚集索引和辅助索引[29:08]
6-4覆盖索引与回表查询[13:22]
6-5创建高性能的主键索引[14:57]
6-6唯一索引与普通索引的性能差距[18:06]
6-7前缀索引带来的性能影响[13:04]
6-8你真的会使用联合索引吗[18:50]
6-9Online DDL影响数据库的性能和并发[24:21]
6-10pt-osc原理与应用[22:15]
6-11生产中索引的管理[19:59]
6-12SQL语句无法使用索引的情况[22:10]
 
第7章 information_schema和sys中索引应用
 
7-1大有用处的STATISTICS[15:22]
7-2判断索引创建是否合理[13:41]
7-3检查联合索引创建是否合理[09:32]
7-4有了联合索引(a,b),还要创建a索引吗[06:50]
7-5如何查找冗余索引[05:52]
7-6如何查找产生额外排序的sql语句[09:48]
7-7如何查找产生临时表的sql语句[08:36]
7-8全表扫描及统计产生全表扫描的sql语句[08:12]
7-9统计无用的索引[02:33]
7-10索引统计信息管理[07:26]
 
第8章 MySQL优化器算法与执行计划
 
8-1简单嵌套查询算法-SNLJ[08:01]
8-2基于索引的嵌套查询算法-INLJ[08:10]
8-3基于块的嵌套查询算法- BNLJ[09:30]
8-4Multi-Range Read算法[06:39]
8-5联表查询算法BKA[05:19]
8-6mysql三层体系结构和ICP索引条件下推[10:49]
8-7一条查询SQL语句是怎样运行的[11:38]
8-8一条更新SQL语句是怎样运行的[05:53]
8-9MySQL长连接与短连接的选择[07:10]
8-10执行计划explain详解[24:20]
 
第9章 MySQL核心之InnoDB存储引擎
 
9-1innodb存储引擎体系结构[13:02]
9-2提升数据库性能-缓冲池[34:30]
9-3刷写脏页check point[10:39]
9-4重做日志-redo log[23:39]
9-5回滚日志-undo log[10:04]
9-6.DML语句性能提升技术-插入缓冲[14:44]
9-7数据写入可靠性提升技术-两次写[06:58]
9-8自适应哈希索引-AHI[06:51]
9-9innodb预读预写技术[08:17]
9-10参数配置文件[09:04]
9-11错误日志文件[05:46]
9-12慢查询日志文件[11:42]
9-13MySQL二进制日志(1)[31:28]
9-14MySQL二进制日志(2)[24:57]
9-15表空间文件[12:05]
9-16InnoDB存储引擎表空间结构[17:05]
9-17表碎片清理[14:22]
9-18表空间文件迁移[16:39]
 
第10章 MySQL查询优化
 
10-1MySQL查询优化技术[08:34]
10-2子查询优化[11:31]
10-3外连接消除[04:43]
10-4生产中可不可以使用join联表查询[11:41]
10-5group by分组优化[10:16]
10-6order by排序优化[09:02]
10-7MySQL性能抖动问题[04:26]
10-8count(*)优化[08:22]
10-9磁盘性能基准测试[11:11]
10-10MySQL基准测试[07:42]
 
第11章 事务
 
11-1认识事务[12:30]
11-2事务控制语句[20:40]
11-3事务的实现方式[13:40]
11-4purge thread线程[06:09]
11-5事务统计QPS与TPS[13:02]
11-6事务隔离级别[28:19]
11-7事务组提交group commit[08:03]
11-8事务两阶段提交[07:51]
 
第12章 锁优化
 
12-1认识锁[10:57]
12-2innodb行锁[19:21]
12-3索引对行锁粒度的影响[26:16]
12-4FTWRL全局读锁[06:19]
12-5innodb表锁[12:04]
12-6innodb意向锁与MDL锁[15:45]
12-7自增锁[11:27]
12-8插入意向锁[07:13]
12-9死锁[16:51]
12-10MySQL两阶段锁协议[09:55]
 
第13章 MVCC多版本并发控制
 
13-1MVCC多版本并发控制[13:01]
 
第14章 备份恢复
 
14-1生产中备份恢复的方式[08:00]
14-2mysqldump备份实战及原理[24:28]
14-3mysqldump全备及binlog恢复数据[13:43]
14-4xtrabackup备份工具安装[04:03]
14-5xtrabackup备份恢复实战及原理[14:08]
14-6binlog备份[10:07]
 
第15章 MySQL主从复制架构
 
15-1认识主从复制[11:16]
15-2主从复制架构部署[09:26]
15-3主从复制原理深入讲解[16:29]
15-4从库状态详解[26:21]
15-5过滤复制[18:42]
15-6主从复制案例主库删除[09:31]
15-7主从复制中断解决方案[12:52]
15-8延迟复制[07:40]
15-9主库drop误操作利用延迟复制恢复案例[15:27]
15-10并行复制[15:47]
15-11增强半同步复制[11:11]
15-12主从数据一致性校验[07:35]
15-13gtid复制[13:17]
15-14主从复制架构[10:33]
 
第16章 MySQL高可用和读写分离架构优化
 
16-1MHA高可用架构部署[20:39]
16-2主库宕机故障模拟及处理[05:03]
16-3MHA VIP自动切换[09:54]
16-4MHA主从数据自动补足[07:42]
16-5Atlas读写分离高性能架构[15:09]
16-6读写分离架构应用[08:52]
16-7Atlas在线管理[04:18]
16-8读写分离避坑指南[07:11]
 
第17章 MySQL分库分表优化
 
17-1MyCAT分布式架构入门及双主架构[11:48]
17-2MyCAT架构部署[20:39]
17-3MyCAT安装[08:39]
17-4MyCAT读写分离架构[13:52]
17-5MyCAT高可用读写分离架构[07:21]
17-6schema.xml配置文件详解[07:07]
17-7MyCAT垂直分表[10:55]
17-8MyCAT水平分表-范围分片[10:18]
17-9MyCAT水平分表-取模分片[06:38]
17-10MyCAT水平分表-枚举分片[08:10]
17-11MyCAT全局表与ER表开始学习
 
关注我的微信公众号【DB哥】,免费学MySQL高级课程,快学起来吧
posted @ 2021-08-31 20:14  DB哥  阅读(2462)  评论(0编辑  收藏  举报