参考资料：

http://blog.csdn.net/v_july_v/article/details/6530142
http://blog.codinglabs.org/articles/theory-of-mysql-index.html
https://dev.mysql.com/doc/refman/5.6/en/mysql-indexes.html
https://www.zhihu.com/question/36996520
https://stackoverflow.com/questions/21927117/what-is-this-operator-in-mysql
http://thephper.com/?p=142

0. 环境

MySQL: 5.6.22

1. 概述

大部分MySQL索引(PRIMARY KEY, UNIQUE, INDEX, FULLTEXT)是以B+tree算法存储。例外：

基于空间数据类型(spatial data types)使用R-trees算法
MEMORY引擎支持Hash算法
InnoDB引擎的全文检索索引(FULLTEXT)使用倒排列表(inverted lists)算法

2. B+tree索引与Hash索引的区别

B+tree索引可以在=, >, >=, <, <= 和 BETWEEN操作中使用，也适用于不以通配符开始的LIKE操作(eg. LIKE '1%' or LIKE '1%2%')，而Hash索引限制如下：

仅适用于=, <=> 操作且检索速度很优秀('a' IS NULL等价于'a' <=> NULL，<=>只能用于Mysql)
无法使用Hash索引优化ORDER BY
无法使用Hash索引计算两个值间区间大小
Hash索引不能拆分使用(相对于B-tree的最左匹配原则)

3. 为什么使用B+tree?

由于MySQL的索引文件通常很大无法常驻内存，故以文件形式存储于磁盘，于是优化MySQL检索速度很大程度上是在优化磁盘IO，即减小磁盘使用空间以及降低IO频率。动态查找树主要有：

二叉查找树(Binary Search Tree)
平衡二叉查找树(Balanced Binary Search Tree)
红黑树(Red-Black Tree )
B-tree/B+tree/ B*tree (B~Tree)

前三者都是二叉树结构，随着结点的增加，会导致树的深度过大从而导致磁盘IO过于频繁，相反B-tree等使用多叉树结构，可以保持树的高度较低，减少IO次数，提升查找速度。

4. B-tree与B+tree区别

B+tree的内部结点并没有指向关键字具体信息的指针，故内部结点相对B-tree更小，于是需要的存储空间更小
B+tree所有的叶子结点中包含了全部关键字的信息，及指向含有这些关键字记录的指针，且叶子结点本身依关键字的大小自小而大的顺序链接，B+tree只要遍历叶子节点就可以实现整棵树的遍历

5. MyISAM及InnoDB的B+tree区别

尽管MyISAM和InnoDB都以基于B+tree实现的索引，但实现方式并不一样：

MyISAM的索引与数据分开两个文件存储，而InnoDB的索引与数据存储在同一个文件里
MyISAM的辅助索引的data域存储相应记录主键的地址，而InnoDB存储主键的值

6. 联合索引的最左匹配原则测试

创建表并初始化数据

CREATE TABLE `t_question` (
  `id` int(11) NOT NULL AUTO_INCREMENT,
  `course` varchar(10) NOT NULL COMMENT '科目',
  `grade` varchar(10) NOT NULL COMMENT '年级',
  `type` varchar(10) NOT NULL COMMENT '类型',
  `content` text COMMENT '题目内容',
  `upload_time` datetime NOT NULL COMMENT '上传时间',
  `source` varchar(50) DEFAULT NULL COMMENT '来源',
  PRIMARY KEY (`id`),
  KEY `Index 3` (`course`,`grade`,`type`)
) ENGINE=InnoDB DEFAULT CHARSET=utf8 COMMENT='题目表';

联合索引使用不一定与顺序相关

explain select * from t_question where course='语文' and grade='六年级' and `type`='选译题';
explain select * from t_question where grade='六年级' and `type`='选译题' and course='语文';

由于MySQL查询优化器，它们使用了相同的索引

同理，以下语句也使用了相同的索引

explain select * from t_question where content like '%<p>%' and grade='六年级' and `type`='选择题' and course='语文';
explain select * from t_question where grade='六年级' and `type`='选择题' and course='语文' and  content like '%<p>%';

联合索引可以使用部分索引

explain select * from t_question where course='语文' and grade='六年级';
explain select * from t_question where course='语文' and `type`='选译题';

仍然可以使用联合索引，只是key_len不一样而已

最左字段缺席时不能使用联合索引

explain select * from t_question where grade='六年级' and `type`='选译题';
explain select * from t_question where grade='六年级';
explain select * from t_question where `type`='选译题';

7. 常见字段已创建索引但不能使用索引的情况

不符合索引的最左匹配原则
MySQL估计使用索引效率不及全表扫描
以通配符开头的模糊查询，例如SELECT * FROM t_question WHERE course LIKE '%文'
NOT IN，例如SELECT * FROM t_question WHERE course NOT IN('语文')
!=或<>，例如SELECT * FROM t_question WHERE course!='语文'
OR，例如SELECT * FROM t_question WHERE course='语文' OR grade='一年级'
对列进行函数运算，例如SELECT * FROM t_question WHERE substring(course, 1, 1)='文'
字符型的列使用数值型的检索方式，例如SELECT * FROM t_question WHERE course=1，而SELECT * FROM t_question WHERE course='1'则可以用到索引

8. MySQL锁的引申阅读

http://blog.csdn.net/mysteryhaohao/article/details/51669741
http://jaeger.blog.51cto.com/11064196/1765906

MyISAM引擎支持表锁，而InnoDB引擎支持表锁和行锁。

在使用MyISAM引擎时，读写基本可以理解为串行，但可以通过修改系统变量concurrent_insert达到并发
在使用InnoDB引擎时，若执行的语句未使用索引，那么MySQL将使用表锁而非行锁，因为MySQL的行锁是通过给索引上的索引项加锁来实现的。一旦索引项加锁，操作不同行但使用同索引的数据也会因无法获得锁而阻塞

posted on 2017-06-22 17:58 hiv 阅读(350) 评论(0) 收藏举报

刷新页面返回顶部

公告