8.2.1.3 Range Optimization
范围访问方法使用一个单个的索引来检索表记录的自己,包含在一个或者索引值区间。
它可以用于一个单独的部分或者多个部分的索引,下面章节给出了一个详细的描述关于如何从WHERE 子句中提取区间
8.2.1.3.1 范围访问方法用于单部分索引
对于一个单部分索引,索引值区间可以方便的体现通过相应的条件在WHERE子句,表示为范围条件,而不是"间隔"
单个range 条件定义对于一个单部分索引如下:
1. 对于BTREE和HASH 索引,key和恒定值比较是一个范围条件 当使用=,<=> in ,is NULL或者IS NOT NULL操作
此外, 对于BTREE 索引, key和常值比较是一个条件当使用e >, <, >=, <=, BETWEEN, !=, or <>操作或者LIKE 比较
如果参数to like 是一个常量 不是以一个通配符开始
对于所有index type, 多个range 条件集合OR或者AND 为一个range 条件
常量值在前面的描述意味着下面:
1.从查询字符串中的常量
2.一个常量或者系统表的列从相同关联
3.一个无关联子查询结果
4.任何表达式组成整个从之前类型的子表达式
这里有一些查询例子使用范围扫描在WHERE 子句:
SELECT * FROM t1
WHERE key_col > 1
AND key_col < 10;
SELECT * FROM t1
WHERE key_col = 1
OR key_col IN (15,18,20);
SELECT * FROM t1
WHERE key_col LIKE 'ab%'
OR key_col BETWEEN 'bar' AND 'foo';
一些非常量值可以被转换成常量在优化器常量传播阶段
MySQL 尝试提取范围条件从WHERE 子句对于每个可能的indexes.
在提取过程中,条件不能被用于构造范围条件会被drop掉,条件产生重叠范围会被合并,
条件产生空的范围会被删除
考虑下面的语句,key1 是一个索引列,nonkey 没有被索引
SELECT * FROM t1 WHERE
(key1 < 'abc' AND (key1 LIKE 'abcde%' OR key1 LIKE '%b')) OR
(key1 < 'bar' AND nonkey = 4) OR
(key1 < 'uux' AND key1 > 'z');
对于key1的提取过程:
1.从原始的WHERE 子句开始:
(key1 < 'abc' AND (key1 LIKE 'abcde%' OR key1 LIKE '%b')) OR
(key1 < 'bar' AND nonkey = 4) OR
(key1 < 'uux' AND key1 > 'z')
2. 删除nokey=4 和key1 LIKE '%b' 因为它们不能被用于一个范围扫描。
正确的方式是去掉它们替换它们使用TRUE,
因为我们不会丢失任何匹配的行当做一个范围扫描的时候,替换它们使用TRUE,我们得到:
(key1 < 'abc' AND (key1 LIKE 'abcde%' OR TRUE)) OR
(key1 < 'bar' AND TRUE) OR
(key1 < 'uux' AND key1 > 'z')
3.折叠的条件总是真的或者假的:
(key1 LIKE 'abcde%' OR TRUE) is always true
(key1 < 'uux' AND key1 > 'z') is always false
替换不必要的TRUE和FALSE常量,我们得到:
(key1 < 'abc') OR (key1 < 'bar')
通常(和前面的例子所证明的),条件用于一个范围扫描是很少限制的相比WHERE 子句
MySQL 执行一个额外的检查来过滤出记录 来满足范围条件但是不能完整的WHERE 子句
范围条件提取算法可以处理 netsted and/or 随意深度的结构, 它的输出不依赖条件出现在WHERE 子句的顺序
MySQL 不支持 合并多个range 对于range 访问方法,要解决这个限制,你可以使用一个UNION 相同的SQL语句,
除非你放置每个谓词在不同的SELECT 语句
8.2.1.3.2 范围访问方法用于多部分索引:
Range 条件在一个多部分多音是一个rang 条件的扩展,
一个range 条件在多部分索引限制索引记录位于一个或者多个key tuple 区间。
Key 区间是定义通过key 的集合
例如,考虑一个多部分索引定义为key1(key_part1, key_part2, key_part3)
key_part1 key_part2 key_part3
NULL 1 'abc'
NULL 1 'xyz'
NULL 2 'foo'
1 1 'abc'
1 1 'xyz'
1 2 'abc'
2 1 'aaa'
条件 key_part1 =1 定义这个区间:
(1,-inf,-inf) <= (key_part1,key_part2,key_part3) < (1,+inf,+inf)
对于B树索引,一个区间可能是用于条件集合AND,每个条件比较一个Key和一个常值 使用
=, <=>, IS NULL, >, <, >=, <=, !=, <>, BETWEEN, or LIKE 'pattern'
(模式不是以一个通配符开始的)
一个区间可以用于确定一个单独的key 包含所有的记录,匹配条件(或者2个区间 如果 <> or != 被使用)
优化尝试使用额外的索引部分来决定区间只要比较表达式 是 =, <=>, or IS NULL. I
如果 操作符是>, <, >=, <=, !=, <>, BETWEEN, or LIKE,
优化器使用它不考虑更多的key
如果下面的表达式,优化器使用=从第一个比较,
它也使用>=从第2个比较表达式 但是不在考虑索引部分
key_part1 = 'foo' AND key_part2 >= 10 AND key_part3 > 10
多只比较 平等范围优化:
考虑表达式,col_names 是一个索引的列:
col_name IN(val1, ..., valN)
col_name = val1 OR ... OR col_name = valN
如果col_name 是等于任何几个值中的一个 ,那么每个表达式是真的。
那些表达式是等于范围比较(range 是一个单独的值)
优化器评估 读取符合记录的成本对于平等范围比较如下:
如果有一个唯一的索引在col_name,row 评估每个range 是1
因为最多一个记录可以有给定的值
否则,任何Index 在col_name 是非唯一的,优化器可以评估记录数对于每个range 使用