一文讲透如何看懂Oracle索引执行类型（index unique scan,index range scan,index full scan,index fast full scan,index skip scan）

直入主题，因为看不懂Oracle的执行计划/解释计划（explain plan），我摸着石头过河，终于整理出一点关于oracle各种索引执行类型的小心得，希望能帮到面向百度编程各位！

index unique scan -- 索引唯一扫描

条件：

1. 列的值唯一

2. 用 '=' 来查询

index range scan -- 索引局部扫描

条件：

1. 列的值唯一

2. 范围查询(>, <, and...)

1. 列的值不唯一

2. 所有查询(=, >, <, and...)

index full scan -- 索引全局扫描

条件：

1. 必须是组合索引

2. 引导列不在where条件中

3. 必须是覆盖索引

PS: 当进行index full scan的时候 oracle定位到索引的root block，然后到branch block（如果有的话），再定位到第一个leaf block, 然后根据leaf block的双向链表顺序读取。它所读取的块都是有顺序的，也是经过排序的。

index fast full scan -- 索引快速全局扫描，不带order by 情况下常发生

如果select 语句后面中的列都被包含在组合索引中，而且where后面没有出现组合索引的引导列，并且需要检索出大部分数据，那么这个时候可能执行index fast full scan

条件：

1. 必须是组合索引

2. 引导列不在where条件中

3. 必须是覆盖索引

PS: index fast full scan则不同，它是从段头开始，读取包含位图块，root block, 所有的branch block, leaf block，读取的顺序完全由物理存储位置决定，并采取多块读，每次读取db_file_multiblock_read_count个。

所以：
1. 索引全扫描要排序，索引快速全扫描不用排序（索引全扫描会按照叶子块排序返回，而索引快速全扫描则是按照索引段内存储块顺序返回）。
2. 索引全扫描不得读取索引段头，而索引快速全扫描要读取索引段头

index skip scan -- 索引跳跃扫描，where 条件列是非索引的前导列情况下常发生

当查询可以通过组合索引得到结果，而且返回结果很少，并且where条件中没有包含索引引导列的时候，可能执行index skip scan

条件：

1. 必须是组合索引

2. 引导列不在where条件中

by index Rowid 列名 --Rowid 扫描是最快的访问数据方式

用主键查询或者回表查询时会出现

下列是我遇到的问题：

原SQL:

select accountid, validRecord from bi_TINbatchimportrecord 
where batchid = 'batchId1'
group by accountid, validrecord ;

原索引：

INDEX1 (BATCHID, ACCOUNTID, IMPORTTYPE, BUSINESSKEY)

INDEX2 (ACCOUNTID, BATCHID, VALIDRECORD, VALIDBATCHID)

问题 : 以为会用INDEX1，但用的是INDEX2

=================== 目前 INDEX2 ===================

用到INDEX2作为索引，以INDEX FAST FULL SCAN/INDEX SKIP SCAN的方式(where没有引导列，且索引是覆盖索引，根据索引具体COST来决定用哪种方式)

-- INDEX FAST FULL SCAN:
INDEX2索引树全树无序扫描，采取多块读的方式

-- INDEX SKIP SCAN：

select accountid, validRecord from bi_TINbatchimportrecord
where batchid = 'batchid'
----- Oracle优化 ----->
select accountid, validRecord from bi_TINbatchimportrecord
where accountid = 'acctid1' and batchid = 'batchid'
union
select accountid, validRecord from bi_TINbatchimportrecord
where accountid = 'acctid2' and batchid = 'batchid'
union
......

所以，accountid越集中，union次数越少，效率越高

=================== 强制 INDEX1 ===================

** 根据我当时浅薄的认知，复合索引应该依照最左原则，哪个复合索引的引导项是batchid，就应该用哪个

若强制使用INDEX1，用到BATCHID作为索引，先以RANGE SCAN的方式查到（ID, BATCHID, ACCOUNTID, IMPORTTYPE, BUSINESSKEY）,找不到需要的validRecord，
再进行回表查询，效率取决于回表查的数据量

所以，索引不是覆盖索引的前提下，通过查出来 BATCHID='xxx' 的记录数越多，需要回表查询的记录越多，数据库是按大小分成数据片的，每次IO取一片，意味着回表记录越多，IO消耗越大

解决方案：

新增索引：

INDEX3 ( BATCHID, ACCOUNTID, VALIDRECORD)

=================== DB引擎自动选择 INDEX3 作为索引 ===================

因为：

1. 其是覆盖索引，复合索引的列涵盖了所有搜索列和条件列

2. 符合复合索引的最左原则

所以：

以INDEX RANGE SCAN执行

=================== 两组实验数据 ===================

----- 第一组 -----
BATCHID1 = 'BatchId1' -> 326

INDEX1 COST = 10(索引查询IO) + 305(回表IO) + 1(无序Group by的CPU占用) = 316
INDEX2 COST = 4319(无引导列且覆盖索引查询IO) + 1(无序Group by的CPU占用) = 4320
INDEX3 COST = 8(有引导列且覆盖索引查询IO) + 0(有序Group by的CPU占用) = 8
no index COST = 67259(全表扫描IO) + 1(无序Group by的CPU占用) = 67260

----- 第二组 -----
BATCHID2 = 'BatchId2' -> 231566

INDEX1 COST = 3510(索引查询IO) + 213667(回表IO) + 1418(无序Group by的CPU占用) = 218595
INDEX2 COST = 4319(无引导列且覆盖索引查询IO) + 1342(无序Group by的CPU占用) = 5661
INDEX3 COST = 2870(有引导列且覆盖索引查询IO) + 0(有序Group by的CPU占用) = 2870
no index COST = 67260(全表扫描IO) + 1341(无序Group by的CPU占用) = 68610

=================== COST ===================
INDEX1 cost：索引查询IO + 回表IO + 条件查询CPU消耗

INDEX2 cost: 无引导列且覆盖索引查询IO + 条件查询CPU消耗

INDEX3 cost: 有引导列且覆盖索引查询IO + 条件查询CPU消耗

no index cost：全表扫描IO + 条件查询CPU消耗

posted @ 2021-01-03 21:25 苏天后阅读(2516) 评论(0) 收藏举报

刷新页面返回顶部

苏天后

一文讲透如何看懂Oracle索引执行类型（index unique scan,index range scan,index full scan,index fast full scan,index skip scan）

公告