索引合并和组合索引的比较 (转)
在教务系统补考子系统的开发过程中,安排考场的算法运算时间非常慢,需要32秒才能完成考场的分配。查找原因,由于需要在学生补考科目表里面进行查找数据——该表的数据目前已达200万条,所以算法的大部分时间都花在查找数据方面。为了解决以上问题,我们决定对数据表进行分析,创建合适的索引。
在创建索引过程中,我们发现查询语句已经为查询列创建了索引,但是是为每个列单独创建的——SELECT * FROM TABLE_NAME WHERE COL1=’ABC’ AND COL2=123;
为了重点说明原理,我简化了示例。在以上示例中,查询语句的查询条件有2个列,分别是COL1和COL2。我们为COL1(INDEX1)和COL2(INDEX2)都分别创建了一个索引。创建好索引后,我们进行了测试,发现速度没有非常明显的加速,还是需要20多秒。优化效果不明显。
然后我们尝试了在COL1和COL2上创建组合索引,效果非常明显,从32秒到目前的8秒。针对这种情况,我深入研究了一下,在2个列上单独创建索引,如果查询语句使用到,叫合并索引;如果是在2个列上创建组合索引,就叫组合索引。下面通过原理来解释一下合并索引和组合索引的区别,也讲解一下为什么组合索引会比合并索引要快许多。
首先解释一下合并索引的搜索步骤,如下图所示:
上面步骤可以用下图进行说明:
如下图所示,单独的2个索引进行查找——索引合并,需要反复在2个索引表间进行跳转,这是造成速度慢的第一个影响。第2个影响是,假设满足COL1=’ABC’的数据有5行,满足COL2=123的数据有1000行。最坏的情况下(那5行在COL2的1000行最后面)需要扫描完COL2的1000行才能找到需要的数据,并不能达到快速查找的目的。
下面我们来讲解一下组合索引,由于组合索引综合保存了COL1和COL2的数据,它不需要在2个索引表之间跳转,所以速度会更快,组合索引的搜索步骤如下图所示:
上图是索引合并和组合索引的对比图。组合索引不需要像索引合并那样对索引的ROWID进行比较合并。
以上就是对索引合并于组合索引区别的说明,另外补充一点,在什么情况下使用组合索引比较好——在查询条件中对索引列使用了等值比较时,组合索引才能发挥最大的效能。
【推荐】国内首个AI IDE,深度理解中文开发场景,立即下载体验Trae
【推荐】编程新体验,更懂你的AI,立即体验豆包MarsCode编程助手
【推荐】抖音旗下AI助手豆包,你的智能百科全书,全免费不限次数
【推荐】轻量又高性能的 SSH 工具 IShell:AI 加持,快人一步
· AI与.NET技术实操系列:向量存储与相似性搜索在 .NET 中的实现
· 基于Microsoft.Extensions.AI核心库实现RAG应用
· Linux系列:如何用heaptrack跟踪.NET程序的非托管内存泄露
· 开发者必知的日志记录最佳实践
· SQL Server 2025 AI相关能力初探
· winform 绘制太阳,地球,月球 运作规律
· 震惊!C++程序真的从main开始吗?99%的程序员都答错了
· AI与.NET技术实操系列(五):向量存储与相似性搜索在 .NET 中的实现
· 超详细:普通电脑也行Windows部署deepseek R1训练数据并当服务器共享给他人
· 【硬核科普】Trae如何「偷看」你的代码?零基础破解AI编程运行原理