MySQL--CREATE INDEX在各版本的优化

在MySQL 5.5版本中引入FIC(Fast index creation)特性,提升索引的创建速度。

复制代码
FCI 操作流程:
(1)对表加共享S锁,允许其他会话读操作,但禁止写操作,
(2)扫描Cluster index的数据来构建新索引
(3)新索引创建完成,解除S锁,允许读写。

FCI 优点:
(1)创建索引不需要拷贝整表数据,创建速度快,
(2)创建索引过程中,可以快速中止。

FCI限制:
(1)FCI特新仅限于复制索引,不试用于聚集索引,
(2)索引创建期间,表只允许读不允许写。
复制代码

 

在MySQL 5.6.7版本中引入Online DDL特性,允许联机创建索引。

Online create index流程
(1)扫描Cluster Index的数据来构建新索引
(2)使用RowLog来记录构建新索引中的数据变化
(3)锁定表禁止写,重放Rowlog到新索引上
(4)索引创建完成,新索引数据和Cluster Index数据保持一致,释放表锁。

Online DDL优点:
(1)在整个创建索引周期内,大部分时间原表可读写。

在MySQL 5.7.5版本中引入Bulk load for create index特性,进一步提升索引创建的速度,并提升索引“质量”。

复制代码
操作流程:
(1)扫描Cluster Index数据,将数据放入sort buffer中排序,soft buffer写满后将数据写入临时文件
(2)对临时文件中的有序记录进行归并排序
(3)将排序后的数据写入到索引结构中,自下而上生产索引树。

非bulk load方式的缺点:
(1)排序效率,需要对每行数据在新索引中进行查找定位,确定该行数据的索引位置,定位需要从索引的根节点开始查找到索引的叶子节点。
(2)redo log,需要使用redo log来记录每行数据插入索引所产生的数据变化。
(3)undo log,需要使用undo log来记录每行数据的位置
(4)索引碎片和页拆分,随着数据行的不断插入,很容易导致索引页的拆分和索引树的自平衡,无法保证索引页的填充度。

bulk load方式的优点:
(1)排序效率,数据在sort buffer和临时文件中牌序合并,然后直接生成索引的叶子节点页,无需单独定位每行数据的位置。
(2)redo log,使用checkpoint来持久化生成的索引页,不会产生redo log。
(3)undo log,仅需要使用undo log来记录索引页的分配情况,产生的undo log较少。
(4)可以按照innodb_fill_factor参数来生成索引页,且不会导致页拆分,索引树需要平衡的次数较少。

bulk load方式的缺点:
(1)bulk load使用临时文件来存放sort buffer的结果,需要关注磁盘空间的使用率
(2)bulk load不产生redo log,数据库从write-ahead logging方式退化成direct persist data,导致依赖redo log实现的工具失效,如xtrabackup。
(3)bulk load需要不断地唤醒page cleaner线程来对新索引页进行checkpoint操作。
(4)仅支持普通索引和全文索引,不支持空间索引。
复制代码

 参考资料:
https://dev.mysql.com/doc/refman/5.7/en/sorted-index-builds.html
https://dev.mysql.com/worklog/task/?id=7277
https://yq.aliyun.com/articles/50758

##========================================================================##

posted on   笑东风  阅读(352)  评论(1编辑  收藏  举报

编辑推荐:
· AI与.NET技术实操系列:基于图像分类模型对图像进行分类
· go语言实现终端里的倒计时
· 如何编写易于单元测试的代码
· 10年+ .NET Coder 心语,封装的思维:从隐藏、稳定开始理解其本质意义
· .NET Core 中如何实现缓存的预热?
阅读排行:
· 分享一个免费、快速、无限量使用的满血 DeepSeek R1 模型,支持深度思考和联网搜索!
· 基于 Docker 搭建 FRP 内网穿透开源项目(很简单哒)
· 25岁的心里话
· ollama系列01:轻松3步本地部署deepseek,普通电脑可用
· 按钮权限的设计及实现

导航

点击右上角即可分享
微信分享提示