《hello-algo》分治 —— 小记随笔
分治算法
「分治 divide and conquer」,全称分而治之,是一种非常重要且常见的算法策略。分治通常基于递归实现,包括“分”和“治”两个步骤。
- 分(划分阶段):递归地将原问题分解为两个或多个子问题,直至到达最小子问题时终止。
- 治(合并阶段):从已知解的最小子问题开始,从底至顶地将子问题的解进行合并,从而构建出原问题的解。
“归并排序”是分治策略的典型应用之一。
- 分:递归地将原数组(原问题)划分为两个子数组(子问题),直到子数组只剩一个元素(最小子问题)。
- 治:从底至顶地将有序的子数组(子问题的解)进行合并,从而得到有序的原数组(原问题的解)
如何判断分治问题
一个问题是否适合使用分治解决,通常可以参考以下几个判断依据。
- 问题可以分解:原问题可以分解成规模更小、类似的子问题,以及能够以相同方式递归地进行划分。
- 子问题是独立的:子问题之间没有重叠,互不依赖,可以独立解决。
- 子问题的解可以合并:原问题的解通过合并子问题的解得来。
通过分治提升效率
分治不仅可以有效地解决算法问题,往往还可以提升算法效率。在排序算法中,快速排序、归并排序、堆排序相较于选择、冒泡、插入排序更快,就是因为它们应用了分治策略。
操作数量优化
以“冒泡排序”为例,其处理一个长度为 (n) 的数组需要 (O(n^2)) 时间。假设我们按照图 12-2 所示的方式,将数组从中点处分为两个子数组,则划分需要 (O(n)) 时间,排序每个子数组需要 (O((n / 2)^2)) 时间,合并两个子数组需要 (O(n)) 时间,总体时间复杂度为:
[ O(n + (\frac{n}{2})^2 \times 2 + n) = O(\frac{n^2}{2} + 2n) ]
接下来,我们计算以下不等式,其左边和右边分别为划分前和划分后的操作总数:
[ \begin{aligned} n^2 & > \frac{n^2}{2} + 2n \newline n^2 - \frac{n^2}{2} - 2n & > 0 \newline n(n - 4) & > 0 \end{aligned} ]
这意味着当 (n > 4) 时,划分后的操作数量更少,排序效率应该更高。请注意,划分后的时间复杂度仍然是平方阶 (O(n^2)) ,只是复杂度中的常数项变小了。
进一步想,如果我们把子数组不断地再从中点处划分为两个子数组,直至子数组只剩一个元素时停止划分呢?这种思路实际上就是“归并排序”,时间复杂度为 (O(n \log n)) 。
再思考,如果我们多设置几个划分点,将原数组平均划分为 (k) 个子数组呢?这种情况与“桶排序”非常类似,它非常适合排序海量数据,理论上时间复杂度可以达到 (O(n + k)) 。
并行计算优化
我们知道,分治生成的子问题是相互独立的,因此通常可以并行解决。也就是说,分治不仅可以降低算法的时间复杂度,还有利于操作系统的并行优化。
并行优化在多核或多处理器的环境中尤其有效,因为系统可以同时处理多个子问题,更加充分地利用计算资源,从而显著减少总体的运行时间。
比如在图 12-3 所示的“桶排序”中,我们将海量的数据平均分配到各个桶中,则可所有桶的排序任务分散到各个计算单元,完成后再合并结果。
分治常见应用
一方面,分治可以用来解决许多经典算法问题。
- 寻找最近点对:该算法首先将点集分成两部分,然后分别找出两部分中的最近点对,最后找出跨越两部分的最近点对。
- 大整数乘法:例如 Karatsuba 算法,它将大整数乘法分解为几个较小的整数的乘法和加法。
- 矩阵乘法:例如 Strassen 算法,它将大矩阵乘法分解为多个小矩阵的乘法和加法。
- 汉诺塔问题:汉诺塔问题可以通过递归解决,这是典型的分治策略应用。
- 求解逆序对:在一个序列中,如果前面的数字大于后面的数字,那么这两个数字构成一个逆序对。求解*逆序对问题可以利用分治的思想,借助归并排序进行求解。
另一方面,分治在算法和数据结构的设计中应用得非常广泛。
- 二分查找:二分查找是将有序数组从中点索引处分为两部分,然后根据目标值与中间元素值比较结果,决定排除哪一半区间,并在剩余区间执行相同的二分操作。
- 归并排序:本节开头已介绍,不再赘述。
- 快速排序:快速排序是选取一个基准值,然后把数组分为两个子数组,一个子数组的元素比基准值小,另一子数组的元素比基准值大,再对这两部分进行相同的划分操作,直至子数组只剩下一个元素。
- 桶排序:桶排序的基本思想是将数据分散到多个桶,然后对每个桶内的元素进行排序,最后将各个桶的元素依次取出,从而得到一个有序数组。
- 树:例如二叉搜索树、AVL 树、红黑树、B 树、B+ 树等,它们的查找、插入和删除等操作都可以视为分治策略的应用。
- 堆:堆是一种特殊的完全二叉树,其各种操作,如插入、删除和堆化,实际上都隐含了分治的思想。
- 哈希表:虽然哈希表并不直接应用分治,但某些哈希冲突解决方案间接应用了分治策略,例如,链式地址中的长链表会被转化为红黑树,以提升查询效率。
可以看出,分治是一种“润物细无声”的算法思想,隐含在各种算法与数据结构之中。
分治搜索策略
我们已经学过,搜索算法分为两大类。
- 暴力搜索:它通过遍历数据结构实现,时间复杂度为 (O(n)) 。
- 自适应搜索:它利用特有的数据组织形式或先验信息,时间复杂度可达到 (O(\log n)) 甚至 (O(1)) 。
实际上,时间复杂度为 (O(\log n)) 的搜索算法通常是基于分治策略实现的,例如二分查找和树。
- 二分查找的每一步都将问题(在数组中搜索目标元素)分解为一个小问题(在数组的一半中搜索目标元素),这个过程一直持续到数组为空或找到目标元素为止。
- 树是分治思想的代表,在二叉搜索树、AVL 树、堆等数据结构中,各种操作的时间复杂度皆为 (O(\log n)) 。
二分查找的分治策略如下所示。
- 问题可以分解:二分查找递归地将原问题(在数组中进行查找)分解为子问题(在数组的一半中进行查找),这是通过比较中间元素和目标元素来实现的。
- 子问题是独立的:在二分查找中,每轮只处理一个子问题,它不受其他子问题的影响。
- 子问题的解无须合并:二分查找旨在查找一个特定元素,因此不需要将子问题的解进行合并。当子问题得到解决时,原问题也会同时得到解决。
基于分治实现二分查找
在之前的章节中,二分查找是基于递推(迭代)实现的。现在我们基于分治(递归)来实现它。
给定一个长度为 (n) 的有序数组 nums ,其中所有元素都是唯一的,请查找元素 target 。
从分治角度,我们将搜索区间 ([i, j]) 对应的子问题记为 (f(i, j)) 。
以原问题 (f(0, n-1)) 为起始点,通过以下步骤进行二分查找。
- 计算搜索区间 ([i, j]) 的中点 (m) ,根据它排除一半搜索区间。
- 递归求解规模减小一半的子问题,可能为 (f(i, m-1)) 或 (f(m+1, j)) 。
- 循环第 1. 步和第 2. 步,直至找到 target 或区间为空时返回。
/* 二分查找:问题 f(i, j) */ func dfs(nums []int, target, i, j int) int { // 如果区间为空,代表没有目标元素,则返回 -1 if i > j { return -1 } // 计算索引中点 m := i + ((j - i) >> 1) //判断中点与目标元素大小 if nums[m] < target { // 小于则递归右半数组 // 递归子问题 f(m+1, j) return dfs(nums, target, m+1, j) } else if nums[m] > target { // 小于则递归左半数组 // 递归子问题 f(i, m-1) return dfs(nums, target, i, m-1) } else { // 找到目标元素,返回其索引 return m } } /* 二分查找 */ func binarySearch(nums []int, target int) int { n := len(nums) return dfs(nums, target, 0, n-1) }
构建二叉树问题
给定一棵二叉树的前序遍历 preorder 和中序遍历 inorder ,请从中构建二叉树,返回二叉树的根节点。假设二叉树中没有值重复的节点(如图 12-5 所示)。
判断是否为分治问题
原问题定义为从 preorder 和 inorder 构建二叉树,是一个典型的分治问题。
- 问题可以分解:从分治的角度切入,我们可以将原问题划分为两个子问题:构建左子树、构建右子树,加上一步操作:初始化根节点。而对于每棵子树(子问题),我们仍然可以复用以上划分方法,将其划分为更小的子树(子问题),直至达到最小子问题(空子树)时终止。
- 子问题是独立的:左子树和右子树是相互独立的,它们之间没有交集。在构建左子树时,我们只需关注中序遍历和前序遍历中与左子树对应的部分。右子树同理。
- 子问题的解可以合并:一旦得到了左子树和右子树(子问题的解),我们就可以将它们链接到根节点上,得到原问题的解。
如何划分子树
根据定义,preorder 和 inorder 都可以划分为三个部分。
前序遍历:[ 根节点 | 左子树 | 右子树 ] ,例如图 12-5 的树对应 [ 3 | 9 | 2 1 7 ] 。
中序遍历:[ 左子树 | 根节点 | 右子树 ] ,例如图 12-5 的树对应 [ 9 | 3 | 1 2 7 ] 。
以上图数据为例,我们可以通过图 12-6 所示的步骤得到划分结果。
- 前序遍历的首元素 3 是根节点的值。
- 查找根节点 3 在 inorder 中的索引,利用该索引可将 inorder 划分为 [ 9 | 3 | 1 2 7 ] 。
- 根据 inorder 的划分结果,易得左子树和右子树的节点数量分别为 1 和 3 ,从而可将 preorder 划分为 [ 3 | 9 | 2 1 7 ] 。
基于变量描述子树区间
根据以上划分方法,我们已经得到根节点、左子树、右子树在 preorder 和 inorder 中的索引区间。而为了描述这些索引区间,我们需要借助几个指针变量。
- 将当前树的根节点在 preorder 中的索引记为 (i) 。
- 将当前树的根节点在 inorder 中的索引记为 (m) 。
- 将当前树在 inorder 中的索引区间记为 ([l, r]) 。
请注意,右子树根节点索引中的 ((m-l)) 的含义是“左子树的节点数量”,建议结合图 12-7 理解。
代码实现
为了提升查询 (m) 的效率,我们借助一个哈希表 hmap 来存储数组 inorder 中元素到索引的映射:
/* 构建二叉树:分治 */ func dfsBuildTree(preorder []int, inorderMap map[int]int, i, l, r int) *TreeNode { // 子树区间为空时终止 if r-l < 0 { return nil } // 初始化根节点 root := NewTreeNode(preorder[i]) // 查询 m ,从而划分左右子树 m := inorderMap[preorder[i]] // 子问题:构建左子树 root.Left = dfsBuildTree(preorder, inorderMap, i+1, l, m-1) // 子问题:构建右子树 root.Right = dfsBuildTree(preorder, inorderMap, i+1+m-l, m+1, r) // 返回根节点 return root } /* 构建二叉树 */ func buildTree(preorder, inorder []int) *TreeNode { // 初始化哈希表,存储 inorder 元素到索引的映射 inorderMap := make(map[int]int, len(inorder)) for i := 0; i < len(inorder); i++ { inorderMap[inorder[i]] = i } root := dfsBuildTree(preorder, inorderMap, 0, 0, len(inorder)-1) return root }
汉诺塔问题
在归并排序和构建二叉树中,我们都是将原问题分解为两个规模为原问题一半的子问题。然而对于汉诺塔问题,我们采用不同的分解策略。
给定三根柱子,记为 A、B 和 C 。起始状态下,柱子 A 上套着 (n) 个圆盘,它们从上到下按照从小到大的顺序排列。我们的任务是要把这 (n) 个圆盘移到柱子 C 上,并保持它们的原有顺序不变(如图 12-10 所示)。在移动圆盘的过程中,需要遵守以下规则。
- 圆盘只能从一根柱子顶部拿出,从另一根柱子顶部放入。
- 每次只能移动一个圆盘。
- 小圆盘必须时刻位于大圆盘之上。
我们将规模为 (i) 的汉诺塔问题记作 (f(i)) 。例如 (f(3)) 代表将 (3) 个圆盘从 A 移动至 C 的汉诺塔问题。
考虑基本情况
对于问题 (f(1)) ,即当只有一个圆盘时,我们将它直接从 A 移动至 C 即可。
对于问题 (f(2)) ,即当有两个圆盘时,由于要时刻满足小圆盘在大圆盘之上,因此需要借助 B 来完成移动。
- 先将上面的小圆盘从 A 移至 B 。
- 再将大圆盘从 A 移至 C 。
- 最后将小圆盘从 B 移至 C 。
解决问题 (f(2)) 的过程可总结为:将两个圆盘借助 B 从 A 移至 C 。其中,C 称为目标柱、B 称为缓冲柱。
子问题分解
对于问题 (f(3)) ,即当有三个圆盘时,情况变得稍微复杂了一些。
因为已知 (f(1)) 和 (f(2)) 的解,所以我们可从分治角度思考,将 A 顶部的两个圆盘看作一个整体,执行图 12-13 所示的步骤。这样三个圆盘就被顺利地从 A 移至 C 了。
- 令 B 为目标柱、C 为缓冲柱,将两个圆盘从 A 移至 B 。
- 将 A 中剩余的一个圆盘从 A 直接移动至 C 。
- 令 C 为目标柱、A 为缓冲柱,将两个圆盘从 B 移至 C 。
从本质上看,我们将问题 (f(3)) 划分为两个子问题 (f(2)) 和一个子问题 (f(1)) 。按顺序解决这三个子问题之后,原问题随之得到解决。这说明子问题是独立的,而且解可以合并。
至此,我们可总结出图 12-14 所示的解决汉诺塔问题的分治策略:将原问题 (f(n)) 划分为两个子问题 (f(n-1)) 和一个子问题 (f(1)) ,并按照以下顺序解决这三个子问题。
- 将 (n-1) 个圆盘借助 C 从 A 移至 B 。
- 将剩余 (1) 个圆盘从 A 直接移至 C 。
- 将 (n-1) 个圆盘借助 A 从 B 移至 C 。
对于这两个子问题 (f(n-1)) ,可以通过相同的方式进行递归划分,直至达到最小子问题 (f(1)) 。而 (f(1)) 的解是已知的,只需一次移动操作即可。
代码实现
在代码中,我们声明一个递归函数 dfs(i, src, buf, tar) ,它的作用是将柱 src 顶部的 (i) 个圆盘借助缓冲柱 buf 移动至目标柱 tar :
/* 移动一个圆盘 */ func move(src, tar *list.List) { // 从 src 顶部拿出一个圆盘 pan := src.Back() // 将圆盘放入 tar 顶部 tar.PushBack(pan.Value) // 移除 src 顶部圆盘 src.Remove(pan) } /* 求解汉诺塔问题 f(i) */ func dfsHanota(i int, src, buf, tar *list.List) { // 若 src 只剩下一个圆盘,则直接将其移到 tar if i == 1 { move(src, tar) return } // 子问题 f(i-1) :将 src 顶部 i-1 个圆盘借助 tar 移到 buf dfsHanota(i-1, src, tar, buf) // 子问题 f(1) :将 src 剩余一个圆盘移到 tar move(src, tar) // 子问题 f(i-1) :将 buf 顶部 i-1 个圆盘借助 src 移到 tar dfsHanota(i-1, buf, src, tar) } /* 求解汉诺塔问题 */ func solveHanota(A, B, C *list.List) { n := A.Len() // 将 A 顶部 n 个圆盘借助 B 移到 C dfsHanota(n, A, B, C) }
汉诺塔问题形成一棵高度为 (n) 的递归树,每个节点代表一个子问题,对应一个开启的 dfs() 函数,因此时间复杂度为 (O(2^n)) ,空间复杂度为 (O(n)) 。
本文作者:Blue Mountain
本文链接:https://www.cnblogs.com/BlueMountain-HaggenDazs/p/18040571
版权声明:本作品采用知识共享署名-非商业性使用-禁止演绎 2.5 中国大陆许可协议进行许可。
【推荐】国内首个AI IDE,深度理解中文开发场景,立即下载体验Trae
【推荐】编程新体验,更懂你的AI,立即体验豆包MarsCode编程助手
【推荐】抖音旗下AI助手豆包,你的智能百科全书,全免费不限次数
【推荐】轻量又高性能的 SSH 工具 IShell:AI 加持,快人一步
· 阿里最新开源QwQ-32B,效果媲美deepseek-r1满血版,部署成本又又又降低了!
· 开源Multi-agent AI智能体框架aevatar.ai,欢迎大家贡献代码
· Manus重磅发布:全球首款通用AI代理技术深度解析与实战指南
· 被坑几百块钱后,我竟然真的恢复了删除的微信聊天记录!
· AI技术革命,工作效率10个最佳AI工具