园龄：10年7个月粉丝：572 关注：0

🔖hello-algo

2024-02-28 15:51阅读: 25评论: 0推荐: 0

《hello-algo》分治 —— 小记随笔

分治算法

「分治 divide and conquer」，全称分而治之，是一种非常重要且常见的算法策略。分治通常基于递归实现，包括“分”和“治”两个步骤。

分（划分阶段）：递归地将原问题分解为两个或多个子问题，直至到达最小子问题时终止。
治（合并阶段）：从已知解的最小子问题开始，从底至顶地将子问题的解进行合并，从而构建出原问题的解。

“归并排序”是分治策略的典型应用之一。

分：递归地将原数组（原问题）划分为两个子数组（子问题），直到子数组只剩一个元素（最小子问题）。
治：从底至顶地将有序的子数组（子问题的解）进行合并，从而得到有序的原数组（原问题的解）

如何判断分治问题

一个问题是否适合使用分治解决，通常可以参考以下几个判断依据。

问题可以分解：原问题可以分解成规模更小、类似的子问题，以及能够以相同方式递归地进行划分。
子问题是独立的：子问题之间没有重叠，互不依赖，可以独立解决。
子问题的解可以合并：原问题的解通过合并子问题的解得来。

通过分治提升效率

分治不仅可以有效地解决算法问题，往往还可以提升算法效率。在排序算法中，快速排序、归并排序、堆排序相较于选择、冒泡、插入排序更快，就是因为它们应用了分治策略。

操作数量优化

以“冒泡排序”为例，其处理一个长度为 (n) 的数组需要 (O(n^2)) 时间。假设我们按照图 12-2 所示的方式，将数组从中点处分为两个子数组，则划分需要 (O(n)) 时间，排序每个子数组需要 (O((n / 2)^2)) 时间，合并两个子数组需要 (O(n)) 时间，总体时间复杂度为：
[ O(n + (\frac{n}{2})^2 \times 2 + n) = O(\frac{n^2}{2} + 2n) ]

接下来，我们计算以下不等式，其左边和右边分别为划分前和划分后的操作总数：

[ \begin{aligned} n^2 & > \frac{n^2}{2} + 2n \newline n^2 - \frac{n^2}{2} - 2n & > 0 \newline n(n - 4) & > 0 \end{aligned} ]

这意味着当 (n > 4) 时，划分后的操作数量更少，排序效率应该更高。请注意，划分后的时间复杂度仍然是平方阶 (O(n^2)) ，只是复杂度中的常数项变小了。

进一步想，如果我们把子数组不断地再从中点处划分为两个子数组，直至子数组只剩一个元素时停止划分呢？这种思路实际上就是“归并排序”，时间复杂度为 (O(n \log n)) 。

再思考，如果我们多设置几个划分点，将原数组平均划分为 (k) 个子数组呢？这种情况与“桶排序”非常类似，它非常适合排序海量数据，理论上时间复杂度可以达到 (O(n + k)) 。

并行计算优化

我们知道，分治生成的子问题是相互独立的，因此通常可以并行解决。也就是说，分治不仅可以降低算法的时间复杂度，还有利于操作系统的并行优化。

并行优化在多核或多处理器的环境中尤其有效，因为系统可以同时处理多个子问题，更加充分地利用计算资源，从而显著减少总体的运行时间。
比如在图 12-3 所示的“桶排序”中，我们将海量的数据平均分配到各个桶中，则可所有桶的排序任务分散到各个计算单元，完成后再合并结果。

分治常见应用

一方面，分治可以用来解决许多经典算法问题。

寻找最近点对：该算法首先将点集分成两部分，然后分别找出两部分中的最近点对，最后找出跨越两部分的最近点对。
大整数乘法：例如 Karatsuba 算法，它将大整数乘法分解为几个较小的整数的乘法和加法。
矩阵乘法：例如 Strassen 算法，它将大矩阵乘法分解为多个小矩阵的乘法和加法。
汉诺塔问题：汉诺塔问题可以通过递归解决，这是典型的分治策略应用。
求解逆序对：在一个序列中，如果前面的数字大于后面的数字，那么这两个数字构成一个逆序对。求解*逆序对问题可以利用分治的思想，借助归并排序进行求解。

另一方面，分治在算法和数据结构的设计中应用得非常广泛。

二分查找：二分查找是将有序数组从中点索引处分为两部分，然后根据目标值与中间元素值比较结果，决定排除哪一半区间，并在剩余区间执行相同的二分操作。
归并排序：本节开头已介绍，不再赘述。
快速排序：快速排序是选取一个基准值，然后把数组分为两个子数组，一个子数组的元素比基准值小，另一子数组的元素比基准值大，再对这两部分进行相同的划分操作，直至子数组只剩下一个元素。
桶排序：桶排序的基本思想是将数据分散到多个桶，然后对每个桶内的元素进行排序，最后将各个桶的元素依次取出，从而得到一个有序数组。
树：例如二叉搜索树、AVL 树、红黑树、B 树、B+ 树等，它们的查找、插入和删除等操作都可以视为分治策略的应用。
堆：堆是一种特殊的完全二叉树，其各种操作，如插入、删除和堆化，实际上都隐含了分治的思想。
哈希表：虽然哈希表并不直接应用分治，但某些哈希冲突解决方案间接应用了分治策略，例如，链式地址中的长链表会被转化为红黑树，以提升查询效率。

可以看出，分治是一种“润物细无声”的算法思想，隐含在各种算法与数据结构之中。

分治搜索策略

我们已经学过，搜索算法分为两大类。

暴力搜索：它通过遍历数据结构实现，时间复杂度为 (O(n)) 。
自适应搜索：它利用特有的数据组织形式或先验信息，时间复杂度可达到 (O(\log n)) 甚至 (O(1)) 。

实际上，时间复杂度为 (O(\log n)) 的搜索算法通常是基于分治策略实现的，例如二分查找和树。

二分查找的每一步都将问题（在数组中搜索目标元素）分解为一个小问题（在数组的一半中搜索目标元素），这个过程一直持续到数组为空或找到目标元素为止。
树是分治思想的代表，在二叉搜索树、AVL 树、堆等数据结构中，各种操作的时间复杂度皆为 (O(\log n)) 。

二分查找的分治策略如下所示。

问题可以分解：二分查找递归地将原问题（在数组中进行查找）分解为子问题（在数组的一半中进行查找），这是通过比较中间元素和目标元素来实现的。
子问题是独立的：在二分查找中，每轮只处理一个子问题，它不受其他子问题的影响。
子问题的解无须合并：二分查找旨在查找一个特定元素，因此不需要将子问题的解进行合并。当子问题得到解决时，原问题也会同时得到解决。

基于分治实现二分查找

在之前的章节中，二分查找是基于递推（迭代）实现的。现在我们基于分治（递归）来实现它。

给定一个长度为 (n) 的有序数组 nums ，其中所有元素都是唯一的，请查找元素 target 。

从分治角度，我们将搜索区间 ([i, j]) 对应的子问题记为 (f(i, j)) 。
以原问题 (f(0, n-1)) 为起始点，通过以下步骤进行二分查找。

计算搜索区间 ([i, j]) 的中点 (m) ，根据它排除一半搜索区间。
递归求解规模减小一半的子问题，可能为 (f(i, m-1)) 或 (f(m+1, j)) 。
循环第 1. 步和第 2. 步，直至找到 target 或区间为空时返回。

 /* 二分查找：问题 f(i, j) */
func dfs(nums []int, target, i, j int) int {
    // 如果区间为空，代表没有目标元素，则返回 -1
    if i > j {
        return -1
    }
    //    计算索引中点
    m := i + ((j - i) >> 1)
    //判断中点与目标元素大小
    if nums[m] < target {
        // 小于则递归右半数组
        // 递归子问题 f(m+1, j)
        return dfs(nums, target, m+1, j)
    } else if nums[m] > target {
        // 小于则递归左半数组
        // 递归子问题 f(i, m-1)
        return dfs(nums, target, i, m-1)
    } else {
        // 找到目标元素，返回其索引
        return m
    }
}
 
/* 二分查找 */
func binarySearch(nums []int, target int) int {
    n := len(nums)
    return dfs(nums, target, 0, n-1)
}

构建二叉树问题

给定一棵二叉树的前序遍历 preorder 和中序遍历 inorder ，请从中构建二叉树，返回二叉树的根节点。假设二叉树中没有值重复的节点（如图 12-5 所示）。

判断是否为分治问题

原问题定义为从 preorder 和 inorder 构建二叉树，是一个典型的分治问题。

问题可以分解：从分治的角度切入，我们可以将原问题划分为两个子问题：构建左子树、构建右子树，加上一步操作：初始化根节点。而对于每棵子树（子问题），我们仍然可以复用以上划分方法，将其划分为更小的子树（子问题），直至达到最小子问题（空子树）时终止。
子问题是独立的：左子树和右子树是相互独立的，它们之间没有交集。在构建左子树时，我们只需关注中序遍历和前序遍历中与左子树对应的部分。右子树同理。
子问题的解可以合并：一旦得到了左子树和右子树（子问题的解），我们就可以将它们链接到根节点上，得到原问题的解。

如何划分子树

根据定义，preorder 和 inorder 都可以划分为三个部分。

前序遍历：[ 根节点 | 左子树 | 右子树 ] ，例如图 12-5 的树对应 [ 3 | 9 | 2 1 7 ] 。
中序遍历：[ 左子树 | 根节点｜右子树 ] ，例如图 12-5 的树对应 [ 9 | 3 | 1 2 7 ] 。

以上图数据为例，我们可以通过图 12-6 所示的步骤得到划分结果。

前序遍历的首元素 3 是根节点的值。
查找根节点 3 在 inorder 中的索引，利用该索引可将 inorder 划分为 [ 9 | 3 ｜ 1 2 7 ] 。
根据 inorder 的划分结果，易得左子树和右子树的节点数量分别为 1 和 3 ，从而可将 preorder 划分为 [ 3 | 9 | 2 1 7 ] 。

基于变量描述子树区间

根据以上划分方法，我们已经得到根节点、左子树、右子树在 preorder 和 inorder 中的索引区间。而为了描述这些索引区间，我们需要借助几个指针变量。

将当前树的根节点在 preorder 中的索引记为 (i) 。
将当前树的根节点在 inorder 中的索引记为 (m) 。
将当前树在 inorder 中的索引区间记为 ([l, r]) 。

请注意，右子树根节点索引中的 ((m-l)) 的含义是“左子树的节点数量”，建议结合图 12-7 理解。

代码实现

为了提升查询 (m) 的效率，我们借助一个哈希表 hmap 来存储数组 inorder 中元素到索引的映射：

 /* 构建二叉树：分治 */
func dfsBuildTree(preorder []int, inorderMap map[int]int, i, l, r int) *TreeNode {
    // 子树区间为空时终止
    if r-l < 0 {
        return nil
    }
    // 初始化根节点
    root := NewTreeNode(preorder[i])
    // 查询 m ，从而划分左右子树
    m := inorderMap[preorder[i]]
    // 子问题：构建左子树
    root.Left = dfsBuildTree(preorder, inorderMap, i+1, l, m-1)
    // 子问题：构建右子树
    root.Right = dfsBuildTree(preorder, inorderMap, i+1+m-l, m+1, r)
    // 返回根节点
    return root
}
 
/* 构建二叉树 */
func buildTree(preorder, inorder []int) *TreeNode {
    // 初始化哈希表，存储 inorder 元素到索引的映射
    inorderMap := make(map[int]int, len(inorder))
    for i := 0; i < len(inorder); i++ {
        inorderMap[inorder[i]] = i
    }
 
    root := dfsBuildTree(preorder, inorderMap, 0, 0, len(inorder)-1)
    return root
}

汉诺塔问题

在归并排序和构建二叉树中，我们都是将原问题分解为两个规模为原问题一半的子问题。然而对于汉诺塔问题，我们采用不同的分解策略。

给定三根柱子，记为 A、B 和 C 。起始状态下，柱子 A 上套着 (n) 个圆盘，它们从上到下按照从小到大的顺序排列。我们的任务是要把这 (n) 个圆盘移到柱子 C 上，并保持它们的原有顺序不变（如图 12-10 所示）。在移动圆盘的过程中，需要遵守以下规则。

圆盘只能从一根柱子顶部拿出，从另一根柱子顶部放入。
每次只能移动一个圆盘。
小圆盘必须时刻位于大圆盘之上。

我们将规模为 (i) 的汉诺塔问题记作 (f(i)) 。例如 (f(3)) 代表将 (3) 个圆盘从 A 移动至 C 的汉诺塔问题。

考虑基本情况

对于问题 (f(1)) ，即当只有一个圆盘时，我们将它直接从 A 移动至 C 即可。
对于问题 (f(2)) ，即当有两个圆盘时，由于要时刻满足小圆盘在大圆盘之上，因此需要借助 B 来完成移动。

先将上面的小圆盘从 A 移至 B 。
再将大圆盘从 A 移至 C 。
最后将小圆盘从 B 移至 C 。
解决问题 (f(2)) 的过程可总结为：将两个圆盘借助 B 从 A 移至 C 。其中，C 称为目标柱、B 称为缓冲柱。

子问题分解

对于问题 (f(3)) ，即当有三个圆盘时，情况变得稍微复杂了一些。
因为已知 (f(1)) 和 (f(2)) 的解，所以我们可从分治角度思考，将 A 顶部的两个圆盘看作一个整体，执行图 12-13 所示的步骤。这样三个圆盘就被顺利地从 A 移至 C 了。

令 B 为目标柱、C 为缓冲柱，将两个圆盘从 A 移至 B 。
将 A 中剩余的一个圆盘从 A 直接移动至 C 。
令 C 为目标柱、A 为缓冲柱，将两个圆盘从 B 移至 C 。

从本质上看，我们将问题 (f(3)) 划分为两个子问题 (f(2)) 和一个子问题 (f(1)) 。按顺序解决这三个子问题之后，原问题随之得到解决。这说明子问题是独立的，而且解可以合并。

至此，我们可总结出图 12-14 所示的解决汉诺塔问题的分治策略：将原问题 (f(n)) 划分为两个子问题 (f(n-1)) 和一个子问题 (f(1)) ，并按照以下顺序解决这三个子问题。

将 (n-1) 个圆盘借助 C 从 A 移至 B 。
将剩余 (1) 个圆盘从 A 直接移至 C 。
将 (n-1) 个圆盘借助 A 从 B 移至 C 。

对于这两个子问题 (f(n-1)) ，可以通过相同的方式进行递归划分，直至达到最小子问题 (f(1)) 。而 (f(1)) 的解是已知的，只需一次移动操作即可。

代码实现

在代码中，我们声明一个递归函数 dfs(i, src, buf, tar) ，它的作用是将柱 src 顶部的 (i) 个圆盘借助缓冲柱 buf 移动至目标柱 tar ：

 /* 移动一个圆盘 */
func move(src, tar *list.List) {
    // 从 src 顶部拿出一个圆盘
    pan := src.Back()
    // 将圆盘放入 tar 顶部
    tar.PushBack(pan.Value)
    // 移除 src 顶部圆盘
    src.Remove(pan)
}
 
/* 求解汉诺塔问题 f(i) */
func dfsHanota(i int, src, buf, tar *list.List) {
    // 若 src 只剩下一个圆盘，则直接将其移到 tar
    if i == 1 {
        move(src, tar)
        return
    }
    // 子问题 f(i-1) ：将 src 顶部 i-1 个圆盘借助 tar 移到 buf
    dfsHanota(i-1, src, tar, buf)
    // 子问题 f(1) ：将 src 剩余一个圆盘移到 tar
    move(src, tar)
    // 子问题 f(i-1) ：将 buf 顶部 i-1 个圆盘借助 src 移到 tar
    dfsHanota(i-1, buf, src, tar)
}
 
/* 求解汉诺塔问题 */
func solveHanota(A, B, C *list.List) {
    n := A.Len()
    // 将 A 顶部 n 个圆盘借助 B 移到 C
    dfsHanota(n, A, B, C)
}

汉诺塔问题形成一棵高度为 (n) 的递归树，每个节点代表一个子问题，对应一个开启的 dfs() 函数，因此时间复杂度为 (O(2^n)) ，空间复杂度为 (O(n)) 。

上一篇个人随笔 —— 基于 go 语言实现的轻量化分布式调度引擎 workflow

下一篇基于 fastflow 的一种工作流框架

本文作者：Blue Mountain

本文链接：https://www.cnblogs.com/BlueMountain-HaggenDazs/p/18040571

posted @ 2024-02-28 15:51 Blue Mountain 阅读(25) 评论(0) 编辑收藏举报

刷新页面返回顶部

登录后才能查看或发表评论，立即登录或者逛逛博客园首页

相关博文：

· 《hello-algo》回溯 —— 小记随笔

· 《hello-algo》树—— 小记随笔

· 如何使用分治算法的思想，分治技巧详解

· 经典分治算法

· 分治策略——算法学习（二）

Blue Mountain

《hello-algo》分治 —— 小记随笔

分治算法

如何判断分治问题

通过分治提升效率

操作数量优化

并行计算优化

分治常见应用

分治搜索策略

基于分治实现二分查找

构建二叉树问题

判断是否为分治问题

如何划分子树

基于变量描述子树区间

代码实现

汉诺塔问题

考虑基本情况

子问题分解

代码实现

公告

常用链接

最新随笔

我的标签

积分与排名

随笔分类

随笔档案

友情链接

阅读排行榜

评论排行榜

推荐排行榜

最新评论

	/* 二分查找：问题 f(i, j) */
	func dfs(nums []int, target, i, j int) int {
	// 如果区间为空，代表没有目标元素，则返回 -1
	if i > j {
	return -1
	}
	// 计算索引中点
	m := i + ((j - i) >> 1)
	//判断中点与目标元素大小
	if nums[m] < target {
	// 小于则递归右半数组
	// 递归子问题 f(m+1, j)
	return dfs(nums, target, m+1, j)
	} else if nums[m] > target {
	// 小于则递归左半数组
	// 递归子问题 f(i, m-1)
	return dfs(nums, target, i, m-1)
	} else {
	// 找到目标元素，返回其索引
	return m
	}
	}

	/* 二分查找 */
	func binarySearch(nums []int, target int) int {
	n := len(nums)
	return dfs(nums, target, 0, n-1)
	}

	/* 构建二叉树：分治 */
	func dfsBuildTree(preorder []int, inorderMap map[int]int, i, l, r int) *TreeNode {
	// 子树区间为空时终止
	if r-l < 0 {
	return nil
	}
	// 初始化根节点
	root := NewTreeNode(preorder[i])
	// 查询 m ，从而划分左右子树
	m := inorderMap[preorder[i]]
	// 子问题：构建左子树
	root.Left = dfsBuildTree(preorder, inorderMap, i+1, l, m-1)
	// 子问题：构建右子树
	root.Right = dfsBuildTree(preorder, inorderMap, i+1+m-l, m+1, r)
	// 返回根节点
	return root
	}

	/* 构建二叉树 */
	func buildTree(preorder, inorder []int) *TreeNode {
	// 初始化哈希表，存储 inorder 元素到索引的映射
	inorderMap := make(map[int]int, len(inorder))
	for i := 0; i < len(inorder); i++ {
	inorderMap[inorder[i]] = i
	}

	root := dfsBuildTree(preorder, inorderMap, 0, 0, len(inorder)-1)
	return root
	}

	/* 移动一个圆盘 */
	func move(src, tar *list.List) {
	// 从 src 顶部拿出一个圆盘
	pan := src.Back()
	// 将圆盘放入 tar 顶部
	tar.PushBack(pan.Value)
	// 移除 src 顶部圆盘
	src.Remove(pan)
	}

	/* 求解汉诺塔问题 f(i) */
	func dfsHanota(i int, src, buf, tar *list.List) {
	// 若 src 只剩下一个圆盘，则直接将其移到 tar
	if i == 1 {
	move(src, tar)
	return
	}
	// 子问题 f(i-1) ：将 src 顶部 i-1 个圆盘借助 tar 移到 buf
	dfsHanota(i-1, src, tar, buf)
	// 子问题 f(1) ：将 src 剩余一个圆盘移到 tar
	move(src, tar)
	// 子问题 f(i-1) ：将 buf 顶部 i-1 个圆盘借助 src 移到 tar
	dfsHanota(i-1, buf, src, tar)
	}

	/* 求解汉诺塔问题 */
	func solveHanota(A, B, C *list.List) {
	n := A.Len()
	// 将 A 顶部 n 个圆盘借助 B 移到 C
	dfsHanota(n, A, B, C)
	}