分治算法思想介绍

一，介绍

分治算法主要包含两个步骤：分、治。分，就是递归地将原问题分解成小问题；治则是：在解决了各个小问题之后(各个击破之后)合并小问题的解，从而得到整个问题的解

二，分治递归表达式

分治算法一般都可以写出一个递归表达式；比如经典的归并排序的递归表达式：T(N)=2T(N/2)+O(N)

T(N)代表整个原问题，采用了分治解决方案后，它可以表示成：

①分解成了两个规模只有原来一半(N/2)的子问题:T(N/2)

②当解决完这两个子问题T(N/2)之后，再合并这两个子问题需要的代价是 O(N)

递归表达式的解就是该算法的时间复杂度。关于某些特定形式的递归表达式，求解时，是可以直接套公式的：

T(N)=aT(N/b)+Θ(N^K) 表示将原问题分解成 a 个规模大小为 N/b 的子问题，合并这 a 个子问题的代价是 Θ(N^K) （N^k 表示 N 的 k 次方）

T(N)的解有以下三种情况：

1) T(N)=O(N^log_ba) 当 a > b^k 时

2) T(N)=O(N^k logN) 当 a = b^k 时

3) T(N)=O(N^k) 当 a < b^k 时

三，分治算法的一些实例分析

①最近点问题，参考《数据结构与算法分析》Mark Allen Wiess著第10章

问题描述：在一个平面上分布着若干个点，点与点之间的距离公式为：[(x₁-x₂)² + (y₁-y₂)²]^1/2

找出，距离最小的那两个点

假设平面上有N个点，这N个点之间共有 1+2+3+……+(N-1) = N(N-1)/2 个距离，采用穷举，时间复杂度为O(N^2)；而采用分治则可以做到O(NlogN)

那如何应用分治呢？

首先将N个点按照 X轴坐标进行排序，排序算法的时间复杂度为O(NlogN)，故相对于穷举而言，它不影响总是时间复杂度。因为O(NlogN) << O(N^2)（远远小于）

按X轴坐标排序后，可以划一条垂直于X轴的线，将所有的点划分成两半。那么，点与点之间的距离就会出现三种情况：

a)两个点完全处于垂线的左边，那么这两点的距离不会越过垂线，这类距离记为 D_L

b)两个点完全处于垂线的右边，那么这两点的距离不会越过垂线,这类距离记为 D_R

c)两个点一个在垂线的左边，一个在垂线的右边，因此这两个的距离会横跨垂线

这种划分思想，在求解：最大子序列的和时，也可以采用。

设 minD = min{D_L，D_R}，即minD是 a) 和 b) 这两种情况下的所有距离中最小的那个距离。

那么，可以用数学证明：处于[-minD, minD]这个范围内的点平均只有 O(sqrt(N))个。

而sqrt(N)个点，一共有 O(N)个距离对，因为N个点一共有N(N-1)/2，即O(N^2)个距离对

这样，我们可以将处于 c) 中的点对距离采用穷举来查找出最小的距离，复杂度为O(N)

而，处于a) 和 b) 中的点可以继续进行递归划分。

从而，递归表达式为： T(N)=2T(N/2)+O(N) ，而这个表达式的解为：T(N)=O(NlogN)

也就是说，采用了分治，成功地将原问题从O(N^2) 降低为 O(NlogN)

②K选择问题

问题描述：给出N个数，找出其中第K小的元素

如果直接用穷举，一共需要比较K*N次，当K与N有关时，比如K是中位数(K=N/2)，时间复杂度为O(N^2).

而采用分治，则可把复杂度降低为O(N)

首先在N个数选出一个枢轴元素，将比枢轴元素的元素放到枢轴元素的右边，将比枢轴元素小的元素放到枢轴元素的左边。这样，把N个数，分成了两部分，一部分，记为S(1) 它们都比枢轴大，另一部分记为S(2)，它们都比枢轴小。这就是分治的分。

假设一种理想的情况：枢轴元素基本位于中间值，即它总是将原数组划分成两个两个大小基本相等的子数组：S(1) 和 S(2)

要求解第K小的元素，有三种情况：

a) 若 K < |S(1)|，说明：第K小的元素位于 S(1)这个子数组中。 其中，|S(1)| 表示 S(1) 数组中元素的个数。

b) 若 K == |S(1)| + 1，说明：第K小的元素，刚好是枢轴元素

c) 否则，第K个的元素位于 S(2)子数组中

如果是情况 a) 或者情况 c) ，可以继续递归分解子数组。

分解问题之后：将N个元素，分成了两个 N/2 个元素的子数组，只需要在其中一个子数组中进行查找即可，使用穷举查找，复杂度为O(N/2)。

递归表达式： T(N)=T(N/2)+O(N/2)，这个递归表达式的解为O(N)

这说明，采用分治，可以将K选择问题的时间复杂度降低为O(N)

顺便说一句，这与快速排序的划分非常的相似，只不过快速排序需要处理两个子数组（对划分的两个子数组分别进行快速排序）。而这里只需要处理其中某一个子数组，因为若第K小元素处于S(1)子数组中，那么它一定不会在S(2)子数组中了，因此我们就不需要再处理S(2)子数组了。

原文：http://www.cnblogs.com/hapjin/p/5538912.html

posted @ 2016-05-29 10:15 大熊猫同学阅读(8495) 评论(0) 编辑收藏举报

刷新页面返回顶部

hapjin

分治算法思想介绍

公告