寻找总和为n的连续子数列之算法分析

看到有这么道算法题在博客园讨论,算法eaglet邀月都已经设计出来了,花了点时间读了下,学到点东西顺便记录下来吧。

题目是从1...n的数列中,找出总和为n的连续子数列。

这里先设好算法中需要用到的关键变量:

  • s:目标子数列的第一个元素
  • k:目标子数列的长度

那么目标子数列可以表示为(s, k)

1. naive算法(n^2)

最笨的,但是最容易的想到的方法,就是穷举所有的子数列:

for s = 1 to n
for k = 1 to n-s+1
if sum(s, k) == n
output(s, k)

复杂度为:n + (n-1) + (n-2) + (n-3).... = n(n-1)/2

所以,其复杂度是O(n^2)

2. 用二分法改进的naive算法 (nlog2n)

我们需要充分利用输入的特性,这里,原始数列的一个很明显的特点就是有序,而利用有序数列提高效率的最常用方法就是二分法。这里我们可以注意到,针对某个子数列起始点s,我们没有必要逐个长度的去求和判断,而是利用其有序的性质,先求(s, (n+s)/2)的和。如果等于n则输出,如果大于n,则数列结尾在前半段,否则在后半段:

for s = 1 to n
  low
= s
  high
= n
  
while low < high
    mid
= (low + high)/2
    sum
= sum(s, mid)
    
if sum == n
output(s, mid)
    
else if(sum > n)
high
= mid
    
else
low
= mid

很明显,此算法复杂度为O(nlog2n)

3. 利用规律s*k <= n而设计的算法 (nlnn)

我们知道,s是目标子数列的第一个元素,也是最小的元素,所以必然有sum(s,k) >= s*k, 也就是n>=s*k, 也就是k <= n/s,于是算法可以写成:

for s = 1 to n
  
for k = 1 to n/s
    
if sum(s, k) == n
output(s, k);

此处,其复杂度并不是显而易见,但稍加分析:

复杂度 = n + n/2 + n/3 + n/4 + ... + n/n = n (1 + 1/2 + 1/3 + 1/4 + .. + 1/n),可以注意到,括号中的部分是一个调和级数,其和为lnn。

于是,此算法的复杂度为 O(nlnn),比算法2稍佳,因为lnn的底数要稍大些。

4. 利用规律s*k = n-k(k-1)/2而设计的算法(sqrt(n))

我们知道,对于子数列求和,其公式为:

n = k(s+ (s+k-1))/2 = s*k + k(k-1)/2

得出:

s*k = n - k(k-1)/2

由这个公式我们可以得到两点信息:

  • 1*k <= s*k = n-k(k-1)/2,推出n-k(k-1)/2 >= k
  • 如果n-k(k-1)/2能够整除k,则k是目标子数列的长度,而起始点可以由公式算出:s = (n-k(k-1)/2)/k

于是,算法就可以以k为变量递增,以n-k(k-1)/2 >= k为限制条件:

k = 1
v
= n-k(k-1)/2
while v >= k
  
if v % k == 0
output(v
/k, k) // 如果能整除,则找到解,并且起始点为v/k
  k++
  v
= n-k(k-1)/2

分析复杂度,我们只需关注k的变化,k是从1递增到某个数结束,关键是如何求这个截止的k。

我们的循环结束条件是:

n-k(k-1)/2 >= k

化简得到:

k^2 + k <= 2n

k^2 <=  2n - k

因为k > 0,于是有

k^2 < 2n

k < sqrt(2n)

所以,这个截止的k就应该是sqrt(2n)或者略小于它

到这里,就不难看出其算法复杂度为O(sqrt(n)) - 略去常数因子和低阶函数

posted @ 2011-03-05 17:14  lzprgmr  阅读(2844)  评论(3编辑  收藏  举报

黄将军