区间问题三部曲(1) : 在线区间最值算法

区间问题是常见的统计问题之一，广泛应用于各类问题之中。主要形式有区间最值问题，区间和问题等。而区间最值问题可以分为静态区间最值和动态区间最值。我们先看一个情景：

描述

老管家是一个聪明能干的人。他为财主工作了整整10年，财主为了让自已账目更加清楚。要求管家每天记k次账，由于管家聪明能干，因而管家总是让财主十分满意。但是由于一些人的挑拨，财主还是对管家产生了怀疑。于是他决定用一种特别的方法来判断管家的忠诚，他把每次的账目按1，2，3…编号，然后不定时的问管家问题，问题是这样的：在a到b号账中最少的一笔是多少？为了让管家没时间作假他总是一次问多个问题。

输入格式

输入中第一行有两个数m,n表示有m(m<=100000)笔账,n表示有n个问题，n<=100000。
第二行为m个数,分别是账目的钱数
后面n行分别是n个问题,每行有2个数字说明开始结束的账目编号。

输出格式

输出文件中为每个问题的答案。具体查看样例。

测试样例1

输入

10 3 
1 2 3 4 5 6 7 8 9 10 
2 7 
3 9 
1 10

输出

2 3 1

最好想的方法就是暴力法，每次询问就过一遍区间找最小值，复杂度O(n^2)，对于100000数据量显然难以胜任。而如果开一个100000*100000的数组做优化空间又吃不消。所以我们需要ST算法来解决这个问题。
我们用这道题来解释ST算法的运行。

(1) 预处理’

预处理使用一个数组dp[0..n][log(n)+1]的数组，使dp[i][j]为从i开始(包括i)之后2^j个数字中的最小值。具体方法使用动态规划。

首先 dp[i][0] = a[i]，即从i开始后一个中的最小值为第i个数(自己嘛)
对于样例就是这样的
这里写图片描述

然后对于dp[j][i]，一定有dp[j][i] = min(dp[j][i-1],dp[j+2^(j-1)][i-1])

我们来证明他：dp[j][i-1]记录着j..j+2^(i-1)-1中的最小值, dp[j+2^(j-1)][i-1]则记录了j+2^(i-1)..j+2^(i-1)+2^(i-1)-1。合起来就是j..j+2^(i-1)+2^(i-1)-1即j..j+2^i-1为所求。

这里写图片描述

//无视excel公式纯属偷懒

最后搞dp顺序：因为计算dp[j][i] 需要 dp[j][i-1]和dp[j+2^(j-1)][i-1]。不难看出i计算dp[j][i]需要所有的dp[j][i-1]，即i是单调递增的。

dp要素都齐了，给一个程序片段吧(对于原题)

void init()
{
    for (int i = 1; i <= 18; i++)
        for (int j = 1; j <= n; j++)
            if (j+TwoPow(i) <= n) 
                dp[j][i] = min(dp[j][i-1],dp[j+TwoPow(i-1)][i-1]);
}

其中计算2^x使用了一个小技巧：

#define TwoPow(x) ((1)<<(x))

(2)询问

算出来这些个数看起来并没什么用。然而一种很好的算法可以在O(1)效率内计算出一段区间内的最小值。先看代码

int ask(int i, int j)
{
    int k = (int)(log(j-i+1)/log(2));
    return min(dp[i][k], dp[j-TwoPow(k)+1][k]);
}

看起来有些云里雾里、、但是思想非常简单。我们举例说明下：

对于2..8这个区间如何利用已经求过的数据来解答呢？关键在于将区间分为两个长度为2^x(x为自然数)的子区间，且这两个区间的并为原区间，则这两个区间的最小值为所求。即2..5, 5..8，两个区间长度都为4。2..8的最小值即为dp[2][2], dp[5][2]

再例如对于3..7, 可以分成3..6, 4..7；对于3..8，可以分成3..6, 5..8。

一般的，对于区间a = i..j, 一定可以分成区间i..log2(|a|), j-log2(|a|)+1..j。|a|为区间a的长度，即j-i+1。log2用换底公式可以求出来。

证明这个方法，即区间i..2^(log2(|a|))，j-log2(|a|)+1..2^log2(|a|)的并为原区间非常简单，这里省略。

最后给出完整代码

#include <iostream>
#include <cstring>
#include <cmath>
#include <cstdio>
using namespace std;

#define maxn 100010
int dp[maxn][20];
int n, q;
#define TwoPow(x) ((1)<<(x))

void init()
{
    for (int i = 1; i <= 18; i++)
        for (int j = 1; j <= n; j++)
            if (j+TwoPow(i) <= n) 
                dp[j][i] = min(dp[j][i-1],dp[j+TwoPow(i-1)][i-1]);
}

int ask(int i, int j)
{
    int k = (int)(log(j-i+1)/log(2));
    return min(dp[i][k], dp[j-TwoPow(k)+1][k]);
}

int main()
{
    memset (dp, 127/3, sizeof(dp));
    scanf("%d%d", &n, &q);
    for (int i = 1; i <= n; i++)
        scanf("%d", &dp[i][0]);
    init();
    int i, j;
    while (q --> 0) {
        scanf("%d%d", &i, &j);
        printf("%d ", ask(i,j));
    }
    return 0;
}

吐槽一下c++的IO、、过于慢，居然TLE了、、、看看结果

//暴力法评测结果
#0: Accepted (0ms, 768KiB)
#1: Accepted (0ms, 768KiB)
#2: Accepted (15ms, 800KiB)
#3: Accepted (0ms, 796KiB)
#4: Accepted (468ms, 1864KiB)
#5: Accepted (109ms, 980KiB)
#6: Accepted (265ms, 1180KiB)
#7: Accepted (795ms, 2792KiB)
#8: Time Limit Exceeded (1809ms, 3356KiB)
#9: Accepted (842ms, 2828KiB)

//ST算法
#0: Accepted (15ms, 8360KiB)
#1: Accepted (0ms, 8360KiB)
#2: Accepted (0ms, 8364KiB)
#3: Accepted (15ms, 8360KiB)
#4: Accepted (140ms, 8364KiB)
#5: Accepted (15ms, 8364KiB)
#6: Accepted (31ms, 8364KiB)
#7: Accepted (31ms, 8360KiB)
#8: Accepted (359ms, 8364KiB)
#9: Accepted (406ms, 8368KiB)

别走开、第二场战斗（动态区间和）马上开始、、、虽然没什么人看。。。

posted @ 2016-02-13 12:28 ljt12138 阅读(741) 评论(1) 编辑收藏举报

会员力量，点亮园子希望

刷新页面返回顶部

ljt12138

区间问题三部曲(1) : 在线区间最值算法

公告