莫队算法~讲解【更新】

一.什么是莫队算法?

莫队算法是用来处理一类无修改的离线区间询问问题。——(摘自前国家队队长莫涛在知乎上对莫队算法的解释。)

莫队算法是前国家队队长莫涛在比赛的时候想出来的算法。

传说中能解决一切区间处理问题的莫队算法。

准确的说,是离线区间问题。但是现在的莫队被拓展到了有树上莫队,带修莫队(即带修改的莫队)。这里只先讲普通的莫队。

还有一点,重要的事情说三遍!莫队不是提莫队长!莫队不是提莫队长!!莫队不是提莫队长!!!

二.为什么要使用莫队算法?

看一个例题:给定一个n(n<50000)元素序列,有m(m<200000)个离线查询。每次查询一个区间L~R,问每个元素出现次数为k的有几个。(必须恰好是k,不能大于也不能小于)

这时候dalao们就直接树状数组线段树主席树拍上去了,身为蒟蒻的我躲在角落瑟瑟发抖。该怎么办?

这时候就要使用莫队算法了。

三.莫队算法的思想?

接着上面的例题,直接暴力怎么样??

肯定会T的啊。

但是如果这个暴力我们给优化一下呢?

我们想,有两个指针 curL 和 curR,curL 指向 L ,curR 指向 R。

L和R是一个区间的左右两端点。

利用 cnt[] 记录每个数出现的次数,每次只是 cnt[a[curL]] cnt[a[curR]] 修改。

举个栗子:

我们现在处理了curL—curR区间内的数据,现在左右移动,比如curL到curL-1,只需要更新上一个新的3,即curL-1。

那么curL到curL+1,我们只需要去除掉当前curL的值。因为curL+1是已经维护好了的。

curR同理,但是要注意方向哦!curR到curR+1是更新,curR到cur-1是去除。

我们先计算一个区间[curL curR]的answer,这样的话,我们就可以用O(1)转移到[curL-1 curR] [curL+1 curR] [curL curR+1] [curL curR-1]上来并且求出这些区间的answer。

我们利用curL和curR,就可以移动到我们所需要求的[L R]上啦~

这样做好像不会快很多,而且......

如果有个**数据,让你在每个L和R间来回跑,而且跨度很大呢??

\(T\)还是\(T\)...

怎么办?

但是这其实就是莫队算法的核心了。我们的莫队算法还有优化。

这就是莫队算法最精明的地方(我认为的qwq),也正是有了这个优化,莫队算法被称为:优雅的暴力。

我们想,因为每次查询是离线的,所以我们先给每次的查询排一个序。

一种直观的办法是按照左端点排序,再按照右端点排序。但是这样的表现不好。特别是面对精心设计的数据,这样方法表现得很差。

举个栗子,有6个询问如下:(1, 100), (2, 2), (3, 99), (4, 4), (5, 102), (6, 7)。

这个数据已经按照左端点排序了。用上述方法处理时,左端点会移动6次,右端点会移动移动98+97+95+98+95=483次。

其实我们稍微改变一下询问处理的顺序就能做得更好:(2, 2), (4, 4), (6, 7), (5, 102), (3, 99), (1, 100)。

左端点移动次数为2+2+1+2+2=9次,比原来稍多。右端点移动次数为2+3+95+3+1=104,右端点的移动次数大大降低了。

上面的过程启发我们:

我们不应该严格按照升序排序,而是根据需要灵活一点的排序方法

那么排序的方法是

分块。

我们把所有的元素分成多个块。再按照左端点块编号从小到大排序,左端点块编号相同按右端点块编号从小到大。

这样对于不同的查询

例如:

我们有长度为9的序列。

1 2 3 4 5 6 7 8 9 分为1——3 4——6 7——9

查询有7组。[1 2] [2 9] [1 3] [6 9] [5 8] [3 8] [8 9]

排序后就是:[1 2] [1 3] [3 8] [2 9] | [5 8] [6 9] | [8 9]

然后我们按照这个顺序移动指针就好啦~

时间复杂度证明

其实从不同的角度看,证法很多:对于左端点在一个块中时,右端点最坏情况是从尽量左到尽量右,所以右端点跳时间复杂度O(n),左端点一共可以在n0.5个块中,所以总时间复杂度O(n*n0.5) = O(n^1.5)。

四.具体代码实现:

1.对于每组查询的记录和排序:

l,r为左右区间编号,p是第几组查询的编号

struct query{
    int l, r, p;
}e[maxn];

bool cmp(query a, query b)
{
    return (a.l/bl) == (b.l/bl) ? a.r < b.r : a.l < b.l;
}

2.处理和初始变量:

answer就是所求答案,bl是分块数量,a[]是原序列,ans[]是记录原查询序列下的答案,cnt[]是记录对于每个数i,cnt[i]表示i出现过的次数,curL和curR不再解释,nmk题意要求。

int answer, a[maxn], m, n, bl, ans[maxn], cnt[maxn], k, curL = 1, curR = 0;
void add(int pos)//添加 
{
    //do sth...
}
void remove(int pos)//去除 
{
    //do sth...
}
//一般写法都是边处理 边根据处理求答案。cnt[a[pos]]就是在pos位置上原序列a出现的次数。

3.主体部分及输出:

预处理查询编号,用四个while移动指针顺便处理。

n = read(); m = read(); k = read();
    bl = sqrt(n);

    for(int i = 1; i <= n; i++)
    a[i] = read();
    
    for(int i = 1; i <= m; i++)
    {
        e[i].l = read(); e[i].r = read();
        e[i].p = i;
    }
    
    sort(e+1,e+1+m,cmp);
    
    for(int i = 1; i <= m; i++)
    {
        int L = e[i].l, R = e[i].r;
        while(curL < L)
        remove(curL++);  
        while(curL > L)
        add(--curL);
        while(curR > R)
        remove(curR--);
        while(curR < R)
        add(++curR);
        ans[e[i].p] = answer;
    }
    for(int i = 1; i <= m; i++)
    printf("%d\n",ans[i]);
    return 0;

在这里着重说下四个while

当curL < L 时,我们当前curL是已经处理好的了。所以remove时先去除当前curL再++

当curL > L 时,我们当前curL是已经处理好的了。所以 add 时先--再加上改后curL

当curR > R 时,我们当前curR是已经处理好的了。所以remove时先去除当前curR再--

当curR < R 时,我们当前curR是已经处理好的了。所以 add 时先++再加上改后curR

五.一些例题

【luogu P2709 小B的询问】

\(add\)\(remove\)对于平方相加减的运算利用完全平方式逆回去。

1^2 = 1;

2^2 = (1+1)^2 = 1 + 1*2 + 1;

3^2 = (1+2)^2 = 1 + 2*2 + 4;

4^2 = (1+3)^2 = 1 + 3*2 + 9;

//小B的询问 
#include <cstdio>
#include <algorithm>
#include <iostream>
#include <cmath>
using namespace std;
const int maxn = 50001;
int answer, a[maxn], m, n, bl, ans[maxn], cnt[maxn], k, curL = 1, curR = 0;
void add(int pos)
{
    answer+=(((cnt[a[pos]]++)<<1)+1);//完全平方式展开 
}
void remove(int pos)
{
    answer-=(((--cnt[a[pos]])<<1)+1);//完全平方式展开
}
inline int read()
{
    int k=0;
    char c;
    c=getchar();
    while(!isdigit(c))c=getchar();
    while(isdigit(c)){k=(k<<3)+(k<<1)+c-'0';c=getchar();}
    return k;
}
struct query{
    int l, r, p;
}e[maxn];
bool cmp(query a, query b)
{
    return (a.l/bl) == (b.l/bl) ? a.r < b.r : a.l < b.l;
}
int main()
{
    n = read(); m = read(); k = read();
    bl = sqrt(n);

    for(int i = 1; i <= n; i++)
    a[i] = read();
    
    for(int i = 1; i <= m; i++)
    {
        e[i].l = read(); e[i].r = read();
        e[i].p = i;
    }
    
    sort(e+1,e+1+m,cmp);
    
    for(int i = 1; i <= m; i++)
    {
        int L = e[i].l, R = e[i].r;
        while(curL < L)
        remove(curL++);  
        while(curL > L)
        add(--curL);
        while(curR > R)
        remove(curR--);
        while(curR < R)
        add(++curR);
        ans[e[i].p] = answer;
    }
    for(int i = 1; i <= m; i++)
    printf("%d\n",ans[i]);
    return 0;
}

【luogu P4462 [CQOI2018]异或序列】

ax+ax-1+...+ay = cntx+cnty 这样把一段序列变成两段相加跑莫队。

#include <cstdio>
#include <algorithm>
#include <iostream>
#include <cmath>
using namespace std;
const int maxn = 200010;
int curR = 0, curL = 1, answer,a[maxn], ans[maxn], cnt[maxn], n, m, k, bl;
struct query{
    int l,r,p;
}q[maxn];

bool cmp(const query &a, const query &b)
{
    return (a.l/bl) == (b.l/bl) ? a.r<b.r : a.l<b.l;
}

inline void add(int pos)
{
    cnt[a[pos]]++;
    answer+=cnt[a[pos]^k];
}

inline void remove(int pos)
{
    cnt[a[pos]]--;
    answer-=cnt[a[pos]^k];
}

int main()
{
    scanf("%d%d%d",&n,&m,&k);
    bl = sqrt(n);
    cnt[0] = 1;
    for(int i = 1; i <= n; i++)
    {
        scanf("%d",&a[i]);
        a[i] ^= a[i-1]; 
    }
    
    for(int i = 1; i <= m; i++)
    {
        scanf("%d%d",&q[i].l,&q[i].r);
        q[i].p = i;
    }
    
    sort(q+1,q+1+m,cmp);
    
    for(int i = 1; i <= m; i++)
    {
        while(curL < q[i].l) remove(curL-1),curL++;
        while(curL > q[i].l) curL--,add(curL-1);
        while(curR < q[i].r) add(++curR);
        while(curR > q[i].r) remove(curR--);
        ans[q[i].p] = answer;
    }
    for(int i = 1; i <= m; i++)
    printf("%d\n",ans[i]);
    return 0;
}

六.总结

莫队算法适用条件是比较苛刻的吗?是的。
①题目必须离线

②能够以极少的时间推出旁边区间(一般是O(1))

③没有修改或者修改不太苛刻

④基于分块,分块不行,它也好不了哪里去

但莫队的思想美妙,代码优美,你值得拥有。莫队的排序思想也为众多离线处理的题目提供了完整的思路。

我们可以看出来,对于莫队这种模拟式的暴力算法很好理解。
也比较实用,乱搞神器不是浪得虚名。

莫队是我自学的,所以在文章里或许会有些个人理解上的偏差,还请各位dalao能赐教。自学能力是需要培养、锻炼的。

其次是也引用了一些dalao写的很好的文章,也是我自学时用到的资料:

这是几篇我学莫队时参考的博客,如果觉得我讲的不够详细,可以借鉴。

qvq

qaq

qnq

祝各位OI路途能越走越顺!

本蒟蒻\(QQ\) 935145183/3203600070

蒟蒻博客园地址

posted @ 2018-08-04 11:10  Misaka_Azusa  阅读(352)  评论(0编辑  收藏  举报
Live2D