Old Driver Tree——浅谈珂朵莉树
本文转载自单南松大佬的博客,只修改了码风QAQ。
绪言:研究珂朵莉树的原因
总是看到好多大佬在研究这个十分二次元化的东西(对于我这种男性 OIer 是这个感觉),所以想深入了解一下。
珂朵莉树的起源
珂朵莉树原名老司机树(Old Driver Tree,ODT),是一种基于 std::set 的暴力数据结构,由2017年一场CF比赛中提出的数据结构,因为题目背景主角是《末日时在做什么?有没有空?可以来拯救吗?》的主角珂朵莉,因此该数据结构被称为珂朵莉树。
应用
解决各种线段树无法完成的操作。
注意珂朵莉树保持复杂度主要依靠 assign 操作,所以题目中必须有区间赋值。
还有很重要的一点:数据需纯随机。
什么时候用珂朵莉树
关键操作:推平一段区间,使一整段区间内的东西变得一样。保证数据随机。
$n$ 个数,$m$ 次操作。 $n,m \le 105$
操作:
-
区间加;
-
区间赋值;
-
区间第 $k$ 小;
-
求区间幂次和;
-
数据随机,时限 $2s$。
构造
用一个带结构体的集合(std::set)维护序列。
集合中的每个元素有左端点,右端点,值。
下面展示该结构体的构造:
struct node
{
int l,r;
mutable int val;
node(int a=-1,int b=-1,int c=0){ l=a,r=b,val=c; }
bool operator<(const node &a)const{ return l<a.l; }
};
//mutale,意为可变的,即不论在哪里都是可修改的,用于突破C++带const函数的限制。
Split
set::iterator split(int pos)
将原来含有 $pos$ 的区间分为 $[l,pos)$ 和 $[pos,r]$ 两段。
返回一个 std::set 的迭代器,指向 $[pos,r]$段。
可能有些抽象,详细解如下:
split 函数的作用就是查找 set 中第一个左端点不小于 $pos$ 的结点,如果找到的结点的左端点等于 $pos$ 便直接返回指向该结点的迭代器,如果不是,说明 $pos$ 包含在前一个结点所表示的区间之间,此时便直接删除包含 $pos$ 的结点,然后以 $pos$ 为分界点,将此结点分裂成两份,分别插入 set 中,并返回指向后一个分裂结点的迭代器。
首先我们假设 set 中有三个 node 结点,这三个结点所表示的区间长度为 $14$,如下图:
不妨以提取区间 $[10,12]$ 为例详细展开((躁动的读者)诶,说好的查询 $10$ 到 $12$ 呢,怎么下面扯了一堆 $13$?别急,后续将会揭晓 ):
如果我们要查询序列第 $13$ 个位置,首先执行iter it = s.lower_bound(node(13));
此时 it 将成为一个指向第三个结点的迭代器,为什么是第三个结点,而不是第二个结点呢,因为 lower_bound 这个函数获取的是第一个左端点 $l$ 不小于 $13$ 的结点,所以 it 是指向第三个结点的。
然后执行判断语句,发现第三个结点的左端点不是 $13$,不满足条件,说明13必包含在前一个结点中,继续向下执行,让 $it$ 指向前一个结点:
先将该结点的信息保存下来:int l=10,r=13,val=2
,然后直接删除该结点。
以 $pos$ 为分界点,将被删除的结点分裂为 $[l,pos-1]$ ,$[pos,r]$ 这两块,并返回指向 $[pos,r]$ 这个区间的迭代器,事实上return s.insert(node(pos,r,val)).first;
,便做到了插入 $[pos,r]$ 这端区间,并返回指向它的迭代器,有一个 insert 函数返回值为 pair 类型,其中 pair 的第一个元素就是元素插入位置的迭代器。
至此 $13$ 位置已经分裂完成,然后是查询第 $10$ 个位置,查询步骤同上,但是 $10$ 号点满足 if 语句,便直接返回了。
由上述步骤,为了提取区间 $[10,12]$,我们执行了两次 split ,一次为 split(13),一次为 split(10),并获得了两个迭代器,一个指向第二结点,一个指向第三结点。
为什么要先分裂右端点,然后再分裂左端点呢?
因为如果先分裂左端点,返回的迭代器会位于所对应的区间以 $l$ 为左端点,此时如果 $r$ 也在这个节点内,就会导致分裂左端点返回的迭代器被 erase 掉,导致 RE。
结合问题 $1$ 和问题 $2$ ,获取区间迭代器时,务必写成如下格式 iter itr=split(r+1),itl=split(l);
起名无所谓,按自己的习惯就好。
代码
iter split(int pos)
{
iter it=st.lower_bound(node(pos));
if (it!=st.end() && it->l==pos) return it;
--it;
node tmp=*it; st.erase(it);
st.insert(node(tmp.l,pos-1,tmp.val));
return st.insert(node(pos,tmp.r,tmp.val)).first;
}
Assign
注意:以后在使用 split 分裂区间的时候,请先右后左。
区间赋值操作,也是珂树维持其复杂度的关键函数。
很暴力的思想,既然刚刚我们写了一个 split,那么就要把它用起来。
首先 split 出 $l$ 并记返回值为 $itl$,然后 split 出 $r+1$ 并记返回值为 $itr$,显然我们要操作的区间为 $[itl,itr)$,那么我们将 $[itl,itr)$ 删除(std::set.erase(itl, itr)
),再插入一个节点 node,其 $l$ 为 $l$,$r$ 为 $r$,$val$ 为赋值的 $val$。
我们注意到因为这个操作,$[itl,itr)$ 中的所有节点合并为了一个节点,大大降低了集合的元素数量,因此调整了我们的复杂度。
void assign(int l,int r,int val)
{
iter itr=split(r+1),itl=split(l);
st.erase(itl,itr);
st.insert((node){l,r,val});
}
//将一个区间全部改为某个值。
其他操作
通用方法是 split 出 $l$,split 出 $r+1$,然后直接暴力扫描这段区间内的所有节点执行需要的操作。
例如我们的区间和查询:
int querySum(int l,int r)
{
int res=0;
iter itr=split(r+1),itl=split(l);
for(iter it=itl;it!=itr;it++)
res+=(it->r-it->l+1)*it->val;
return res;
}
例如我们的区间加:
void add(int l,int r,int val)
{
iter itr=split(r+1),itl=split(l);
for(iter it= itl;it!=itr;it++) it->val+=val;
}
例如我们的区间第k小:
前置需要
algorithm 库中的 std::sort(快速排序)。
std::map(方便起见使用其中的 pair),std::vector(方便起见)。
还是 split 出 $l$,split 出 $r+1$,然后将每个节点的值和个数(即 $r-l+1$)组成一个 pair(注意为了排序,将值放在第一关键字),将 pair 加入一个 vector 中。
将 vector 排序。
从 vector 的 begin 开始扫描,不停的使 $k$ 减去 vector 当前项的第二关键字,若 $k \le 0$,返回当前项的第一关键字。
int queryKth(int l,int r,int k)
{
vector<PII> vec(0);
iter itr=split(r+1),itl=split(l);
for(iter it=itl;it!=itr;it++)
vec.push_back(make_pair(it->val,it->r-it->l+1));
sort(vec.begin(),vec.end());
for(vector<PII>::iterator it=vec.begin();it!=vec.end();it++)
if((k-=it->second)<=0) return it->first;
return -1;
//note:if there are negative numbers, return another impossible number.
}
求区间所有数的 $x$ 次方的和模 $y$ 的值。
//快速幂取模
int qpow(int a,int b,int p)
{
int rec=1ll;
a%=p;
for(;b;b>>=1,a=a*a%p)
if(b&1) rec=rec*a%p;
return rec;
}
//提取区间,暴力运算
int queryPow(int l,int r,int x,int y)
{
iter itr=split(r+1),itl=split(l);
int res=0;
for(iter it=itl;it!=itr;it++)
res=(res+(it->r-it->l+1)*qpow(it->val,x,y))%y;
return res;
}
珂朵莉树代码样例
/*Chtholly, flatten it! */
#include<cstdio>
#include<vector>
#include<algorithm>
#include<set>
#include<map>
#define int long long
#define iter set<node>::iterator
#define PII pair<int,int>
using namespace std;
struct node
{
int l,r;
mutable int val;
node(int a=-1,int b=-1,int c=0){ l=a,r=b,val=c; }
bool operator<(const node &a)const{ return l<a.l; }
};
set<node> st;
iter split(int pos)
{
iter it=st.lower_bound(node(pos));
if (it!=st.end() && it->l==pos) return it;
--it;
node tmp=*it; st.erase(it);
st.insert(node(tmp.l,pos-1,tmp.val));
return st.insert(node(pos,tmp.r,tmp.val)).first;
}
void assign(int l,int r,int val)
{
iter itr=split(r+1),itl=split(l);
st.erase(itl,itr);
st.insert((node){l,r,val});
}
void add(int l,int r,int val)
{
iter itr=split(r+1),itl=split(l);
for(iter it= itl;it!=itr;it++) it->val+=val;
}
int querySum(int l,int r)
{
int res=0;
iter itr=split(r+1),itl=split(l);
for(iter it=itl;it!=itr;it++)
res+=(it->r-it->l+1)*it->val;
return res;
}
int queryKth(int l,int r,int k)
{
vector<PII> vec(0);
iter itr=split(r+1),itl=split(l);
for(iter it=itl;it!=itr;it++)
vec.push_back(make_pair(it->val,it->r-it->l+1));
sort(vec.begin(),vec.end());
for(vector<PII>::iterator it=vec.begin();it!=vec.end();it++)
if((k-=it->second)<=0) return it->first;
return -1;
//note:if there are negative numbers, return another impossible number.
}
signed main()
{
return 0;
}
例题详解CF896C
一说起区间维护问题,我们就能想到线段树,主席树,树状数组,Splay,分块,莫队等数据结构,但是读完题目我们发现,第四个操作涉及每个数字的相关操作,上面提到的结构只有莫队可以做到,但是复杂度太高,我们需要一个更加高效的数据结构 珂朵莉来维护这些操作。
#include<iostream>
#include<cstdio>
#include<vector>
#include<algorithm>
#include<set>
#include<map>
#define int long long
#define PII pair<int,int>
#define iter set<node>::iterator
using namespace std;
const int N=1e5+5,P=1e9+7;
int seed,a[N];
int rnd()
{
int ret=seed;
seed=(seed*7+13)%P;
return ret;
}
int read()
{
char ch;
int v,f=1;
for(ch='*';(ch<'0'||ch>'9') && ch!='-';ch=getchar());
if(ch=='-') f=-1,ch=getchar();
for(v=0ll;ch>='0' && ch<='9';ch=getchar()) v=v*10+ch-'0';
return v*f;
}
int qpow(int a,int b,int p){
if (!a) return 0;
int rec=1ll; a%=p;
for(;b;b>>=1ll,a=a*a%p)
if(b&1) rec=rec*a%p;
return rec;
}
struct node
{
int l, r;
mutable int val;
node(int a=-1,int b=-1,int c=0){ l=a,r=b,val=c; }
bool operator<(const node &a)const{ return l<a.l; }
};
set<node> st;
iter split(int pos)
{
iter it=st.lower_bound(node(pos));
if(it!=st.end() && it->l==pos) return it;
--it;
node tmp=*it; st.erase(it);
st.insert(node(tmp.l,pos-1,tmp.val));
return st.insert(node(pos,tmp.r,tmp.val)).first;
}
void assign(int l,int r,int val)
{
iter itr=split(r+1),itl=split(l);
st.erase(itl,itr);
st.insert((node){l,r,val});
}
void add(int l, int r, int val)
{
iter itr=split(r+1),itl=split(l);
for(iter it=itl;it!=itr;it++) it->val+=val;
}
int querySum(int l,int r)
{
iter itr=split(r+1),itl=split(l);
int res=0;
for(iter it=itl;it!=itr;it++)
res+=(it->r-it->l+1)*it->val;
return res;
}
int querySumWithPow(int l,int r,int x,int p)
{
iter itr=split(r+1),itl=split(l);
int res=0;
for(iter it=itl;it!=itr;it++)
(res+=(it->r-it->l+1)*qpow(it->val,x,p))%=p;
return res;
}
int queryKth(int l,int r,int k)
{
vector<PII> vec(0);
iter itr=split(r+1),itl=split(l);
for(iter it=itl;it!=itr;it++)
vec.push_back(make_pair(it->val,it->r-it->l+1));
sort(vec.begin(),vec.end());
for(vector<PII>::iterator it=vec.begin();it!=vec.end();it++)
if((k-=it->second)<=0) return it->first;
return -1;
//note:if there are negative numbers, return another impossible number.
}
signed main()
{
int n=read(),m=read();
seed=read();
int vmax=read();
for(int i=1;i<=n;i++)
{
a[i]=(rnd()%vmax)+1;
st.insert((node){i,i,a[i]});
}
int x,y;
for(int i=1;i<=m;i++)
{
int op=(rnd()%4)+1,l=(rnd()% n)+1,r=(rnd()%n)+1;
if(l>r) swap(l,r);
if(op==3) x=(rnd()%(r-l+1))+1;
else x=(rnd()%vmax)+1;
if(op==4) y=(rnd()% vmax)+1;
if(op==1) add(l,r,x);
else if(op==2) assign(l,r,x);
else if(op==3) printf("%lld\n",queryKth(l,r,x));
else if(op==4) printf("%lld\n",querySumWithPow(l,r,x,y));
}
return 0;
}