K-DTree入门

\(K-D Tree\),一种用来维护\(K\)维数据的数据结构。常用于维护各种高维的数据,或者是邻近搜索等。从另一种意义上说,实际上就是高维的二叉搜索树。对于一些常见的问题,如\(k\)远点对、三位偏序(在线)等,可以用\(K-DTree\)解决。

那么,\(KDT\)如何建树呢?

观察一下普通的二叉搜索树,发现它的每一个节点都有一个“关键字",用它来划分左右儿子。于是,对于高维的数据,我们考虑分层划分。

比如对于点\((x,y)\),它有两层维度。那么,我们可以在第一层用\(x\)划分,第二层用\(y\)划分,第三层用\(x\)划分,依次迭代。也可以用随机数的方法,随机划分。

对于第\(i\)层维度,我们对它的维度编号是\(i-1\).

接下来考虑如何实现建树。

首先,这个树上得维护一些东西,要不然就没啥意义了。对于一个节点,我们首先要知道它所管辖的区域有哪些。那么对于\(k\)维的数据,我们定义树中维护两个数组:

\(int\) \(mi[k],mx[k]\)来维护每一层它所能维护到的上界和下界。

其次,我们可以用\(siz\)来维护它的子树大小(用于重构),以及题目中要求的信息。

对于区间\([l,r]\),我们依旧是按照套路,将它划分为左右两个区间,并分别递归。

注意选择每个点中管辖的区域中哪个点做根的时候,比较优的是中位数。于是,我们建树的时候,就优先使用中位数来做这个孩子的点,就是所谓这颗子树的\(rt\)点。

那么,怎么找中位数呢?\(k\)维,每一层都做一次\(sort\),那不得炸上天?

这样的复杂度是\(O(knlogn)\)的(一本正经地瞎蒙)

所以我们考虑换一个方式。\(STL\)自然会给我们另一条路的:\(nth\)_\(element\)函数就可以满足我们的需求。

它可以做到对于一个\([l,r]\)的序列,用\(O(n)\)的时间,使得我们所选择的的那个位置\(pos\)上处于合适的数字。但是注意,除了这个位置上,其它位置上没有被排序。

但是我们只需要这么多就够了,不是吗?

用它的时候,别忘了重载一下运算符。

于是,\(build\)建树的代码就呼之欲出了……

int build(int l,int r,int d){
	if(l>r)return 0;
	int x=++tot,mid=l+r>>1;
	D=d;nth_element(p+l,p+mid,p+r+1);
	tr[x].c=p[mid];ls[x]=build(l,mid-1,d^1);
	rs[x]=build(mid+1,r,d^1);pushup(x);return x;
}

还记得当初学那些什么乱七八糟的平衡树的时候,总会有不平衡的情况。同样地,\(KDT\)也可以支持动态插入,而不平衡也是我们要解决的问题之一。

相信各位听过一句话:优美的暴力(逃)

记得有个东西叫替罪羊树吗,里面有个东东叫重构。我们引入它的概念,来实现\(KDT\)的平衡。

设定平衡因子\(Alpha\),来检测是否不平衡,不平衡则重建。记住,数据维度要对应上。

对于空间,开一个垃圾桶(雾),保存删掉的节点的编号,循环利用一下。

下面给出这部分代码:

inline int New(){
	if(top)return rub[top--];
	else return ++tot;
}
inline int build(int l,int r,int d){
	if(l>r)return 0;
	int x=New(),mid=l+r>>1;
	D=d;nth_element(p+l,p+mid,p+r+1);
	tr[x].c=p[mid];ls[x]=build(l,mid-1,d^1);
	rs[x]=build(mid+1,r,d^1);pushup(x);return x;
}
inline void clear(int x,int pos){
	if(ls[x])clear(ls[x],pos);
	p[pos+tr[ls[x]].siz+1]=tr[x].c;rub[++top]=x;
	if(rs[x])clear(rs[x],pos+tr[ls[x]].siz+1);
}
inline void check(int &x,int d){
	double C=A*(double)(tr[x].siz);
	if(C<(double)(tr[ls[x]].siz)||C<(double)(tr[rs[x]].siz)){
		clear(x,0);
		x=build(1,tr[x].siz,d);
	}
}
inline void Ins(int &x,point p,int d){
	if(!x){x=New();ls[x]=rs[x]=0;tr[x].c=p;pushup(x);return;}
	if(p.x[d]<=tr[x].c.x[d])Ins(ls[x],p,d^1);
	else Ins(rs[x],p,d^1);
	pushup(x);check(x,d);
}

里面的\(A\)就是阿尔法。

好了,现在看看它都(干了些什么)能干什么吧。

例题:\(K\)远点对#

求出\(n\)个点中,对于指定点,第\(k\)大的欧氏距离的平方。

这玩意,用一个堆和\(KDT\)结合就好了。

对于第\(k\)大,堆里面\(push\)\(2k\)个0.因为,对于每个点,我找到的都是不定向的,所以同一个点会两次被搜到。于是,堆要到\(2k\).

对于每一次搜到的答案,和堆顶比较,如果大就放进去,并去掉堆尾,并以每一次的答案去搜索左右子树(没错,它是靠剪枝吃饭哒)

对于一个点到管辖范围的查询……意会即可(雾

#include<cstdio>
#include<iostream>
#include<cstring>
#include<algorithm>
#include<queue>
#include<string>
using namespace std;
#define inf 192608170000000ll 
typedef long long ll;
ll read(){
    ll x=0,pos=1;char ch=getchar();
    for(;!isdigit(ch);ch=getchar()) if(ch=='-') pos=0;
    for(;isdigit(ch);ch=getchar()) x=(x<<1)+(x<<3)+ch-'0';
    return pos?x:-x;
} 
const ll MAXN=2e5+10;
ll n,k;
struct point{
	ll x[2];
}p[MAXN];
struct cmp{
	ll operator()(ll a,ll b){
		return a>b;
	}
};
priority_queue<ll,vector<ll>,cmp>q;
struct node{
	ll minn[2],maxn[2],siz;
	point c;
}tr[MAXN];
ll rt,D,rs[MAXN],ls[MAXN];
ll operator<(point a,point b){return a.x[D]<b.x[D];}
inline void pushup(ll x){
	ll l=ls[x],r=rs[x];
	tr[x].siz=tr[l].siz+tr[r].siz+1;
	for(register int i=0;i<=1;++i){
		tr[x].minn[i]=tr[x].maxn[i]=tr[x].c.x[i];
		if(l)tr[x].minn[i]=min(tr[x].minn[i],tr[l].minn[i]),tr[x].maxn[i]=max(tr[x].maxn[i],tr[l].maxn[i]);
		if(r)tr[x].minn[i]=min(tr[x].minn[i],tr[r].minn[i]),tr[x].maxn[i]=max(tr[x].maxn[i],tr[r].maxn[i]);
	}
}
ll tot;
void build(ll &x,ll l,ll r,ll d){
	if(l>r)return;
	x=++tot;
	ll mid=l+r>>1;
	D=d;nth_element(p+l,p+mid,p+r+1);
	tr[x].c=p[mid];
	build(ls[x],l,mid-1,d^1);
	build(rs[x],mid+1,r,d^1);
	pushup(x);
}
inline ll abs(ll a){return a>0?a:-a;}
ll dis(point a,point b){return (a.x[0]-b.x[0])*(a.x[0]-b.x[0])+(a.x[1]-b.x[1])*(a.x[1]-b.x[1]);}
ll dissqr(point top,ll a){
	ll di=0;
	for(int i=0;i<=1;++i){
		ll nd=0;
		if(top.x[i]<tr[a].minn[i])
			nd=tr[a].maxn[i]-top.x[i];
		else if(top.x[i]>tr[a].maxn[i])
			nd=top.x[i]-tr[a].minn[i];
		else nd=max(top.x[i]-tr[a].minn[i],tr[a].maxn[i]-top.x[i]);
		di+=nd*nd;
	}
	return di;
}
void query(ll x,point top){
	ll di=dis(tr[x].c,top);
	if(di>q.top())q.pop(),q.push(di);
	ll l=ls[x],r=rs[x],dl,dr;
	dl=l?dissqr(top,l):-inf,dr=r?dissqr(top,r):-inf;
	if(dl>dr){
		if(dl>q.top())query(l,top);
		if(dr>q.top())query(r,top);
	}
	else{
		if(dr>q.top())query(r,top);
		if(dl>q.top())query(l,top);
	}
}
int main(){
	n=read(),k=read();
	for(int i=1;i<=n;++i)p[i].x[0]=read(),p[i].x[1]=read();
	build(rt,1,n,0);
	for(int i=1;i<=k+k;++i)q.push(0);
	for(int i=1;i<=n;++i)query(rt,p[i]);
	printf("%lld\n",q.top());
	return 0;
}

讲了一下kdt的重构等,也没多少啊qwq,留几个题吧

\(Luogu-P2479\)

\(Luogu-P4357\)

\(Luogu-P4475\)

\(Luogu-P4169\)

\(Luogu-P4390\)

\(Luogu-P4148\)

\(Luogu-P3769\)

够了不qwq

题解2479

题解4475

题解4148

题解3769

posted @ 2019-12-02 19:12  Refined_heart  阅读(442)  评论(4编辑  收藏  举报