kdtree学习记录

【转载请注明来自 Galaxies的博客:http://cnblogs.com/galaxies

这篇文章当做一个记录啦qwq

参考:《K-D Tree在信息学竞赛中的应用》(n+e, 2016-07-31)

 

一棵二叉树(类似于BST二叉排序树)来维护一个k维空间。每个节点表示的是一个k维空间的区域。

每个节点还存储这一个具体的点,以它的某个坐标来划分出两个k维的空间,为这个节点的儿子所代表的区域。

我们姑且称这个具体的点为代表点

啥意思呢?

struct node {
    int d[K], mx[K], mi[K], l, r;
    ...
};

d[K]表示这个节点的代表点。这个节点存储的信息是一个K维空间:

第1维 [mi[0], mx[0]];第2维 [mi[1], mx[1]];...;第K维 [mi[K], mx[K]]

l和r存储的是按照代表点的某个坐标来进行划分的两个k维的空间。

为了使得区间平均,我们通常采用按照每个坐标轮流划分。

比如:平面,那么就是2维空间,依次按照 横、纵、横、纵、……划分

3维空间,依次按照 横、纵、高、横、纵、高、……划分

这样可以使得划分出来的空间尽量平均。

比如一个平面的划分方案如下,右图为对应的K-D Tree

 

划分的过程中,我们需要找到一个代表点,这个代表点通常选取按用来划分的坐标排序的中位数这个点。

STL有一个方便的nth_element可以实现这个功能。

构造应该比较简单?不放代码啦。

然后是插入一个点。

从根往下比较,跟BST类似,就能找到插入的位置了。

下面是一个二维的示范,up里面可以维护信息,“。。。”里面就是把信息扔到K-D Tree的过程。

以下代码如果没有特别说明,ls为T[x].l;rs为T[x].r(预define了)

inline void insert(int &x, int d) {
    if(!x) {
        x = ++siz;
        T[x].d[0] = T[x].mi[0] = T[x].mx[0] = tmp.d[0];
        T[x].d[1] = T[x].mi[1] = T[x].mx[1] = tmp.d[1];
    }
    if(tmp == T[x]) {
        ...
        return ;
    }
    if(tmp.d[d] < T[x].d[d]) insert(ls, d^1);
    else insert(rs, d^1);
    up(x);
}

然后你需要查询一个k维空间的值,就看是否完全包含/完全不包含

如果以上两类都可以直接回答。否则递归。

inline int query(int x, int x1, int y1, int x2, int y2) {
    if(!x) return 0;
    int ret = 0;
    if(in(x1, y1, x2, y2, T[x].mi[0], T[x].mi[1], T[x].mx[0], T[x].mx[1])) return ...
    if(out(x1, y1, x2, y2, T[x].mi[0], T[x].mi[1], T[x].mx[0], T[x].mx[1])) return 0;
    if(in(x1, y1, x2, y2, T[x].d[0], T[x].d[1], T[x].d[0], T[x].d[1])) ret += ...;
    ret += query(ls, x1, y1, x2, y2) + query(rs, x1, y1, x2, y2);
    return ret;
}

上面是一个二维的例子,“。。。”里面可以自行维护需要的东西。

然后我们发现如果K-D Tree的一个区间被插入了好多次那么复杂度会退化(BST没有带平衡)

解决这个问题的办法有两个:

一个比较暴力,就是我的K-D Tree的节点个数达到阈值SIZE的整数倍的时候,就把K-D Tree的节点拎出来,重构K-D Tree即可。

阈值3000-10000(大概

这是一个二维的例子,t里存的是拎出来的旧节点。

inline int rebuild(int l, int r, int d) {
    if(l>r) return 0;
    int mid = l+r>>1; D = d;
    nth_element(t+l, t+mid, t+r+1);
    T[mid] = t[mid];
    T[mid].l = rebuild(l, mid-1, d^1);
    T[mid].r = rebuild(mid+1, r, d^1);
    up(mid);
    return mid;
}

还有一个办法,就是

这个复杂度是对的,就是写起来还要多维护一个size,我这么懒的人肯定是留着坑以后再说啊。。

(不过前面一个复杂度也是对的吧)

对于一些问题的估价:

比如我要询问(x,y)到平面上哪个点欧几里得距离最小啊之类的。

距离最小:一个点离当前域的最小距离(在域内为0)

距离最大:一个点离当前域的最大距离

常见估价:(可以理解)

那么询问(x,y)离哪个点xx距离最小的话。。

就是看看估价,优先访问估价低的。如果最小可能距离都比当前答案大,就不用取管了。

复杂度O(logn)(随机),O(根号n)(构造)

kdtree估价例题:http://www.cnblogs.com/galaxies/p/bzoj2648.html

反正。。挺优秀的。

K-D Tree还可以代替很多类似什么三维偏序啊之类的为题

K维K-D Tree的查询复杂度约为O(n^(1-1/k))

那么可持久化树套树(三维空间的求值)就能在O(n^(5/3))的时间内求出来啊!

论写优秀暴力的重要性。

好了大概讲这么多(去睡觉啦qwq

有空再更 

 

posted @ 2017-05-04 23:58  Galaxies  阅读(637)  评论(0编辑  收藏  举报