kdtree学习记录

【转载请注明来自 Galaxies的博客：http://cnblogs.com/galaxies】

这篇文章当做一个记录啦qwq

参考：《K-D Tree在信息学竞赛中的应用》（n+e, 2016-07-31）

一棵二叉树（类似于BST二叉排序树）来维护一个k维空间。每个节点表示的是一个k维空间的区域。

每个节点还存储这一个具体的点，以它的某个坐标来划分出两个k维的空间，为这个节点的儿子所代表的区域。

我们姑且称这个具体的点为代表点。

啥意思呢？

struct node {
    int d[K], mx[K], mi[K], l, r;
    ...
};

d[K]表示这个节点的代表点。这个节点存储的信息是一个K维空间：

第1维 [mi[0], mx[0]]；第2维 [mi[1], mx[1]]；...；第K维 [mi[K], mx[K]]

l和r存储的是按照代表点的某个坐标来进行划分的两个k维的空间。

为了使得区间平均，我们通常采用按照每个坐标轮流划分。

比如：平面，那么就是2维空间，依次按照横、纵、横、纵、……划分

3维空间，依次按照横、纵、高、横、纵、高、……划分

这样可以使得划分出来的空间尽量平均。

比如一个平面的划分方案如下，右图为对应的K-D Tree

划分的过程中，我们需要找到一个代表点，这个代表点通常选取按用来划分的坐标排序的中位数这个点。

STL有一个方便的nth_element可以实现这个功能。

构造应该比较简单？不放代码啦。

然后是插入一个点。

从根往下比较，跟BST类似，就能找到插入的位置了。

下面是一个二维的示范，up里面可以维护信息，“。。。”里面就是把信息扔到K-D Tree的过程。

以下代码如果没有特别说明，ls为T[x].l；rs为T[x].r（预define了）

inline void insert(int &x, int d) {
    if(!x) {
        x = ++siz;
        T[x].d[0] = T[x].mi[0] = T[x].mx[0] = tmp.d[0];
        T[x].d[1] = T[x].mi[1] = T[x].mx[1] = tmp.d[1];
    }
    if(tmp == T[x]) {
        ...
        return ;
    }
    if(tmp.d[d] < T[x].d[d]) insert(ls, d^1);
    else insert(rs, d^1);
    up(x);
}

然后你需要查询一个k维空间的值，就看是否完全包含/完全不包含

如果以上两类都可以直接回答。否则递归。

inline int query(int x, int x1, int y1, int x2, int y2) {
    if(!x) return 0;
    int ret = 0;
    if(in(x1, y1, x2, y2, T[x].mi[0], T[x].mi[1], T[x].mx[0], T[x].mx[1])) return ...
    if(out(x1, y1, x2, y2, T[x].mi[0], T[x].mi[1], T[x].mx[0], T[x].mx[1])) return 0;
    if(in(x1, y1, x2, y2, T[x].d[0], T[x].d[1], T[x].d[0], T[x].d[1])) ret += ...;
    ret += query(ls, x1, y1, x2, y2) + query(rs, x1, y1, x2, y2);
    return ret;
}

上面是一个二维的例子，“。。。”里面可以自行维护需要的东西。

然后我们发现如果K-D Tree的一个区间被插入了好多次那么复杂度会退化（BST没有带平衡）

解决这个问题的办法有两个：

一个比较暴力，就是我的K-D Tree的节点个数达到阈值SIZE的整数倍的时候，就把K-D Tree的节点拎出来，重构K-D Tree即可。

阈值3000-10000（大概

这是一个二维的例子，t里存的是拎出来的旧节点。

inline int rebuild(int l, int r, int d) {
    if(l>r) return 0;
    int mid = l+r>>1; D = d;
    nth_element(t+l, t+mid, t+r+1);
    T[mid] = t[mid];
    T[mid].l = rebuild(l, mid-1, d^1);
    T[mid].r = rebuild(mid+1, r, d^1);
    up(mid);
    return mid;
}

还有一个办法，就是

这个复杂度是对的，就是写起来还要多维护一个size，我这么懒的人肯定是留着坑以后再说啊。。

（不过前面一个复杂度也是对的吧）

对于一些问题的估价：

比如我要询问(x,y)到平面上哪个点欧几里得距离最小啊之类的。

距离最小：一个点离当前域的最小距离（在域内为0）

距离最大：一个点离当前域的最大距离

常见估价：（可以理解）

那么询问(x,y)离哪个点xx距离最小的话。。

就是看看估价，优先访问估价低的。如果最小可能距离都比当前答案大，就不用取管了。

复杂度O(logn)（随机），O(根号n)（构造）

kdtree估价例题：http://www.cnblogs.com/galaxies/p/bzoj2648.html

反正。。挺优秀的。

K-D Tree还可以代替很多类似什么三维偏序啊之类的为题

K维K-D Tree的查询复杂度约为O(n^(1-1/k))

那么可持久化树套树（三维空间的求值）就能在O(n^(5/3))的时间内求出来啊！

论写优秀暴力的重要性。

好了大概讲这么多（去睡觉啦qwq

有空再更

posted @ 2017-05-04 23:58 Galaxies 阅读(646) 评论(0) 收藏举报

刷新页面返回顶部

逢山开路遇水架桥

尽人事，听天命。

kdtree学习记录

公告

逢山开路 遇水架桥

尽人事，听天命。

kdtree学习记录

公告

逢山开路遇水架桥