[算法笔记]并查集

并查集是一个非常优雅简洁的，相对高级的数据结构，常常用于元素分组问题。

对于并查集的介绍和推导这里不细说，推荐看Pecco的算法学习笔记。这里主要记录我使用并查集刷题的模板和技巧。

一、什么时候使用并查集？

个人认为并查集可以用在图中，可以用来求取图中的连通分量。当然题目不一定会直接给出图的数据结构，可能是一个二维数组（200. 岛屿数量），也可能是多个互相连接的结点（1319. 连通网络的操作次数）。可以多做几题，体会一下。

二、模板：

class UnionFind {
private:
    vector<int> p, rank;

public:
    UnionFind(int n) {
        for (int i = 0; i < n; ++i) {
            p.push_back(i);
            rank.push_back(0);
        }
    }

    int find(int x) {
        return x == p[x] ? x : (p[x] = find(p[x]));
    }

    void unite(int x, int y) {
        x = find(x), y = find(y);
        if (rank[x] > rank[y]) {
            p[y] = x;
        } else {
            p[x] = y;
        }
        if (x != y && rank[x] == rank[y]) {
            rank[y]++;
        }
    }
};

模板基本类似，只有构造有些许不同。视题目给出的“图”结构的不同而定，这里给出的模板给出的图类似于邻接表，以边为存储单位。如果题目给出的是一个二维数组，那么就类似于邻接矩阵。可以按照下面的模板：

UnionFind(vector<vector<char>>& grid) {
    count = 0;
    int m = grid.size();
    int n = grid[0].size();
    for (int i = 0; i < m; ++i) {
        for (int j = 0; j < n; ++j) {
            if (grid[i][j] == '1') {
                p.push_back(i * n + j);
                ++count;
            }
            else {
                p.push_back(-1);
            }
            rank.push_back(0);
        }
    }
}

总结一下：并查集的p数组一定存储的是结点的父结点，也就是p数组大小就等于题目中图的结点数。

三、心得：

同处于一个连通分量中的结点i的p[i]不一定相等，即使你使用 路径压缩 进行find操作。因为只有find操作可以将i结点从底向上更新p[i]，但是之后可能进行union操作，这时就不能保证p[i]仍然是根结点的值，换句话说，此时根结点不一定就是父结点。

因此，如果你想在程序中得到i结点的根结点，不要使用p[i]，请使用find(i)，对它更新。
如上所述，路径压缩较为重要，而按秩合并作用并不是很大，你也可以不使用：
```
void unite(int x, int y) {
    x = find(x), y = find(y);
    p[x] = y;
}
```

posted @ 2020-11-05 17:26 macguz 阅读(151) 评论(0) 编辑收藏举报

刷新页面返回顶部

[算法笔记]并查集

一、什么时候使用并查集？

二、模板：

三、心得：

公告