[算法笔记]并查集

并查集是一个非常优雅简洁的,相对高级的数据结构,常常用于元素分组问题。

对于并查集的介绍和推导这里不细说,推荐看Pecco的算法学习笔记。这里主要记录我使用并查集刷题的模板和技巧。

一、什么时候使用并查集?

个人认为并查集可以用在图中,可以用来求取图中的连通分量。当然题目不一定会直接给出图的数据结构,可能是一个二维数组(200. 岛屿数量),也可能是多个互相连接的结点(1319. 连通网络的操作次数)。可以多做几题,体会一下。

二、模板:

class UnionFind {
private:
    vector<int> p, rank;

public:
    UnionFind(int n) {
        for (int i = 0; i < n; ++i) {
            p.push_back(i);
            rank.push_back(0);
        }
    }

    int find(int x) {
        return x == p[x] ? x : (p[x] = find(p[x]));
    }

    void unite(int x, int y) {
        x = find(x), y = find(y);
        if (rank[x] > rank[y]) {
            p[y] = x;
        } else {
            p[x] = y;
        }
        if (x != y && rank[x] == rank[y]) {
            rank[y]++;
        }
    }
};
  • 模板基本类似,只有构造有些许不同。视题目给出的“图”结构的不同而定,这里给出的模板给出的图类似于邻接表,以边为存储单位。如果题目给出的是一个二维数组,那么就类似于邻接矩阵。可以按照下面的模板:
UnionFind(vector<vector<char>>& grid) {
    count = 0;
    int m = grid.size();
    int n = grid[0].size();
    for (int i = 0; i < m; ++i) {
        for (int j = 0; j < n; ++j) {
            if (grid[i][j] == '1') {
                p.push_back(i * n + j);
                ++count;
            }
            else {
                p.push_back(-1);
            }
            rank.push_back(0);
        }
    }
}
  • 总结一下:并查集的p数组一定存储的是结点的父结点,也就是p数组大小就等于题目中图的结点数。

三、心得:

  1. ​ 同处于一个连通分量中的结点i的p[i]不一定相等,即使你使用 路径压缩 进行find操作。因为只有find操作可以将i结点从底向上更新p[i],但是之后可能进行union操作,这时就不能保证p[i]仍然是根结点的值,换句话说,此时根结点不一定就是父结点。

    ​ 因此,如果你想在程序中得到i结点的根结点不要使用p[i],请使用find(i),对它更新。

  2. ​ 如上所述,路径压缩较为重要,而按秩合并作用并不是很大,你也可以不使用:

    void unite(int x, int y) {
        x = find(x), y = find(y);
        p[x] = y;
    }
    
posted @ 2020-11-05 17:26  macguz  阅读(151)  评论(0编辑  收藏  举报