并查集

问题

对于有 $n$ 个节点的图，设计一种维护动态连通性问题的数据结构，支持如下操作：

$Find(i)$ - 查询编号为 $i$ 的节点所属的连通分量
$Union(i, j)$ - 连接编号为 $i$ 和 $j$ 的节点（二者所在的连通分量连通）

代码

class UnionFind {
 public:
  UnionFind(int _size) : size(_size) {
    pre = vector<int>(size);
    for (int i = 0; i < size; i++) {
      pre[i] = i;
    }
  }

  int Find(int x) {
    // Find root
    int root = x;
    while (root != pre[root]) {
      root = pre[root];
    }
    // Path compress
    while (x != root) {
      int temp = pre[x];
      pre[x] = root;
      x = temp;
    }
    return root;
  }

  void Join(int x, int y) {
    int root_x = Find(x), root_y = Find(y);
    if (root_x != root_y) {
      pre[root_x] = root_y;
    }
  }

  int Size() { return size; }

 private:
  int size;
  vector<int> pre;
};

算法

数组 $pre$ 记录了每个节点的前导节点。

并查集每次Union操作随机将一个门派的掌门作为另一个门派掌门的直接上级；而每次Find操作在逐层向上找到掌门之后又将路径中所有过程节点都改成掌门的直接下级。所以说，当Union操作的增多会导致树状数据结构趋于不平衡，而Find操作很多的时候，将最终导致所有节点都以掌门为直接上级（汇报距离变成 $1$ ）。