并查集的初级应用及进阶

并查集的初级应用及进阶

一、精华

精华提炼1：

内容：并查集就是树的孩子表示法的应用。

解释：对于下图所示树，它的孩子表示法为：

belg[5]=2, belg[6]=2, belg[7]=2;

belg[2]=1, belg[3]=1, belg[4]=1;

belg[1]=1(也可以=-1,只要能够识别它是根就可以)

精华提炼2：

内容：并查集的孩子父亲表示法中，每个节点与其父亲节点可以添加一个关系属性(必须具有可传递性)。

解释：比如，节点表示一个人，关系属性为一个人的性别。我们先用上图来解释这个关系属性的应用，在后文具体展开。我们可以这样定义，如果节点i和其父节点j性别相同（belg[i]=j），则kind[i]=false, 反之，kind[i]=true，那么如果我们知道kind[5]=true，kind[2]=false，那么5和2的父节点1的关系为kind[5]^kind[2]=true，即他们性别不同。

二、基础

基础1：集合表示

根据精华提炼1，我们把一颗树的节点集合看成以根节点命名的集合，那么上面的集合我们可以认为是集合1。

下图共有两个集合，分别为集合1，集合2。

基础2：元素关系

如何判断元素关系呢？其实，我们只需找出元素对应的集合名称，然后判断名称是否相同即可。寻找集合名称代码如下：

int Find(int x)
{
   while ( belg[x]!=x )
       x = belg[x];
   return x;
}

例如：对于基础1中左图,有belg[5]=2，belg[2]=2。那么5属于集合2。

现在我们已经解决了元素关系问题。

基础3：集合合并

集合如何合并呢？基础2中，我们已经可以找到元素对应集合的名称（即根节点标号），如果元素u、v（u、v不在同一集合）对应的集合名称为_u、_v，那么语句belg[_u]=_v什么意思呢？想到了吧？就是把集合_u与集合_v合并，并且以_v命名。

至此，通过基础部分我们知道了什么是并查集，通过精华提炼部分，我们知道了并查集的高级应用（精华提炼2）。

三、优化

虽然我们已经知道了基础的并查集，但是大家有没有想过简单用上面介绍的集合合并可能造成集合（树）的退化。比如对只有一个元素的集合1到集合n进行下述操作：把集合1合并到集合2，把集合2合并到集合3，…… 把集合n-1合并到集合n，那么生成一个含有n各元素的集合n，它的结构如下：

那么，每次判断n所属集合都要n次操作，即复杂度为O(n)，这个耗费是不是必须的呢？其实不然。

优化1：路径压缩

对于上图退化的集合，它的表示是这样的：belg[n]=n-1， belg[n-1]=n-2， …… belg[2]=1， belg[1]=1；

既然上面元素都属于集合1，那么我们是不是可以这样做呢？belg[n]=1，belg[n-1]=1，……belg[2]=1，belg[1]=1；即把查找n所属集合时形成的路径上的点直接连到根节点上。可以的，因为这样操作只改变集合树的结构，并没有改变这个集合的元素。

关于路径压缩，可以在查找过程中实现，那么对于上述退化树，查找n第一次要n次操作，以后就只需一次操作。实现如下：

版本一：（递归）

int Find(int x)
{
return x==belg[x]?x:(belg[x]=Find(belg[x]));
}

代码很短，递归次数多时，不建议使用。

版本二：（迭代）

int Find(int x)
{
    int _b, _x = x;
    while ( belg[_x]!=_x )
        _x = belg[_x];

    while ( belg[x]!=x )
    {
        _b = belg[x];
        belg[x] = _x;
        x = _b;
    }
    return _x;
}

代码长点，但是少了递归过程，效率高点。

优化2：优化合并

合理的安排合并方式，可以防止退化，例如对于上述退化的例子，我们把元素少的集合合并到元素多的集合上。即集合2合并到集合1，集合3合并到集合1，……集合n合并到集合1，那么产生的树结构为：

不过这个优化代价也很大的，因为要对开一个整型数组来记录集合元素个数，然后，再集合i和集合j合并时，通过判断集合中元素个数来实现合并：

int Union(int i, int j)
{
   if ( sum[i]>sum[j] )
       belg[j] = i;
   else
       belg[i] = j;
}

细心的读者，可能想到这个优化并不能完全避免集合退化，是的，所以我认为不必开辟数组浪费空间进行这个优化，完全可以随机法来由优化，比如：

int Union(int i, int j)

{

if ( rand()&1 )

belg[j] = i;

else

belg[i] = j;

}

通过随机值的奇偶性来决定怎么合并，平均效果是很好的。

上面详细讲了这么多理论性的东西，下面开始介绍应用：

四、应用

基础应用：

题目：

有n个人（1..n），如果i和j是亲戚，j和k是亲戚，那么j和k也是亲戚，题目给定n各人的m对亲戚关系，然后提出q各问题，问你某两个人是不是亲戚。

解答：

并查集简单应用，代码如下：

#include <iostream>
using namespace std;
const int MAXN = 1010;

int belg[MAXN];

int main()
{
    int i, u, v, n, m, q;
    scanf("%d", &n);
    for ( i=1; i<=n; belg[i]=i,++i )
        ;
    scanf("%d", &m);
    for ( i=1; i<=m; ++i )
    {
        scanf("%d%d", &u, &v);
        u = Find(u);
        v = Find(v);
        if ( u!=v )
            Union(u,v);
    }
    scanf("%d", &q);

    for ( i=1; i<=q; ++i )
    {
        scanf("%d%d", &u, &v);
        u = Find(u);
        v = Find(v);
        printf("%s\n", (u==v?"YES":"NO"));
    }
    return 0;
}

其中Find函数和Union函数参见上面的介绍。

高级应用：

题目：（HDU1829）

有n各小动物，它们只有异性之间才配对，同性之间不会配对。给定m对配对关系，问你是否能通过分配性别给n各小动物，使这m各配对关系成立，即不会出现同性之间配对。

解答：

这里我们使用在精华提炼二中提到的思路。

首先，我们必须明确两点：1.这里的属于同一个集合的元素表示他们的关系已经确定，比如元素i和元素j属于同一个集合，那么他们要么同性，要么异性，关系时确定的。2.同一个集合的树表示中，节点i和它的父亲节点j关系存储在kind[i]中。

同时，我们约定，如果节点i和节点j性别相同，则关系为false，否则关系为true。根节点root满足kind[root]=false，因为自己跟自己性别肯定相同（当然不包括人妖了哈^-^）。

关系的运算我们可以通过异或（提示1）来实现，如果i和j关系为r1，i和k关系为r2，那么j和k关系为r1^r2。

上面的分析已经足够我们处理这个题目了。下面给出代码：

#include <iostream>
using namespace std;

const int MAXN = 2010;
int   belg[MAXN];
bool kind[MAXN];
int Find(int x, bool &s);

int main()
{
    int   i, k, n, m;
    int   u, v, _u, _v, cas;
    bool flag, su, sv;
    scanf("%d", &cas);
    for ( k=1; k<=cas; ++k )
    {
        scanf("%d%d", &n, &m);
        for ( i=1; i<=n; ++i )
        {
            belg[i] = i;
            kind[i] = false;
        }

        for ( i=1,flag=true; i<=m; ++i )
        {
            scanf("%d%d", &u, &v);
            if ( flag )
            {
                _u = Find(u,su=false);
                _v = Find(v,sv=false);

                if ( _u==_v )
                {
                    flag = su^sv;
                }
                else
                {
                    belg[_u] = _v;
                    kind[_u] = !(su^sv);
                }
            }
        }
        printf("Scenario #%d:\n", k);
        if ( flag )
        {
            printf("No suspicious bugs found!\n\n");
        }
        else
        {
            printf("Suspicious bugs found!\n\n");
        }
    }
    return 0;
}

int Find(int x, bool &s)
{
    int h;
    if ( belg[x]==x )
    {
        h = x; s = false;
    }
    else
    {
        h = Find(belg[x],s);
        belg[x] = h;
        s = kind[x]^s;
        kind[x] = s;
    }

    return h;

}

由于上述Find函数使用了递归所以比较耗时（1609毫秒，132KB），可以改为如下的迭代形式（671毫秒，0KB）：

int Find(int x, bool &s)
{
    int _x, h = x;
    bool s1, s2;
    while ( belg[h]!=h )
    {
        s = s^kind[h];
        h = belg[h];
    }
    s1 = s;
    while ( belg[x]!=x )
    {
        _x = belg[x];
        belg[x] = h;
        s2 = kind[x];
        kind[x] = s1;
        s1 = s1^s2;
        x = _x;
    }
    return h;
}

提示1.异或：i和j异或就是：如果i和j相同则为false，否则为true，比如i=true，j=false，则i异或j为true。i=false，j=false，则i异或j为false。

发表于 2009-04-15 13:46 DreamSky 阅读(492) 评论(0) 编辑收藏引用所属分类: 并查集

公告

导航

统计

常用链接

留言簿(6)

随笔分类

随笔档案

文章分类

文章档案

相册

百事百通

搜索

积分与排名

最新评论

阅读排行榜

评论排行榜