并查集的初级应用及进阶

一、精华

精华提炼1

 内容:并查集就是树的孩子表示法的应用。

 解释:对于下图所示树,它的孩子表示法为:

       

                   

             belg[5]=2, belg[6]=2, belg[7]=2;

             belg[2]=1, belg[3]=1, belg[4]=1;

             belg[1]=1(也可以=-1,只要能够识别它是根就可以)

精华提炼2

   内容:并查集的孩子父亲表示法中,每个节点与其父亲节点可以添加一个关系属性(必须具有可传递性)

   解释:比如,节点表示一个人,关系属性为一个人的性别。我们先用上图来解释这个关系属性的应用,在后文具体展开。我们可以这样定义,如果节点i和其父节点j性别相同(belg[i]=j),则kind[i]=false, 反之,kind[i]=true,那么如果我们知道kind[5]=truekind[2]=false,那么52的父节点1的关系为kind[5]^kind[2]=true,即他们性别不同。 

 

二、基础

基础1:集合表示

根据精华提炼1,我们把一颗树的节点集合看成以根节点命名的集合,那么上面的集合我们可以认为是集合1

下图共有两个集合,分别为集合1,集合2

 

            

基础2:元素关系

    如何判断元素关系呢?其实,我们只需找出元素对应的集合名称,然后判断名称是否相同即可。寻找集合名称代码如下:

 

int Find(int x)
{
   
while ( belg[x]!=x )
       x 
= belg[x];
   
return x;
}

 

例如:对于基础1中左图,belg[5]=2belg[2]=2。那么5属于集合2

    现在我们已经解决了元素关系问题。

基础3:集合合并

集合如何合并呢?基础2中,我们已经可以找到元素对应集合的名称(即根节点标号),如果元素uvuv不在同一集合)对应的集合名称为_u_v,那么语句belg[_u]=_v什么意思呢?想到了吧?就是把集合_u与集合_v合并,并且以_v命名。

 

至此,通过基础部分我们知道了什么是并查集,通过精华提炼部分,我们知道了并查集的高级应用(精华提炼2)。

 

三、优化

虽然我们已经知道了基础的并查集,但是大家有没有想过简单用上面介绍的集合合并可能造成集合(树)的退化。比如对只有一个元素的集合1到集合n进行下述操作:把集合1合并到集合2,把集合2合并到集合3,…… 把集合n-1合并到集合n,那么生成一个含有n各元素的集合n,它的结构如下:

 

 

那么,每次判断n所属集合都要n次操作,即复杂度为O(n),这个耗费是不是必须的呢?其实不然。

优化1:路径压缩

对于上图退化的集合,它的表示是这样的:belg[n]=n-1 belg[n-1]=n-2, …… belg[2]=1 belg[1]=1

既然上面元素都属于集合1,那么我们是不是可以这样做呢?belg[n]=1belg[n-1]=1,……belg[2]=1belg[1]=1;即把查找n所属集合时形成的路径上的点直接连到根节点上。可以的,因为这样操作只改变集合树的结构,并没有改变这个集合的元素。

关于路径压缩,可以在查找过程中实现,那么对于上述退化树,查找n第一次要n次操作,以后就只需一次操作。实现如下:

版本一:(递归)

 

int Find(int x)
{
  
return x==belg[x]?x:(belg[x]=Find(belg[x]));
}

 

代码很短,递归次数多时,不建议使用。

版本二:(迭代)

 

int Find(int x)
{
    
int _b, _x = x;
    
while ( belg[_x]!=_x )
        _x 
= belg[_x];      

    
while ( belg[x]!=x )
    
{
        _b 
= belg[x];
        belg[x] 
= _x;
        x 
= _b;
    }

    
return _x;
}

 

       代码长点,但是少了递归过程,效率高点。

优化2:优化合并

     合理的安排合并方式,可以防止退化,例如对于上述退化的例子,我们把元素少的集合合并到元素多的集合上。即集合2合并到集合1,集合3合并到集合1,……集合n合并到集合1,那么产生的树结构为:

 

 

不过这个优化代价也很大的,因为要对开一个整型数组来记录集合元素个数,然后,再集合i和集合j合并时,通过判断集合中元素个数来实现合并:

 

int Union(int i, int j)
{
   
if ( sum[i]>sum[j] )
       belg[j] 
= i;
   
else
       belg[i] 
= j;
}

 

细心的读者,可能想到这个优化并不能完全避免集合退化,是的,所以我认为不必开辟数组浪费空间进行这个优化,完全可以随机法来由优化,比如:

 

int Union(int i, int j)
{
   
if ( rand()&1 )
      belg[j] 
= i;
   
else
      belg[i] 
= j;
}

 

通过随机值的奇偶性来决定怎么合并,平均效果是很好的。 

上面详细讲了这么多理论性的东西,下面开始介绍应用:

四、应用

基础应用:

题目:

    n个人(1..n),如果ij是亲戚,jk是亲戚,那么jk也是亲戚,题目给定n各人的m对亲戚关系,然后提出q各问题,问你某两个人是不是亲戚。

解答:

    并查集简单应用,代码如下:

 

#include <iostream>
using namespace std;
const int MAXN = 1010;

int belg[MAXN];

int main()
{
    
int i, u, v, n, m, q;
    scanf(
"%d"&n);
    
for ( i=1; i<=n; belg[i]=i,++i )
        ;
    scanf(
"%d"&m);
    
for ( i=1; i<=m; ++i )
    
{
        scanf(
"%d%d"&u, &v);
        u 
= Find(u); 
        v 
= Find(v);
        
if ( u!=v ) 
            Union(u,v); 
    }

    scanf(
"%d"&q);

    
for ( i=1; i<=q; ++i )
    
{
        scanf(
"%d%d"&u, &v);
        u 
= Find(u); 
        v 
= Find(v);
        printf(
"%s\n", (u==v?"YES":"NO"));
    }

    
return 0
}

其中Find函数和Union函数参见上面的介绍。

 

高级应用:

题目:(HDU1829

n各小动物,它们只有异性之间才配对,同性之间不会配对。给定m对配对关系,问你是否能通过分配性别给n各小动物,使这m各配对关系成立,即不会出现同性之间配对。

解答:

这里我们使用在精华提炼二中提到的思路。

    首先,我们必须明确两点:1.这里的属于同一个集合的元素表示他们的关系已经确定,比如元素i和元素j属于同一个集合,那么他们要么同性,要么异性,关系时确定的。2.同一个集合的树表示中,节点i和它的父亲节点j关系存储在kind[i]中。

同时,我们约定,如果节点i和节点j性别相同,则关系为false,否则关系为true。根节点root满足kind[root]=false,因为自己跟自己性别肯定相同(当然不包括人妖了哈^-^)。

关系的运算我们可以通过异或(提示1)来实现,如果ij关系为r1ik关系为r2,那么jk关系为r1^r2

上面的分析已经足够我们处理这个题目了。下面给出代码:

 

#include <iostream>
using namespace std;

const int MAXN = 2010;
int   belg[MAXN];
bool kind[MAXN];
int Find(int x, bool &s);

int main()
{
    
int   i, k, n, m;
    
int   u, v, _u, _v, cas;
    
bool flag, su, sv;
    scanf(
"%d"&cas);
    
for ( k=1; k<=cas; ++k )
    
{
        scanf(
"%d%d"&n, &m);
        
for ( i=1; i<=n; ++i )
        
{
            belg[i] 
= i;
            kind[i] 
= false;
        }


        
for ( i=1,flag=true; i<=m; ++i )
        
{
            scanf(
"%d%d"&u, &v);
            
if ( flag )
            
{
                _u 
= Find(u,su=false);
                _v 
= Find(v,sv=false);

                
if ( _u==_v )
                
{
                    flag 
= su^sv;
                }

                
else
                
{
                    belg[_u] 
= _v;
                    kind[_u] 
= !(su^sv);
                }

            }

        }

        printf(
"Scenario #%d:\n", k);
        
if ( flag ) 
        
{
            printf(
"No suspicious bugs found!\n\n");
        }

        
else
        
{
            printf(
"Suspicious bugs found!\n\n");
        }

    }

    
return 0;
}


int Find(int x, bool &s)
{
    
int h; 
    
if ( belg[x]==x )
    
{
        h 
= x; s = false;    
    }

    
else
    
{
        h 
= Find(belg[x],s);
        belg[x] 
= h;
        s 
= kind[x]^s;
        kind[x] 
= s;
    }


 

    
return h;

}

 

    由于上述Find函数使用了递归所以比较耗时(1609毫秒,132KB),可以改为如下的迭代形式(671毫秒,0KB):

 

int Find(int x, bool &s)
{
    
int _x, h = x;
    
bool s1, s2;
    
while ( belg[h]!=h )
    
{
        s 
= s^kind[h];
        h 
= belg[h];        
    }
 
    s1 
= s;
    
while ( belg[x]!=x )
    
{
        _x 
= belg[x];
        belg[x] 
= h;
        s2 
= kind[x];
        kind[x] 
= s1;
        s1 
= s1^s2;
        x 
= _x;
    }

    
return h;
}

 

提示1.异或:ij异或就是:如果ij相同则为false,否则为true,比如i=truej=false,则i异或jtruei=falsej=false,则i异或jfalse