平衡二叉树(解惑)

平衡二叉树定义(AVL):它或者是一颗空树,或者具有以下性质的二叉树:它的左子树和右子树的深度之差的绝对值不超过1,且它的左子树和右子树都是一颗平衡二叉树。

平衡因子(bf):结点的左子树的深度减去右子树的深度,那么显然-1<=bf<=1;

很显然,平衡二叉树是在二叉排序树(BST)上引入的,就是为了解决二叉排序树的不平衡性导致时间复杂度大大下降,那么AVL就保持住了(BST)的最好时间复杂度O(logn),所以每次的插入和删除都要确保二叉树的平衡,那么怎么保持平衡呢?

我努力看了看数据结构上的讲解,但是看的只晕+_+!我对他的讲解很无语,他所谓的“旋转”操作讲的不明不白,看的我气的蛋疼!你说你旋转,你得说清是如何旋转?以那个结点为中心,那些或者说那个结点转了,那些结点不动。你就在哪里旋转来旋转去的,谁知道你是咋转的,你在哪慢慢转吧!哥转不过你,另找高明!于是在网上找啊找,只为想搞明白是到底怎么转的!点击打开链接让我对“旋转”有所领悟,表示感谢!

 

插入时:

那究竟是如何“转”的呢?

 

首先必须明白一个核心操作,不让它叫“旋转”!而叫——>“两个结点的变换”

如图:

就拿第一个来说->点100和101的变换:

点101占据点100的位置,点100换到了101的对面的位置,其他点的相对位置不变。

我们可以更直观的理解为:把101结点“上提”一下!

分析:101>100,所以100可以作为101的左孩子;

也就是在二叉排序树中,两个结点这样的变换操作是可行的,是符合二叉排序树的性质。

不仅这个简单的图,任何复杂的二叉排序树都可以,你可以试试,也许你会说如果点101左边有孩子怎么办?别着急~,当然有办法!

 

下边正式说这个图的四种不平衡情况(插入时)及操作:

首先还需要明白一个概念->最小不平衡子树的根结点:也就是当你进行插入操作时,找到该需要插入结点的位置并插入后,从该结点起向上寻找(回溯),第一个不平衡的结点即平衡因子bf变为-2或2。

为什么要引入这个最小不平衡根结点的概念,因为在插入时,对该子树进行保持平衡操作后,其它的结点的平衡因子不会变,也就是整棵树又恢复平衡了。为什么呢?

你想想不平衡点的bf一定是-2或2吧,经过平衡操作后,他会把一边子树的一个结点分给另一边的子树,也就是一边的深度分给另一边,这样就平衡了!

比如,插入前:左边是深度1,右边深度是0;插入后左边深度是2,右边深度是0,经过平衡后左边深度是1,右边深度是1;

那么你说插入前和插入后该根结点所领导的子树的深度变没??仍是1,显然没变!那么就仍保持了这棵树的平衡了!

 

下面即四种情况分别为:左左、右右、左右、右左,每种情况又有两个图:①、②,①是该情况的最简单的图形,②是该情况的一般的图形;

设x为最小不平衡子树的根结点,y为刚插入的点

 

左左:

即在x的左孩子a的左孩子c上插入一个结点y(该结点也可以是c,如图①),即y可以是c,也可以是c的左孩子(如图②),也可以是c的右孩子(不在画出)

                                  

图①就不用说了,结点x和结点a变换,则树平衡了;那么图②就是树中的一般情况了a结点有右孩子d,那要进行x和a变换,那么a的右孩子放哪啊?

很简单,如图放在x的左孩子上;分析:x>d,d>a,所以d可作为x的左孩子,且可作为a的右孩子中的孩子。下边这样的类似情况不再一一分析,自己分析分析~

实现:找到根结点x,与它的左孩子a进行交换即可使二叉树树再次平衡;

 

 

右右:

即在x的右孩子a的右孩子c上插入一个结点y(该结点也可以是c,如图①),即y可以是c,也可以是c的右孩子(如图②),也可以是c的左孩子(不在画出)

实现:找到根结点x,与它的右孩子a进行交换即可使二叉树树再次平衡;

 

 

左右:

即在x的左孩子a的右孩子c上插入一个结点y(该结点也可以是c,如图①),即y可以是c,也可以是c的右孩子(如图②),也可以是c的左孩子(不在画出)

 

 

这个左右和下边的右左,稍微复杂了点,需要进行两次交换,才能达到平衡,注意这时y是c的右孩子,最终y作为x的左孩子;若y是c的左孩子,最终y作为a

的右孩子,画图分析一下~~下边类似,不再敖述。

 

实现:找到根结点x,让x的左孩子a与x的左孩子a的右孩子c进行交换,然后再让x与x此时的左孩子c进行交换,最终达到平衡;

 

右左:

即在x的右孩子a的左孩子c上插入一个结点y(该结点也可以是c,如图①),即y可以是c,也可以是c的右孩子(如图②),也可以是c的左孩子(不在画出)

 

实现:找到根结点x,让x的右孩子a与x的右孩子a的左孩子c进行交换,然后再让x与x此时的右孩子c进行交换,最终达到平衡;

 

上边的四种情况包含了所有插入时导致不平衡的情况,上面给出的仅仅是一棵大树中的最小不平衡子树,一定要想清楚,别迷了!

另外一定要注意这个交换操作,比如a与b交换(a在上,b在下),b一定要占据a的位置!什么意思?就是b要放在(覆盖)储存a的那块内存上,

再通俗点说,若a是x的左孩子,则交换后b要做x的左孩子;这就是所谓的b占据a的位置!

 

那么如何找到最小不平衡子树的根结点x,并判断出它是属于那种情况的?

 

插入一个结点时,我们首先找到需要插入的位置,并插入;数据结构上用的是递归,不要说递归太浪费时空,你想想一个含2^31个结点的平衡二叉树的深度大约是31吧,它递归再多也不就是31层!而且递归代码短小、精悍、富含艺术之美!所以我认为对于这个平衡二叉树,用递归很合适!

显然插入之后就要检查是否出现不平衡的结点,那么如何检查?

我们知道,你插入的时候用的是递归,一条线找到要插的位置,并插入;那么谁的平衡因子的有可能变呢?

不难想象,只有该条线上的结点的平衡因子有可能改变!那么我们在回溯的时候不就可以找到第一个不平衡的子树的结点?!

可是我们如何判断该结点的平衡因子是否应该改变,显然要看它被插入结点的一边的深度是否增加;

如何看它被插入结点的一边的深度是否增加?

如上图,如何看x的右孩子a(即被插入结点的一边)的深度增加?我们知道在a的右孩子上插入了结点y那么a的bf是一定要减1

那么x结点的bf?可根据a的bf决定是否改变!

若a:bf=-1或1,那么a之前一定为0,表示a的深度增加了,那么x的bf可根据a是x哪一边的孩子决定+1或-1;

若a:bf=0,那么a之前一定为-1或1,表示a的深度每增加,那么不仅x的bf就不用变,该条线上的所有结点的bf都不用变,直接返回即可;

 

当然了,那么找到最小不平衡子树的根结点x了,如何判断它属于哪种不平衡呢?

①根据上边的几种情况,我们需要知道两个方向,在回溯时可以记录一下该结点到下一个结点的方向0:左、1:右为第二个方向,传递给上一层中,那么上层中的方向就是一个方向,有了这两个方向就能确定是哪种不平衡了。

还就上边的图说吧~可以定义一个全局变量secdirection(第二个方向),也可在递归中定义一个局部变量,返回给上一层。在回溯到a中时,secdirection=1,到x的时候

x->a的方向也为1,定义firdirection=1;而这时x:bf=-2;那么就找到了最小不平衡子树的根结点x,又知道了两个方向,那么进行相应的平衡操作不就行了。

②其实我代码中的就是按照①写的,可是刚又想了,其实不用用个变量记录第二个方向,可以根据a的bf确定它的第二个方向,a:bf=-1说明右孩子的深度增加,y加到右孩子上;

a:bf=1;说明左孩子的深度增加,y加到左孩子上;

 

好了,找到了最小不平衡子树的根结点x了,也知道了那种不平衡,调用keepbalance(...)就使树平衡了,可是某些结点的平衡因子在变换是变了~~咋办?

我就是一种一种情况推出来的,不知道别人怎么变的,每一种情况都有固定的几个点变了,变成了一个固定的值!谁有更好的办法,请多多指教!

 

下边一一列出(插入操作中)变换后bf改变的结点及值:

左左:前a->bf=1 后 x->bf=0,a->bf=0;右右:前a->bf=-1 后x->bf=0,a->bf=0;显然左左与右右的x与a变换后的bf都为0;

左右、右左中结点bf的改变要根据之前c的bf!

左右:若c->bf=1,则x->bf=-1,a->bf=0,c->bf=0;若c->bf=-1,则x->bf=0,a->bf=1,c->bf=0;若c->bf=0,则x->bf=0,a->bf=0,c->bf=0;

右左:若c->bf=1,则x->bf=0,a->bf=-1,c->bf=0;若c->bf=-1,则x->bf=1,a->bf=0,c->bf=0;若c->bf=0,则x->bf=0,a->bf=0,c->bf=0;

可以发现,当左右、右左的c->bf相同时x与a的bf刚好取相反的值。

 

好了,到现在插入一个结点的二叉树终于平衡了,相应的平衡因子也修改了!插入算是完成了!!

 

删除时:

删除类似插入的操作,蛋又不同,删除会有一些特殊情况需要特殊处理,当然核心操作“保持平衡”是不变的!

 

删除时少一个结点,也就是该结点所在的子树深度可能会减小,而插入时多一个结点,该结点所在的子树深度可能会增加,

所以递归删除一个结点时,回溯时找到最小不平衡子树的根结点时,要向相反的方向去找属于哪种情况;

如图:

y为要删除的结点;

图①:y结点删除后,回溯到x结点x:bf=-1变为x:bf=-2;则需从相反方向即从x的右孩子的方向向下检查属于哪种情况,显然第一个方向为1:右;

第二个方向看a:bf的值——若为1时,那就相当于插入时‘右左’的情况;若为-1时,那就相当于插入时‘左左’的情况;可现在a:bf既不是1也不是-1

而是0,这就是删除的特殊情况了!我们不妨试试对他进行类似于插入时的‘右右’操作,看怎么样~    如上图,经过变换后该子树平衡了!但是因子的

修改就跟插入时的‘右右’不一样了!此时变为:x:bf=-1,a:bf=1;所以我们不妨就把a:bf=0也归纳为删除的‘右右’或‘左左’(如图②,不再敖述)操作;

那么删除时因子的改变需在插入时因子的改变中添加上:

左左:前a:bf=0 后x:bf=1,a:bf=-1; 右右:前a:bf=0 后x:bf=-1,a:bf=1;其他不变!

 

插入时结束结点平衡因子的修改,直接返回(也就是该树已经平衡了):

回溯时发现儿子结点的平衡因子为0(当发现不平衡结点,并进行平衡操作后,平衡后根结点的bf一定为0,也结束了)

但是删除时结束结点平衡因子的修改,直接返回,就与插入时不一样了:回溯时发现儿子结点的平衡因子为-1或1!

再删除操作中,平衡一个子树后,该子树的深度不一定不变,而只有上边那种特殊情况该子树的深度不变,其他都会变!

可以想象,其实是很简单的道理:除了特殊情况其他都与插入的情况一模一样,说白了就是把深度大的子树(根结点的其中一个)向深度小子树贡献一个深度,

那么这样一来,该子树(对于根结点所领导的树)的深度是不是比原来的小1了?!所以要继续向上一个一个进行检索,直到根结点为止!

 

好了,到这里删除也算是说完了,可以贴代码了吧~

 

平衡二叉树的C实现:

View Code
复制代码
  1 #include <stdio.h>
2 #include <stdlib.h>
3 #include <string.h>
4
5 typedef int Elemtype;
6
7 typedef struct Balanced_Binary_Tree
8 {
9 Elemtype e;
10 int bf;
11 struct Balanced_Binary_Tree *child[2];
12 }*AVL;
13
14 ///------------简单的位操作-------------------
15 void setbit(char *i,char val,char pos)
16 {
17 if(pos==1)
18 (*i)=(*i)|1;
19 else
20 {
21 if(val==1) (*i)=(*i)|2;
22 else (*i)=(*i)&1;
23 }
24 }
25 char getbit(char i,char pos)
26 {
27 ///调试时,发现这里能返回2///
28 // return (i&pos); 出错的地方
29 return (i&pos)&&1;
30 /////////////////////////////
31 }
32 ///--------------------------------------------
33
34 ///-----------生成一个结点---------------------
35 AVL createnode(Elemtype e)
36 {
37 AVL node=NULL;
38
39 node=(AVL)malloc(sizeof(struct Balanced_Binary_Tree));
40 node->e=e; node->bf=0;
41 node->child[0]=node->child[1]=NULL;
42
43 return node;
44 }
45 ///---------------------------------------------
46
47 ///★★★★★★★★AVL的核心操作★★★★★★★★★★★★
48 ///★★★★★★★★★保持平衡★★★★★★★★★★★★★★
49
50 //改变因子函数
51 void setfactor(AVL f,int button)
52 {
53 char fir=button/10,sec=button%10;
54 AVL s=f->child[fir],ss=s->child[sec];
55 char choice=ss->bf;
56 int a=1,b=0;
57
58 //////////调试时发现,删除时的特殊情况/////////////
59 /////插入时,不会有这种情况,若button=0,则s->bf=1//
60 /////若button=11,则s->bf=-1;然而删除时,却会出现/
61 /////button=0或者button=11时 s->bf=0!!!!!!!////////
62 /////那么这种特殊情况,平衡后所得的因子就跟一般的//
63 /////不一样了!!!如下///////////////////////////////
64 if(button==0 && s->bf==0) f->bf=1,s->bf=-1;
65 else if(button==11 && s->bf==0) f->bf=-1,s->bf=1;
66 ///////////////////////////////////////////////////
67 else if(button==0 || button==11)
68 {
69 f->bf=0;
70 s->bf=0;
71 }
72 else
73 {
74 /////写博客时,发现这里有问题///////////////////
75 // if(button==1) choice=-choice;
76 /////但是为什么我测试的时候怎么都对?!///////////
77 /////经再次测试,上边确实错了!!!////////////////
78 /////改为下边应该就对了吧///////////////////////
79 if(button==1) {a^=b,b^=a,a^=b;}
80 ////////////////////////////////////////////////
81
82 if(choice==-1) f->bf=a,s->bf=b;
83 else if(choice==0) f->bf=s->bf=0;
84 else f->bf=-b,s->bf=-a;
85
86 ss->bf=0;
87 }
88 }
89 //两节点变换函数
90 void conversion(AVL *T,char direction)
91 {
92 AVL f=*T,s=f->child[direction];
93
94 f->child[direction]=s->child[!direction];
95 s->child[!direction]=f;
96 *T=s;
97 }
98 //保持平衡函数
99 void keepbalance(AVL *T,char fir,char sec)
100 {
101 AVL *s=&((*T)->child[fir]);
102 int button=fir*10+sec;
103
104 if(button==0 || button==11)
105 {
106 setfactor((*T),button);
107 conversion(T,fir);
108 }
109 else
110 {
111 setfactor((*T),button);
112 conversion(s,sec);
113 conversion(T,fir);
114 }
115 }
116 ///★★★★★★★★★★★★★★★★★★★★★★★★★★
117
118 ///------------插入时的选向操作-------------------
119 void selectforInsert(AVL *T,char *info,int direction)
120 {
121 AVL cur=*T;
122 char firdirection,secdirection;
123
124 if(direction==0) (cur->bf)++;
125 else (cur->bf)--;
126
127 if(cur->bf==0) setbit(info,1,1);
128 else if(cur->bf==-1 || cur->bf==1) setbit(info,direction,2);
129 else
130 {
131 firdirection=direction;
132 secdirection=getbit(*info,2);
133 keepbalance(T,firdirection,secdirection);
134 setbit(info,1,1);
135 }
136 }
137 //----------------------------------------------
138
139 //*************插入操作************************//
140 char InsertAVL(AVL *T,Elemtype e)
141 { //可用于查询
142 char info;
143
144 if(!(*T))
145 {
146 (*T)=createnode(e);
147 return 0;
148 }
149 else if((*T)->e==e) return -1;
150 else if((*T)->e>e)//
151 {
152 info=InsertAVL(&((*T)->child[0]),e);
153
154 if(getbit(info,1)) return info;
155
156 selectforInsert(T,&info,0);
157 }
158 else //
159 {
160 info=InsertAVL(&((*T)->child[1]),e);
161
162 if(getbit(info,1)) return info;
163
164 selectforInsert(T,&info,1);
165 }
166 return info;
167 }
168 //*********************************************//
169
170 //-------------删除时的选向操作--------------------
171 void selectforDelete(AVL *T,char *info,char direction)
172 {
173 AVL cur=(*T);
174 char firdirection,secdirection;
175
176 if(direction==0) (cur->bf)--;
177 else (cur->bf)++;
178
179 if(cur->bf==0) *info=0;
180 else if(cur->bf==-1 || cur->bf==1) *info=1;
181 else
182 {
183 firdirection=!direction;
184 ///调试时,发现这里少写了一个等号////////////////////
185 // if(cur->child[firdirection]->bf=1) secdirection=0;草,真帅气!原来1==a这样写确实有必要!
186 if(1==cur->child[firdirection]->bf) secdirection=0;
187 /////////////////////////////////////////////////////
188 else secdirection=1;
189 keepbalance(T,firdirection,secdirection);
190
191 /////////////////////////////////////////////////////////////////////////////////////////
192 ///调试时,发现经过子树平衡操作后,*info不一定都是0,就是那个特殊情况,在setfactor中/////
193 ///的那种特殊情况时,这里*info应改为1! 所以代码改如下://////////////////////////////////
194 /////////////////////////////////////////////////////////////////////////////////////////
195 // *info=1; 写代码时:这跟插入可不一样啊...该子树平衡了,它父节点的因子比变!
196 // *info=0;//因此,这还没完还要是0!! ............啊……这里不一定是0!
197 ////还是那个特殊情况搞的鬼!//
198 if(cur->bf==0) *info=0;
199 else *info=1;
200 /////////////////////////////////////////////////////////////////////////////////////////
201 }
202 }
203 //------------------------------------------------
204
205 //-------------变向递归--辅助删点-----------------
206 char find(AVL *gogal,AVL *p)
207 {
208 char info;
209 AVL tp=NULL;
210
211 if(NULL!=(*p)->child[0])
212 {
213 info=find(gogal,&((*p)->child[0]));
214 if(info!=0) return info;
215 selectforDelete(p,&info,0);
216 }
217 else
218 {
219 (*gogal)->e=(*p)->e;
220 tp=(*p)->child[1];
221 free((*p));
222 *p=tp;
223 info=0;
224 }
225 return info;
226 }
227 //------------------------------------------------
228
229 //**************删除操作*************************//
230 char DeleteAVL(AVL *T,Elemtype e)
231 {
232 char info;
233 AVL tp=NULL;
234
235 if(!(*T)) return -1;//原if(!T)    return -1;于2011年11月29日8:59:15修改
236 else if((*T)->e==e)
237 {
238 if(NULL!=(*T)->child[1])
239 {
240 info=find(T,&((*T)->child[1]));
241 if(info!=0) return info;
242 selectforDelete(T,&info,1);
243 }
244 else
245 {
246 //////////////调试时,发现这样写不对!!!///////////////////////////////////////
247 // (*T)=(p=(*T)->child[0])-(free((*T)),0);//Just save a variable! 这里出问题
248 // (*T)=p-(free((*T)),0); 可以
249 // (*T)=(p=((*T)->child[0]))+(free((*T)),0); 不可以
250 tp=((*T)->child[0]);
251 free((*T));
252 *T=tp;
253 //调试时,发现这里漏了给info赋值
254 info=0;
255 ///////////////////////////////////////////////////////////////////////////////
256 }
257 }
258 else if((*T)->e>e)
259 {
260 info=DeleteAVL(&(*T)->child[0],e);
261 if(info!=0) return info;
262 selectforDelete(T,&info,0);
263 }
264 else
265 {
266 info=DeleteAVL(&(*T)->child[1],e);
267 if(info!=0) return info;
268 selectforDelete(T,&info,1);
269 }
270 return info;
271 }
272 //************************************************//
273
274
275 //*****************JUST FOR TEST************************//
276 #define MOVE(x) (x=(x+1)%1000)
277 AVL queue[1000];
278
279 void print(AVL p,int i)
280 {
281 int front,rear,temp,count;
282
283 front=rear=-1; count=temp=0;
284 queue[MOVE(rear)]=p; count++;
285
286 printf("%d\n",i);
287 while(front!=rear)
288 {
289 p=queue[MOVE(front)]; count--;
290
291
292 if(p->child[0]) queue[MOVE(rear)]=p->child[0],temp++;
293 if(p->child[1]) queue[MOVE(rear)]=p->child[1],temp++;
294
295 printf("%d->%d ",p->e,p->bf);
296 if(count==0)
297 {
298 printf("\n");
299 count=temp;
300 temp=0;
301 }
302 }
303 printf("\n");
304 }
305 //**************************************************//
306
307
308 int main()
309 {
310 AVL T=NULL;
311 int i,nodenum=0;
312
313 freopen("input.txt","w",stdout);
314 nodenum=100;
315 for(i=0;i<nodenum;i++)
316 {
317 InsertAVL(&T,i);
318 }
319
320 print(T,-1);
321
322 for(i=0;i<nodenum-1;i++)
323 {
324 DeleteAVL(&T,i);
325 print(T,i);
326 }
327
328 return 0;
329 }
复制代码



那个位操作函数,使程序好像很复杂似的,完全可以用一个外部结构体替换!只是我不想用外部变量,尽量在函数内完成吧

由于本人比较笨,写了很长时间~~有什么不正确的,欢迎指正!!!

这些图费了很大功夫才弄好,本来在编辑框里画的好好的,可是一发表,那些图有些就乱了,刚开始我还试着一个一个对照着修改,看最终发现还是不行……最后忽然想到我怎么不在编辑框中截图呢?最后在编辑框中一个一个截图一个一个上传,这样效果好多了!费这么大功夫只为一点:让读者看着舒服,容易理解。

我还想说:开这个博客园以来,也没多长时间,蛋把我气的不浅!每次都是搞好程序,准备到这里写博客时,就是打不开!气死我了!卡死啦!有时候确实是我网速慢,但有时候网速好了也很难打开啊!你说你还是程序员的家园!看你卡的,我都无语了!网速稍微慢点就打不开,就这浪费了我很多时间!我对博客园很失望!!

朋友们,你们感觉呢?