上篇说到垃圾回收器的一些基本原理。这次说说这个垃圾回收器最终效果啥呀。有着明确的需求，说起来会更清晰，更明确。

看代码吧。

struct A
{
    int i,j,k;

    Begin_Member_Pointer(A)
    End_Member_Pointer
    
};


struct B
{
    pointer<A> data0;

    B()
    {
        data0 = gc.malloc<A>();
    }

    Begin_Member_Pointer(B)
    Member(data0);
    End_Member_Pointer

};

pointer<B> test()
{
    pointer<B> pB = gc.malloc<B>();
    //做一些事情
    return pB;
}

void main()
{
    pointer<B> pB = test();
    //做一些事情
    gc.collect();
    gc.compress();
}

看看上面的一段代码，基本演示了怎么用这个垃圾回收器。

1. gc.malloc< >( ) 为对象分配空间，并调用构造函数。gc.malloc有多个参数的模板函数，构造函数的参数直接放里面就可以。
2. 能被垃圾回收器回收的对象，必须定义一个以Begin_Member_Pointer(TypeName) 开始，以End_Member_Pointer结束，中间包含所有pointer类型成员变量的列表（顺序无关）。
3. 在任意时候调用gc.collect( )来回收所有无用内存，并会对所有被回收的对象调用析构函数。
4. 在回收后可以选择调用gc.compress( )来紧缩内存。

当然现在如果有朋友读过源码，会发现和上面所有有些不一致，不过上面是最终的效果。

这里就对指针的使用有了一些限制，

1. 所有受垃圾回收器控制的内存的指针是以 pointer<type> 的形式存在，而且是强制的。pointer类型不能转化成普通指针，而且gc.malloc函数返回的也是pointer类型的指针，这个是必须的，因为要实现内存紧缩，所有的指针必须受控）。
2. 所有的类型定义里面必须包含对成员指针的一个描述，见上面第2条。否则想上面在B的构造函数中申请出来的A对象就无法被释放了。

这些对成员的描述就是上面图中粉红色圆圈的指针了，如果没有这些定义，有些内存块的可达性判断就可能失效。

这里我做了一些简化，暂时不考虑多核多线程，所以寄存器可以不考虑，这大幅降低了编码的复杂度，使得代码更容易理解。

先看看所有的数据结构吧：

//扫描成员指针的函数指针
typedef void (*marker) (const void* ptr, void(*func)(const pointer_base&));

//根集
std::list<pointer_base *> gc_root_set;

//内存块节点
struct node
{
    void* mem;        //内存指针（普通指针）
    unsigned int size;    //内存大小
    unsigned int mark;    //当前的标志
    marker func;        //扫描函数指针
    destructor finalizer;    //析构函数指针
};

//内存块集
std::map<const void *, node> gc_holder;
//标志
unsigned int gc_marker = 0;
//标志当前指针是否属于根集
bool gc_is_root_set_locked = false;
//所有指针集(用于紧缩）
std::multimap<const void*, const pointer_base*> gc_pointer_set;
//紧缩时用的缓冲
std::map<const void*, const void*> gc_swap_buffer;

上面就是全部的数据结构，需要说明的是：
1。那个marker是一个函数指针，它的第二个参数也是个函数指针。
2。了解C++的朋友可能会说，析构函数不能对其取地址。当然这里用了一个小小的技巧---对析构函数进行了包装。

template <class _T>
void gc_destructor(_T* p)
{
    p->_T::~_T();
};

typedef void (*destructor) (void*);

struct node
{
    void* mem;
    unsigned int size;
    unsigned int mark;
    marker func;
    //注意类型
    destructor finalizer;
};

node n;
//这是关键
n.finalizer = (destructor)&gc_destructor<_T>;

3。注意gc_mark不是一个bool变量，它会随着每次分配而++，在collect之前，会用++mark来标记所有可达内存块，即node.mark = gc_mark; 于是，所有mark值和gc_mark不等的内存块就需要被回收啦。

从下篇开始就逐个介绍各个函数了，最后再用宏或模板做出来一些语法糖，把见不得人的东西都包起来，就大功告成了。

posted on 2010-02-10 19:09 尹东斐阅读(2625) 评论(10) 编辑收藏引用

FeedBack: