通常来说内存对齐很能提高速度的,使用如下指令在两个操作系统下面令内存对齐

#ifdef _WIN32
   typedef __declspec(align(16)) struct
#elif _LINUX
   typedef __attribute__((aligned(16))) struct
#endif

这里有一篇讲得很好的文章
http://blog.vckbase.com/panic/archive/2005/04/02/4340.aspx