关于内存模式[节选]

     内存模式的出现不是由编译器决定的，而是由处理器的寻址方式决定的，在8086处理器中为了在16位寄存器的基础上寻址20位的地址，引入了段寄存器和分段寻址的方式。在编译器这一级，利用这种段式的寻址方式，可以实现多种不同的存储分配方法，因此就产生了所谓的不同的内存模式。
    1. tiny模式：   程序和数据在一个64K字节的段内
    2. small模式：  独立的代码段(64KB)和独立的数据段(64KB)
    3. medium模式：单个数据段(64KB)和多个代码段(1MB)
    4. compack模式：单个代码段(64KB)和多个数据段(1MB)
    5. large模式：  多个代码段(1MB)和多个数据段(1MB)，数据指针不能跨越段边界，否则将回绕
    6. huge模式：   多个代码段(1MB)和多个数据段(1MB)，数据指针可以跨越段边界，不会回绕

    在TC中内存模式与far、near、huge等关键字又有着密切的关系。在tiny、small模式下，所有的函数定义、全局变量定义和指针变量的定义，如果没有显示的加上far、near、huge等关键字，都默认为使用了near关键字；在medium模式下，函数定义默认使用了far关键字，变量定义默认使用了near关键字；在compact模式下函数定义模式使用了near关键字，变量定义默认使用了far关键字；large模式下函数定义和变量定义模认使用了far关键字；huge模式下函数定义模认使用了far关键字，变量定义默认使用了huge关键字。

near、far、huge关键字的真正含义是什么？这三个关键字只能用于修改函数、全局变量和指针变量，对于非指针类型的局部变量，这些关键字没有实际意义。这些关键字用于修饰函数时，huge的含义与far相同，用于指明该函数的调用方式为far调用方式，即调用时需要一个段值和一个段偏移组成的32bits调用地址，使用far call进行跳转，跳转前先压栈保存当前CS:IP。near修饰函数时，用于指明该函数的调用方式为near调用方式，调用时只需要一个16bits的近地址，即当前CS的段内偏移。

当这三个关键字用于修饰指针时，near型指针实质上为16bits的无符号整型数，该整数给出了所指向变量在当前数据段内的偏移地址，也就是说，在使用near型指针寻址时实际上是进行如下的寻址操作：[DS:指针变量值]。对于far型的指针变量，可以寻址1MB地址空间的任意一个地方，far型指针的实质是一个32bits的整型数，高16bits为段值，低16bits为段内偏移，Turbo C中在使用far型指针时，会先将高16bits放入ES寄存器中，然后再进行如下的寻址操作：[ES:指针变量低16bits值]。对于hug型的指针变量，与far性指针变量的不同之处在于，在对far型指针变量进行+/++/-/--等操作时，far型指针变量保持段值不变（也就是高16bits），而只对段内偏移进行加减操作，所以会出现段内回绕的现象，而huge型的指针，在进行加减操作时将会自动的改变段值，不会出现段内回绕。所以给人的感觉就是huge指针能比far指针寻址更大的内存空间。

对于局部变量，由于是创建在堆栈上，所以near、far等关键字将不具备任何意义，因为创建在堆栈上的变量的寻址方式就只有一种，即使用sp和bp维护函数堆栈，利用bp+/-一个偏移来寻址函数参数变量和局部变量。这样的寻址方式是固定而唯一的，near和far等关键字都派不上用场，这里的near和far将没有任何的实际含义。

对于使用near、far和huge修饰的全局变量的含义也很容易理解了。near型的全局变量，被分配到了当前的数据段上，寻址这个变量只需要一个16bits的偏移量，而far型全局变量在寻址时，需要给出段值和偏移量。huge型数组可以使用大于64K的内存空间。

far、near、huge型指针变量之间的相互转换，从小尺寸的指针到大尺寸的指针将进行自动的类型转换，转换方式为加上当前的DS形成32bits的指针。从大尺寸的指针到小尺寸的指针需要进行强制类型转换，转换的结果为只保留低16bits，但是这样俄转换没有实际的意义或者说用处不大，并且极其容易引入内存访问的错误，所以要严格避免使用。

需要注意的是，near、far、huge三个关键字的使用，还需要内存模式的紧密配合。但并不是说tiny模式下就不能使用near、far、huge三个关键字。tiny模式下同样可以定义如下的指针：
char far *pbuf = 0xA0000000;
并且我能保证这个指针能够绝对正确的工作，对函数、全局变量的修饰也是如此。但是如何正确的工作，如何才是最和合理的方式，请自己思考了。基本的原理我也讲的很清楚，就不再多费唇舌。

Turbo C中，我想最为困惑的就是内存模式了，我也是费了很多时间和精力，通过分析Turbo C的汇编代码的出的以上结论。许多朋友都对此很困惑，所以这部分重点讲了下，和大家分享。如有不正确之处，请不吝赐教，旨在抛砖引玉。tcc编译汇编代码的方法为：tcc -c -mt -S filename.c，-c指明compile only，-mx用于指定内存模式，-S指明生成汇编代码，如果大家有兴趣可以尝试使用这个方法分析tcc编译结果的汇编代码，从而更加深刻的理解C与汇编的关系。

当我们在编写、制作并向用户提供自己的库文件时，也需要注意内存模式的匹配，否则在进行链接时会存在问题。一个较为简单的方法就是向用户提供全套内存模式的库文件，这也是Turbo C的ANSI C库的做法，前文已经提到。如果不想提供多个内存模式的库文件，可以对程序中每个函数、全局变量和指针变量进行显式的类型声明，以精确定义每个变量的类型。

节选自 RockCarry工作室陈凯

发表于 2008-01-01 21:18 foxtail 阅读(1606) 评论(0) 编辑收藏引用所属分类: C/C++程序设计

关于内存模式[节选]

公告

常用链接

随笔分类(54)

随笔档案(53)

文章分类

相册

C++名库

Friend

GUI和设计方法

Mathematics

Problem

STL网站

工具

精品网站

其他

语言

最新随笔

最新评论