汇编语言--基础知识

知识点：机器语言、汇编语言的产生、汇编语言的组成、存储器、指令和数据、存储单元、CPU对存储器的读写、地址总线、数据总线、控制总线、内存地址空间（概述）、主板、接口卡、各类存储器芯片、内存地址空间。

汇编语言是直接在硬件之上工作的编程语言，首先要了解硬件系统的结构，才能有效地应用汇编语言对其编程。

机器语言
说到汇编语言的产生，首先要讲一下机器语言。机器语言是机器指令的集合。机器指令展开来讲就是一台机器可以正确执行的命令。
电子计算机的机器指令是一列二进制数字。计算机将之转变为一列高低电平，以使计算机的电子器件受到驱动，进行运算。

上面所说的计算机指的是可以执行机器指令，进行运算的机器。这是早期计算机的概念。现在，在常用的PC机中，有一个芯片来完成上面所说的计算机的功能，这个芯片就是我们常说的CPU（Central Processing Unit，中央处理器单元），CPU是一种微处理器。

以后我们提到的计算机是指由CPU和其他受CPU直接或间接控制的芯片、器件、设备组成的计算机系统，比如我们最常见的PC机。

每一种微处理器，由于硬件设计和内部结构和不同，就需要用不同的电平脉冲来控制，使它工作。所以每一种微处理器都有自己的机器指令集，也就是机器语言。

早期的程序设计均使用机器语言。程序员们将用0、1数字编成的程序代码打在纸带或卡片上，1打孔，0不打孔，再将程序通过纸带机或卡片机输入计算机，进行运算。

应用8086CPU完成计算 s = 768 + 12288 - 1280，机器码如下：
1011000000000000000000000000011
0000010100000000000000000110000
0010110100000000000000000000101

要书写和阅读机器码程序不是一件简单的工作，要记住所有抽象的二进制码。上面只是一个非常简单的小程序，就暴露了机器码的晦涩难懂和不易查错。

汇编语言的产生
早期的程序员很快就发现了使用机器语言带来的麻烦，它是如此难于辨别和记忆，给整个产业的发展带来了障碍。于是汇编语言产生了。

汇编语言的主体是汇编指令。
汇编指令和机器指令的差别在于指令的表示方法上。
汇编指令是机器指令便于记忆的书写格式。

例如：机器指令 1000100111011000表示把寄存器BX的内容送到AX中。汇编指令则写成mov ax, bx，这样的写法与人类语言接近，便于阅读和记忆。

操作：寄存器BX的内容送到AX中
机器指令：1000100111011000
汇编指令：mov ax, bx

（寄存器，简单地讲是CPU中可以存储数据的器件，一个CPU中有多个寄存器。AX是其中一个寄存器的代号，BX是另一个寄存器的代号。）

此后，程序员们就用汇编指令编写源程序。可是，计算机能读懂的只有机器指令，那么如何让计算机执行程序员用汇编指令编写的程序呢？这时，就需要有一个能够将汇编指令转换成机器指令的翻译程序，这样的程序被称为编译器。程序员用汇编语言写出源程序，再用汇编编译器将其编译为机器码。由计算机最终执行。

用汇编语言编写程序的工作过程：
（程序员）汇编指令   --> 编译器   --> 机器码 --> 计算机

汇编语言的组成
汇编语言发展至今，由以下3类指令组成。
汇编指令：机器码的助记符，有对应的机器码。
伪指令：没有对应的机器码，由编译器执行，计算机并不执行。
其他符号：如：+、-、*、/等，由编译器识别，没有对应的机器码。

汇编语言的核心是汇编指令，它决定了汇编语言的特性。

存储器
CPU是计算机的核心部件，它控制整个计算机的运作并进行运算。
要想让一个CPU工作，就必须向它提供指令和数据。
指令和数据在存储器中存放，也就是平时所说的内存。

在一台PC机中内在的作用仅次于CPU。离开了内存，性能再好的CPU也无法工作。
这就像再聪明的大脑，没有了记忆也无法进行思考。

磁盘不同于内存，磁盘上的数据或程序如果不读到内存中，就无法被CPU使用。

要灵活地利用汇编语言编程，首先要了解CPU是如何从内存中读取信息，以及向内存中写入信息的。

指令和数据
指令和数据是应用上的概念。在内存或磁盘上，指令和数据没有任何区别，都是二进制信息。
CPU在工作的时候把有的信息看作指令，有的信息看作数据，为同样的信息赋予了不同的意义。
就像围棋的棋子，在棋盒里的时候没有任何区别，在对弈的时候就有了不同的意义。

例如，内存中的二进制信息 1000100111011000，计算机可以把它看作大小为89D8H的数据来处理，也可以将基看作指令mov ax, bx来执行。

1000100111011000     -->    89D8H（数据）
1000100111011000     -->    mov ax, bx（指令）

存储单元
存储器被划分成若干个存储单元，每个存储单元从0开始顺序编号，例如一个存储器有128个存储单元，编号从0~127。

电子计算机的最小信息单位是bit（音译为比特），也就是一个二进制位。
8个bit组成一个Byte，也就是通常讲的一个字节。
微型机存储器的存储单元可以存储一个字节，即8个二进制位。
一个存储器有128个存储单元，它可以存储128个字节。

微机存储器的容量是以字节为最小单位来计算的。
对于拥有128个存储单元的存储器，我们可以说，它的容量是128字节。

对于大容量的存储器一般还用以下单位计量容量（以下B来代表Byte）：
1KB = 1024B
1MB = 1024KB
1GB = 1024 MB
1TB = 1024 GB

磁盘的容量单位同内存的一样，以上单位是微机中常用的计量单位。

CPU对存储器的读写
存储器被划分成多个存储单元，存储单元从零开始顺序编号。这些编号可以看作存储单元在存储器中的地址。就像一条街，每个房子都有门牌号码。

CPU要从内在中读数据，首先要指定存储单元的地址。
也就是说它要先确定读取哪一个存储单元的数据。就像在一条街上找人，先要确定他住哪个房子里。

另外，在一台微机中，不只有存储器这一种器件。CPU在读写数据时还要指明，它要对哪一个器件进行操作，进行哪种操作，是从中读出数据，还是向里面写入数据。

可见，CPU要想进行数据的读写，必须和外部器件（标准的说法是芯片）进行3类信息的交互：
*存储单元的地址（地址信息）
*器件的选择，读或写的命令（控制信息）
*读或写的数据（数据信息）

那么CPU是通过什么将地址、数据和控制信息传到存储器芯片中的呢？
电子计算机能处理、传输的信息都是电信号，电信号当然要用导线传送。在计算机中专门有连接CPU和其他芯片的导线，通常称为总线。
总线从物理上来讲，就是一根根导线的集合。
根据传送信息的不同，总线从逻辑上又分为3类，即地址总线、控制总线、和数据总线。

CPU从3号单元中读取数据的过程如下：

CPU
内存

地址线
12     [0]

3-----> 3B    [1]

9C    [2]

数据线 08     [3]

8<----- 31    [4]

23     [5]

控制线 15     [6]

内存读写命令---> 13    [7]

18     [8]

cpu从内存中读取数据的过程。

（1）CPU通过地址线将地址信息3发出。
（2）CPU通过控制线发出内在读命令，选中存储器芯片，并通知它，将要从中读取数据。
（3）存储器将3号单元中的数据08通过数据线送入CPU。

写操作与读操作的步骤相似。向3号单元写入数据26：
（1）CPU通过地址线将地址信息3发出。
（2）CPU通过控制线发出内存写命令，选中存储器芯片，并通知它，要向其中写入数据。
（3）CPU通过数据线将数据26送入内存的3号单元中。

从上面的我们知道CPU是如何进行数据读写的。可是，我们如何命令计算机进行数据的读写呢？
要让一个计算机或微处理器工作，应向它输入能够驱动它进行工作的电平信息（机器码）。

对于8086CPU，下面的机器码能够完成从3号单元读数据：
机器码：101000000000001100000000
含义：从3号单元读取数据送入寄存器AX

CPU接收这条机器码后将完成上面所述的读写工作。

机器码难于记忆，用汇编指令来表示，情况如下：
机器码：101000000000001100000000
对应的汇编指令：MOV AX, [3]
含义：传送3号单元的内容到AX

地址总线
CPU是通过地址总线来指定存储器单元的。
地址总线上能传送多少个不同的信息，CPU就可以对多少个存储单元进行寻址。

现假设，一个CPU有10根地址线，让我们来看一下它的寻址情况。
在电子计算机中，一根导线可以传送的稳定状态只有两种，高电平或低电平。
用二进制表示就是1或0，10根导线可以传送10位二进制数据。
而10位二进制数可以表示多个不同的数据呢？
2的10次方个，最小数为0，最大数为1023。

一个CPU有N根地址线，则可以说这个CPU的地址总线的宽度为N。
这样的CPU最多可以寻找2的N次方个内存单元。

数据总线
CPU与内存或其他器件之间的数据传送是通过数据总线来进行的。
数据总线的宽度决定了CPU和外界的数据传送速度。
8根数据总线一次可传送一个8位二进制数据（即一个字节）。
16根数据总线一次可传送2个字节。

控制总线
CPU对外部器件的控制是通过总线来进行的。在这里控制总线是个总称，控制总线是一些不同控制线的集合。
有多少根控制总线，就意味着这个CPU提供了对外部器件的多少种控制。
所以，控制总线的宽度决定了CPU对外部器件的控制能力。

内存读写命令是由几根控制线综合发出的，其中有一根名为读信号输出控制线负责由CPU向外传送读信号，CPU向该控制线上输出低电平表示将要读取数据；有一根名为写信号输出的控制线则负责传送写信号。

小结
1）汇编指令是机器指令的助记符，同机器指令一一对应。
2）每一种CPU都有自己的汇编指令集。
3）CPU可以直接使用的信息在存储器中存放。
4）在存储器中指令和数据没有任何区别，都是二进制信息。
5）存储单元从零开始顺序编号。
6）一个存储单元可以存储8个bit（用作单位写成"b"），即8位二进制数。
7）1B=8b     1KB=1024B     1MB=1024KB     1GB=1024MB
8）每一个CPU芯片都有许多管脚，这些管脚和总线相连。也可以说，这些管脚引出总线。
      一个CPU可以引出三种总线的宽度标志了这个CPU的不同方面的性能：
               地址总线的宽度决定了CPU的寻址能力；
               数据总线的宽度决定了CPU与其他器件进行数据传送时的一次数据传送数；
               控制总线的宽度决定了CPU对系统中其他器件的控制能力。


习题：
（1）1个CPU的寻址能力为8KB，那么它的地址总线的宽度为________。
（2）1KB的存储器有________个存储单元？存储单元的编号从__________到__________。
（3）1KB的存储器可以存储_________个bit，_________个byte。
（4）1GB，1MB，1KB分别是_____________________________byte。
（5）8080、8088、80286、80386的地址总线分别为16根、20根、24根、32根，则它们的寻址能力分别为：__________KB、________MB、__________MB、______________GB。
（6）8080、8088、8086、80286、80386的数据总线宽度分别为8根、8根、16根、16根、32根。则它们一次可以传送的数据为：_______B、________B、________B、__________B、_______B。
（7）从内存中读取1024字节的数据，8086至少要读_______次，80386至少要读__________次。
（8）在存储器中，数据和程序以________形式存放。

答案：
（1）13
           解析：微型机的存储单元可以存储一个字节，即8个二进制位。8KB即8K字节，即2的13次方个存储单元。一个CPU有N根地址线，则可以说这个CPU的地址总线的宽度为N,这样的CPU最多可以寻找2的N次方个存储单元。
（2）1024，0，1023
           解析：1KB，即1024字节，一个存储单元为一个字节。存储单元从零开始顺序编号。
（3）8192，1024
           解析：1B=8b     1KB=1024B
（4）2^30,   2^20, 2^10
（5）64， 1， 16， 4
          解析：一个CPU有N根地址线，表示这个CPU地址总线宽度为N，可以寻址2的N次方个存储单元。
（6）1，1，2，2，4
         解析：一根数据线，只能传送一位二进制数（0或1，低电平或高电平）
（7）512， 256
        解析：8086的数据总线宽度为16，一次可以传送2个字节，80386的数据总线宽度为32，一次可以传送4个字节。
（8）二进制（0或1）

内存地址空间（概述）
什么是内存地址空间呢？
举例来讲，一个CPU的地址线宽度为10，那么可以寻址1024个内存单元（存储单元，一个存储单元在微型机中表示一个字节），这1024个可寻到的内存单元就构成了这个CPU的内存地址空间。

主板
在每一台PC机中，都有一个主板，主板上有核心器件和一些主要器件，这些器件通过总线（地址总线、数据总线、控制总线）相连。
这些器件有：CPU、存储器、外围芯片组、扩展插槽等。
扩展插槽上一般插有RAM内存条和各类接口卡。

接口卡
计算机系统中，所有可用程序控制其工作的设备，必须受到CPU的控制。
CPU对外部设备都不能直接控制，如显示器、音箱、打印机等。
直接控制这些设备进行工作的是插在扩展插槽上的接口卡。
扩展插槽通过总线和CPU相连，所以接口卡也通过总线同CPU相连。
CPU可以直接控制这些接口卡，从而实现CPU对外设的间接控制。
简单地讲，就是CPU通过总线向接口卡发送命令，接口卡根据CPU的命令控制外设进行工作。

各类存储器芯片
一台PC机中，装有多个存储器芯片，这些存储器芯片从物理连接上看是独立的、不同的器件。
从读写属性上看分为两类：随机存储器（RAM）和只读存储器（ROM）。
随机存储器可读可写，但必须带电存储，关机后存储的内容丢失；
只读存储只能读取不能写入，关机后其中的内容不丢失。
这些存储器从功能和连接上又可分为以下几类：

随机存储器
用于存放供CPU使用的绝大部分程序和数据，主随机存储器一般由两个位置上的RAM组成，装在主板上的RAM和插在扩展插槽上的RAM。

装有BIOS（Basic Input/Output System，基本输入输出系统）的ROM
BIOS是由主板和各类接口卡（如：显卡、网卡等）厂商提供的软件系统，可能通过它利用该硬件设备进行最基本的输入输出。
在主板和某些接口卡上插有存储相应BIOS的ROM，例如：主板上的ROM中存储着主板的BIOS（通常称为系统BIOS）；显卡上的ROM中存储显卡的BIOS；如果网卡上装有ROM，那其中就可以存储网卡的BIOS。

接口卡上的RAM
某些接口卡需要对大批量输入、输出数据进行暂时存储，在其上装有RAM。最典型的是显示卡上的RAM，一般称为显存。显示卡随时将显存中的数据向显示器上输出。换句话说，我们将需要显示的内容写入显存，就会出现在显示器上。

内存地址空间
上述的各种存储器，它们在物理上是独立的器件，但是它们在以下两点上相同：
1）都和CPU的总线相连；
2）CPU对它们进行读或写的时候都通过控制线发现内在读写命令。

也就是说，CPU在操纵和控制它们的时候，把它们都当作内存来对待，把它们总的看作一个由若干存储单元组成的存储器。
这个逻辑存储器就是我们所说的内在地址空间。

所有的物理存储器被看作是一个由若干存储单元组成的逻辑存储器，每个物理存储器在这个逻辑存储器中占有一个地址段，即一段地址空间。
CPU在这段地址空间中读写数据，实际上就是在相对应的物理存储器中读写数据。

内存地址空间的大小受CPU地址总线宽度的限制。
8086CPU的地址总线宽度为20，可以传送2^20个不同的地址信息（大小从0至2^20-1）。即可以定位2^20个内在单元，则8086PC的内在地址空间大小为1MB。
同理，80386CPU的地址总线宽度为32，则内存地址空间最大为4GB。

我们在基于一个计算机硬件系统编程的时候，必须得知道这个系统中的内在地址空间分配情况。

因为当读者想在某类存储器中读写数据的时候，读者必须知道它的第一个单元的地址和最后一个单元的地址，才能保证读写操作是在预期的存储器中进行。

比如，读者希望向显示器输出一段信息，那么读者必须将这段信息写到显存中，显卡才能将它输出到显示器上。要向显存中写入数据，读者必须知道显存在内存地址空间中的地址。

不同的计算机系统的内存地址空间的分配情况是不同的。

内存地址空间
最终运行程序的是CPU，我们用汇编编程的时候，必须要从CPU角度考虑问题。
对CPU来讲，系统中的所有存储器中的存储单元都处于一个统一的逻辑存储器中，它的容量受CPU寻址能力的限制。
这个逻辑存储器即是我们所说的内存地址空间。

posted on 2010-07-11 14:50 luqingfei 阅读(747) 评论(0) 编辑收藏引用所属分类: 汇编语言基础学习

只有注册用户登录后才能发表评论。
【推荐】100%开源！大型工业跨平台软件C++源码提供，建模，组态！

相关文章: 《汇编语言》--读后感汇编语言--补码汇编语言--Intel系列微处理器的三种工作模式汇编语言--使用BIOS进行键盘输入和磁盘读写汇编语言--直接定址表汇编语言--外中断汇编语言--端口汇编语言--int指令汇编语言--内中断汇编语言--标志寄存器

网站导航: 博客园 IT新闻 BlogJava 博问 Chat2DB 管理

luqingfei@C++

汇编语言--基础知识

导航

统计

留言簿(6)

随笔分类(109)

随笔档案(105)

Blogers

Game

Life

NodeJs

Python

Useful Webs

大牛

搜索

积分与排名

最新评论

阅读排行榜

评论排行榜

CPU		内存
	地址线	12 [0]
	3----->	3B [1]
		9C [2]
	数据线	08 [3]
	8<-----	31 [4]
		23 [5]
	控制线	15 [6]
	内存读写命令--->	13 [7]
		18 [8]