现代编译器常见的编译过程

peakflys注:本文转载自http://blog.sina.com.cn/s/blog_49ec372801008fzt.html ,其中很多对gcc的讲解很实用。

现代编译器常见的编译过程:
源文件-->预处理-->编译/优化-->汇编-->链接-->可执行文件

对于gcc而言:
第一步 预处理
命令: gcc -o test.i -E test.c
或者 cpp -o test.i test.c (这里cpp不是指c plus plus,而是the C Preprocessor)
结果: 生成预处理后的文件test.i(可以打开后与预处理前进行比对,当然长度会吓你一跳)
注解: 此步读取c源程序,对伪指令和特殊符号进行处理。包括宏(peakflys注:通过加入-E -P 可以轻松的看到程序中宏替换后的代码,便于编写复杂宏时对照),条件编译,包含的头文件,以及一些特殊符号。基本上是一个replace的过程。

第二步 编译及优化
命令: gcc -o test.s -S test.i
或者 /路径/cc1 -o test.s test.i
结果: 生成汇编文件test.s(可打开后查看源文件生成的汇编码)
注解: 此步通过词法和语法分析,确认所有指令符合语法规则(否则报编译错),之后翻译成对应的中间码,在linux中被称为RTL(Register Transfer Language),通常是平台无关的,这个过程也被称为编译前端。编译后端对RTL树进行裁减,优化,得到在目标机上可执行的汇编代码。使用不同的优化 编译选项,可以看到在不同优化级别下的代码。了解编译器对你写的代码到底做了什么。

第三步 汇编
命令: gcc -o test.o -c test.s
或者 as -o test.o test.s
结果: 生成目标机器指令文件test.o(可用objdump查看)
注解: 此步把汇编语言代码翻译成目标机器指令, 用file test.o 可以看到test.o是一个relocatable的ELF文件,通常包含.text .rodata代码段和数据段。可用readelf -r test.o查看需要relocation的部分。gcc采用as作为其汇编器,所以汇编码是AT&T格式的,而不是Intel格式,所以在用 gcc编译嵌入式汇编时,也要采用AT&T格式。

第四步 链接
命令: gcc -o test test.o
或者 ld -o test test.o
结果: 生成可执行文件test (可用objdump查看)
注解: 此步将在一个文件中引用的符号同在另外一个文件中该符号的定义链接起来,使得所有的这些目标文件链接成为一个能被操作系统加载到内存的执行体。(如果有不 到的符号定义,或者重复定义等,会报链接错)。用file test 可以看到test是一个executable的ELF文件。

当然链接的时候还会用到静态链接库,和动态连接库。静态库和动态库都是.o目标文件的集合,但是使用相差很远。
静态库:
命令: ar -v -q test.a test.o
结果: 生成静态链接库test.a
注解: 静态库是在链接过程中将相关代码提取出来加入可执行文件的库(即在链接的时候将函数的代码将从其所在地静态链接库中被拷贝到最终的可执行程序中),ar只是将一些别的文件集合到一个文件中。可以打包,当然也可以解包。(peakflys注:通常自己编写的常用底层都以静态库的形式提供,这样一则减少上层逻辑的编译时间,二则只需要在每个使用处包含文件名即可,不用关注库文件的具体路径)

动态库:
命令: gcc -shared test.so test.o
或者/PATH/collect2 -shared test.so test.o (省略若干参数)
结果: 生成动态连接库test.so
注解: 动态库在链接时只创建一些符号表,而在运行的时候才将有关库的代码装入内存,映射到运行时相应进程的虚地址空间(peakflys注:通过这种特点,我们可以设想,如果以后服务器的功能逻辑都以这种方式提供,那么对于C++这种编译型语言也可以像解释型的脚本语言一样达到不停服的功能更新)。如果出错,如找不到对应的.so文件,会 在执行的时候报动态连接错(可用LD_LIBRARY_PATH指定路径)。用file test.so可以看到test.so是shared object的ELF文件。而静态库test.a只是一个集合包。
peakflys注:linux下,通常静态库以.a方式存在,动态库以.so方式存在;windows下静态库以.lib存在,动态库以.dll方式存在。
所以当gcc编译源文件时经历了test.c -> test.i -> RTL -> test.s -> test.o -> test的过程。当然以上各步可以一步或若干步一起完成,如gcc -o test test.c直接得到可执行文件。当然也可以加上-v来查看在这个过程中,gcc总共做了多少事。

posted on 2013-04-10 09:57 peakflys 阅读(182) 评论(0)  编辑 收藏 引用


只有注册用户登录后才能发表评论。
【推荐】超50万行VC++源码: 大型组态工控、电力仿真CAD与GIS源码库
网站导航: 博客园   IT新闻   BlogJava   知识库   博问   管理


<2022年1月>
2627282930311
2345678
9101112131415
16171819202122
23242526272829
303112345

导航

统计

公告

人不淡定的时候,就爱表现出来,敲代码如此,偶尔的灵感亦如此……

常用链接

留言簿(4)

随笔分类

随笔档案

文章档案

搜索

最新评论

阅读排行榜

评论排行榜