gnu binutils(addr2line ar gprof nm objcopy ...)

GNU binutils是一组二进制工具集。包括：addr2line ar gprof nm objcopy objdump ranlib size strings strip. 本文归纳他们的常用法。

ar

ar 用于建立、修改、提取档案文件(archive)。archive是一个包含多个被包含文件的单一文件（也称之为库文件），其结构保证了可以从中检索并得到原始的被包含文件（称之为archive中的member）。member的原始文件内容、模式（权限）、时间戳、所有着和组等属性都被保存在 archive中。member被提取后，他们的属性被恢复到初始状态。

ar主要用于创建C库文件

创建静态库
(1) 生成目标文件：

$ gcc -Wall -c file1.c file2.c file3.c

不用指定生成.o文件名(默认生成file1.o, file2.o, file3.o)。

(2) 从.o目标文件创建静态连接库
$ ar rv libNAME.a file1.o file2.o file3.o

ar生成了libNAME.a库，并列出库中的文件。
r : 将flie1.o, file2,o, file3.o插入archive，如故原先archive中已经存在某文件，则先将该文件删除。
v : 显示ar操作的附加信息

创建动态库(利用gcc，未用ar)

(1) 生成目标文件

$ gcc -Wall -c -fpic file1.c file2.c file3.c

-fpic: 指定生成的.o目标文件可被重定址. pic是position idependent code的缩写: 位置无关代码.

(2)生成动态库文件

$ gcc -shared -o libNAME.so file1.o file2.o file3.o

一般地, 连接器使用main()函数作为程序入口. 但在动态共享库中没有这样的入口. 所以就要指定-shared选项来避免编译器显示出错信息.

实际上, 上述的两条命令可以合并为下面这条:

$ gcc -Wall -shared -fpic -o libNAME.so file1.c file2.c file3.c

此后，将main函数所在的程序与libNAME.so连接

至此，与动态库连接的函数编译成了一个可执行文件。貌似成功了，但还差最后一步。如果直接运行该程序，会给出这样的错误信息:

error while loading shared libraries: libhello.so:
cannot open shared object file: No such file or directory

这是因为与动态库连接的程序在运行时，首先将该动态库加载到内存中，而gcc默认加载动态库文件所在目录为/usr/local/lib, /usr/lib。刚才的程序虽然能编译成功，但如果我们自己建立的动态库没有位于默认目录中，则执行时会应为无法找到它而失败。

解决办法：改变加载路径对应的环境变量，然后再执行。

export LD_LIBRARY_PATH=动态库所在目录:$LD_LIBRARY_PATH

查看archive内容

$ ar tv archiveNAME

t : 显示archive中member的内容，若不指定member，则列出所有。
v : 与t结合使用时，显示member的详细信息。

要想进了解ar的详细选项，参考ar的on-line manual

nm

nm用来列出目标文件中的符号，可以帮助程序员定位和分析执行程序和目标文件中的符号信息和它的属性。
如果没有目标文件作为参数传递给nm, nm假定目标文件为a.out.
这里用一个简单的示例程序来介绍nm的用法:

main.c:

int main(int argc, char *argv[])
{
hello();
bye();
return 0;
}

hello.c:

void hello(void)
{
printf("hello!\n");
}

bye.c:

void bye(void)
{
printf("good bye!\n");
}

运行下列命令:
$ gcc -Wall -c main.c hello.c bye.c
gcc生成main.o, hello.o, bye.o三个目标文件(这里没有声明函数原型,加了-Wall,gcc会给出警告)
$ nm main.o hello.o bye.o

结果显示如下:

main.o:
U bye
U hello
00000000 T main

hello.o:
00000000 T hello
U puts

bye.o:
00000000 T bye
U puts

结合这些输出结果,以及程序代码,可以知道:
对于main.o, bye和hello未被定义, main被定义了
对于hello.o, hello被定义了, puts未被定义
对于bye.o, bye被定义了,puts未被定义

几个值得注意的问题:
(1)"目标文件"指.o文件, 库文件, 最终的可执行文件
.o : 编译后的目标文件，即含有最终编译出的机器码，但它里面所引用的其他文件中函数的内存位置尚未定义.
(2)如果用nm查看可执行文件, 输出会比较多, 仔细研究输出, 可以对nm用法有更清醒的认识.
(3) 在上述hello.c, bye.c中, 调用的是printf(), 而nm输出中显示调用的是puts(), 说明最终程序实际调用的puts(), 如果令hello.c或bye.c中的printf()使用格式化输出,则nm显示调用printf(). ( 如: printf("%d", 1); )

关于nm的参数选项,参考on-line manual

objcopy

objcopy可以将一种格式的目标文件转化为另外一种格式的目标文件. 它使用GNU BFD库进行读/写目标文件.使用BFD, objcopy就能将原格式的目标文件转化为不同格式的目标文件.
以我们在nm中使用的hello.o目标文件和hello可执行为例:

$ file hello.o hello

file命令用来判别文件类型, 输出如下:

hello.o: ELF 32-bit LSB relocatable, Intel 80386, version 1 (SYSV), not stripped
hello: ELF 32-bit LSB executable, Intel 80386, version 1 (SYSV), for GNU/Linux 2.2.0, dynamically linked (uses shared libs), not stripped

现在运行objcopy来改变hello的文件类型: 原先它是ELF格式的可执行程序, 现将它转换为srec格式. srec格式文件是Motolora S-Record格式的文件, 主要用来在主机和目标机之间传输数据.

$ objcopy -O srec hello hello_srec
$ file hello.o hello

file命令结果: hello_srec: Motorola S-Record; binary data in text format

注意objcopy的格式, "-O"指定输出文件类型; 输入文件名和输出文件名位于命令末尾. 关于objcopy命令的详细选项, 参考on-line manual

objdump

objdump用来显示目标文件的信息. 可以通过选项控制显示那些特定信息. objdump一个最大的用处恐怕就是将C代码反汇编了. 在嵌入式软件开发过程中, 也可以用它查看执行文件或库文件的信息.
下面我们用上文提到的hello可执行文件和hello_srec可执行文件为例, 介绍objdump的简单用法:

$ objdump -f hello hello_srec

输出如下:
hello: file format elf32-i386
architecture: i386, flags 0x00000112:
EXEC_P, HAS_SYMS, D_PAGED
start address 0x080482c0

hello_srec: file format srec
architecture: UNKNOWN!, flags 0x00000000:
start address 0x00000000080482c0

-f : 显示目标文件的头文件概要信息.

生成反汇编代码:

$ objdump -d hello.o

显示如下:
hello.o: file format elf32-i386

Disassembly of section .text:

00000000 <hello>:
0: 55 push %ebp
1: 89 e5 mov %esp,%ebp
3: 83 ec 08 sub x8,%esp
6: 83 ec 0c sub xc,%esp
9: 68 00 00 00 00 push x0
e: e8 fc ff ff ff call f <hello+0xf>
13: 83 c4 10 add x10,%esp
16: c9 leave
17: c3 ret

-d : 显示目标文件中机器指令使用的汇编语言. 只反汇编那些应该含有指令机器码的节(显示.text段); 如果用-D, 则反汇编所有节的内容.
关于objcopy命令的详细选项, 参考on-line manual

readelf

readelf用来显示ELF格式目标文件的信息.可通过参数选项来控制显示哪些特定信息.(注意: readelf不支持显示archive文档, 也不支持64位的ELF文件).
下面利用先前的hello可执行文件演示readelf的简单用法:

$ readelf -h hello

ELF Header:
Magic: 7f 45 4c 46 01 01 01 00 00 00 00 00 00 00 00 00
Class: ELF32
Data: 2's complement, little endian
Version: 1 (current)
OS/ABI: UNIX - System V
ABI Version: 0
Type: EXEC (Executable file)
Machine: Intel 80386
Version: 0x1
Entry point address: 0x80482c0
Start of program headers: 52 (bytes into file)
Start of section headers: 3848 (bytes into file)
Flags: 0x0
Size of this header: 52 (bytes)
Size of program headers: 32 (bytes)
Number of program headers: 7
Size of section headers: 40 (bytes)
Number of section headers: 34
Section header string table index: 31

注意: readelf只能用于ELF格式目标文件, 且选项中至少要指定一个(除V, H外)的选项!

gprof

gprof被用来测量程序的性能. 它记录每个函数被调用的次数以及相应的执行时间. 这样就能锁定程序执行时花费时间最多的部分, 对程序的优化就可集中于对它们的优化.

用一个简单的数值计算程序来掩饰gprof的用法:

collatz.c:
#include <stdio.h>
/* Computes the length of Collatz sequences */
unsigned int step (unsigned int x)
{
if (x % 2 == 0)
{
return (x / 2);
}
else
{
return (3 * x + 1);
}
}

unsigned int nseq (unsigned int x0)
{
unsigned int i = 1, x;
if (x0 == 1 || x0 == 0)
return i;
x = step (x0);
while (x != 1 && x != 0)
{
x = step (x);
i++;
}
return i;
}

int main (void)
{
unsigned int i, m = 0, im = 0;
for (i = 1; i < 500000; i++)
{
unsigned int k = nseq (i);
if (k > m)
{
m = k;
im = i;
printf ("sequence length = %u for %u\n", m, im);
}
}
return 0;
}

先将collatz.c编译成目标文件collatz.o， gcc通过 -pg选项来打开gprof支持：

$ gcc -Wall -c -pg collatz.c

$ gcc -Wall -pg -o collatz collatz.o

注意：两条命令都要加 "-pg"选项。前一条命令生成collatz.o目标文件。后一条命令生成可执行文件，该可执行文件中包含了记录函数执行时间的指令。
生成collatz可执行文件后，现执行它，结果与一般程序的执行无疑。但此时在PWD目录生成一个名为"gmon.out"的文件，gprof通过它来分析程序的执行。
如果不现执行程序，而直接用gprof来分析它，会提示“gmon.out: No such file or directory”。

gprof用法：

$ gprof ./collatz

Addr2line

Addr2line 工具（它是标准的 GNU Binutils 中的一部分）是一个可以将指令的地址和可执行映像转换成文件名、函数名和源代码行数的工具。这种功能对于将跟踪地址转换成更有意义的内容来说简直是太棒了。

要了解这个过程是怎样工作的，我们可以试验一个简单的交互式的例子。（我直接从 shell 中进行操作，因为这是最简单地展示这个过程的方法，如清单 4 所示。）这个示例 C 文件（test.c）是通过 cat 一个简单的应用程序实现的（也就是说，将标准输出的文本重定向到一个文件中）。然后使用 gcc 来编译这个文件，它会传递一些特殊的选项。首先，要（使用 -Wl 选项）通知链接器生成一个映像文件，并（使用 -g 选项）通知编译器生成调试符号。最终生成可执行文件 test。得到新的可执行应用程序之后，您就可以使用 grep 工具在映像文件中查找 main 来寻找它的地址了。使用这个地址和 Addr2line 工具，就可以判断出函数名（main）、源文件（/home/mtj/test/test.c）以及它在源文件中的行号（4）。

在调用 Addr2line 工具时，要使用 -e 选项来指定可执行映像是 test。通过使用 -f 选项，可以告诉工具输出函数名。

清单 4. addr2line 的一个交互式例子

$ cat >> test.c
#include <stdio.h>
int main()
{
printf("Hello World\n");
return 0;
}
<ctld-d>
$ gcc -Wl,-Map=test.map -g -o test test.c
$ grep main test.map
0x08048258 __libc_start_main@@GLIBC_2.0
0x08048258 main
$ addr2line 0x08048258 -e test -f
main
/home/mtj/test/test.c:4
$

posted on 2012-04-24 10:28 Bluesea 阅读(1161) 评论(0) 编辑收藏引用所属分类: linux

常用链接

留言簿(4)

随笔分类(79)

随笔档案(80)

文章分类

最新随笔

搜索

最新评论

阅读排行榜

评论排行榜

只有注册用户登录后才能发表评论。


相关文章: linux内核网络栈 gnu binutils(addr2line ar gprof nm objcopy ...) [linux]探索Linux启动过程

网站导航: 博客园博客园最新博文博问管理