gcc -g -o objdump & nm & addr2line ar & objcopy & readelf & gprof

gcc -o、-g选项

-O设置一共有五种:-O0、-O1、-O2、-O3和-Os。你只能在/etc/make.conf里面设置其中的一种。

除了-O0以外,每一个-O设置都会多启用几个选项,请查阅gcc手册的优化选项章节,以便了解每个-O等级启用了哪些选项及它们有何作用。

让我们来逐一考察各个优化等级:

-O0: 这个等级(字母“O”后面跟个零)关闭所有优化选项。这样就不会优化代码,这通常不是我们想要的。 
-O1:这是最基本的优化等级。与-o等同, 编译器会在不花费太多编译时间的同时试图生成更快更小的代码。这些优化是非常基础的,但一般这些任务肯定能顺利完成。 
-O2:-O1的进阶。这是推荐的优化等级,除非你有特殊的需求。-O2会比-O1启用多一些标记。设置了-O2后,编译器会试图提高代码性能而不会增大体积和大量占用的编译时间。 
-O3:这是最高最危险的优化等级。用这个选项会延长编译代码的时间,并且在使用gcc4.x的系统里不应全局启用。自从3.x版本以来gcc的行为已经有了极大地改变。在3.x,-O3生成的代码也只是比-O2快一点点而已,而gcc4.x中还未必更快。用-O3来编译所有的软件包将产生更大体积更耗内存的二进制文件,大大增加编译失败的机会或不可预知的程序行为(包括错误)。这样做将得不偿失,记住过犹不及。在gcc 4.x.中使用-O3是不推荐的。 
-Os:这个等级用来优化代码尺寸。其中启用了-O2中不会增加磁盘空间占用的代码生成选项。这对于磁盘空间极其紧张或者CPU缓存较小的机器非常有用。但也可能产生些许问题,因此软件树中的大部分ebuild都过滤掉这个等级的优化。使用-Os是不推荐的。 

 

GCC -g选项控制GDB调试级别

如果不打开-g或者-ggdb(GDB专用)调试开关,GCC编译时不会加入调试信息,因为这会增大生成代码的体积。GCC采用了分级调试,通过在-g选项后附加数字1、2或3来指定在代码中加入调试信息量。默认的级别是2(-g2),此时调试信息包括扩展的符号表、行号、局部或外部变量信息。级别3(- g3)包含级别2中的调试信息和源代码中定义的宏。级别1(-g1)不包含局部变量和与行号有关的调试信息,只能用于回溯跟踪和堆栈转储之用。[ 回溯跟踪指的是监视程序在运行过程中的函数调用历史,堆栈转储则是一种以原始的十六进制格式保存程序执行环境的方法,两者都是经常用到的调试手段。 

 


objdump & nm & addr2line

1. objdump

objdump 命令是Linux下的反汇编目标文件或者可执行文件的命令.

a. 反汇编test文件中需要执行指令的section

objdump –d test

b. 反汇编test文件中所有section

objdump –D test

c. 显示test文件的section header信息

objdump –h test

d. 反汇编test文件中需要执行指令的section,并且保留c源代码作为参照

objdump –S test

e. 指定反汇编的指令架构i386,  i386:x86-64等

objdump –d –m i386 test

 

2. nm

nm 用来列出一个目标文件中的各种符号

#cat test.c

static int uninit_static_global;

static int init_static_global = 2;

int unit_global;

char *init_global = "hello, world";

const readOnly = 10;

extern int extern_global;

void function()

{undefined

        printf("Hello");

}

int get_local()

{undefined

            int local;

            static int uninit_local_static;

            static int init_local_static = 10;                      

            local = 33;

            return local;

}

#gcc  -c test.c –g

# nm -A -l -n test.o

test.o:                                 U printf    /home/cr7/test/test.c:31

test.o:0000000000000000 T function /home/cr7/test/test.c:29

test.o:0000000000000000 d init_static_global           /home/cr7/test/test.c:24

test.o:0000000000000000 b uninit_static_global       /home/cr7/test/test.c:23

test.o:0000000000000004 C uninit_global

test.o:0000000000000004 b uninit_local_static.4246            /home/cr7/test/test.c:31

test.o:0000000000000008 D init_global        /home/cr7/test/test.c:26

test.o:0000000000000010 d init_local_static.4247

test.o:0000000000000010 R readOnly           /home/cr7/test/test.c:27

test.o:0000000000000018 T get_local            /home/cr7/test/test.c:33

 

T: text段代表函数

D: 已初始化data段全局数据

d: 已初始化bss段(static)数据

R: 只读数据

C: 未初始化data段全局数据

b: 未初始化bss段(static)数据

 

-A: 显示符号所属文件

-l: 显示符号所属源文件行号

-n: 所有符号从低地址到高地址排序

 

Others: –u 只列出未定义符号; --defined-only将只列出已定义符号

 

3. addr2line

Addr2line 根据一个代码地址,定位到对应的源文件与代码行

#cat test.c

static int global = 2;

void function()

{undefined

            printf("Hello");

            global = 10;    

}

int main()

{undefined

            function();

            return 0;

}

#gcc  -o test test.c  –g

#nm test

00000000004004f4 T function

0000000000601020 d global

0000000000400516 T main

                                 U printf@@GLIBC_2.2.5

#addr2line -a 4004f4 -e test

0x00000000004004f4

/home/cr7/test/test.c:26

-a 文件中地址, -e可执行文件

 

#addr2line -f 4004f4 -e test

function

/home/cr7/test/test.c:26

-f 显示文件中地址所在函数


ar & objcopy & readelf & gprof

ar 用于建立、修改、提取档案文件(archive)。archive是一个包含多个被包含文件的单一文件(也称之为库文件),其结构保证了可以从中检索并得 到原始的被包含文件(称之为archive中的member)。member的原始文件内容、模式(权限)、时间戳、所有着和组等属性都被保存在 archive中。member被提取后,他们的属性被恢复到初始状态。

ar主要用于创建C库文件

创建静态库
(1) 生成目标文件:

$ gcc -Wall -c file1.c file2.c file3.c


不用指定生成.o文件名(默认生成file1.o, file2.o, file3.o)。

(2) 从.o目标文件创建静态连接库
$ ar rv libNAME.a file1.o file2.o file3.o

ar生成了libNAME.a库,并列出库中的文件。
r : 将flie1.o, file2,o, file3.o插入archive,如故原先archive中已经存在某文件,则先将该文件删除。
v : 显示ar操作的附加信息


创建动态库(利用gcc,未用ar)

(1) 生成目标文件

$ gcc -Wall -c -fpic file1.c file2.c file3.c


-fpic: 指定生成的.o目标文件可被重定址. pic是position idependent code的缩写: 位置无关代码.

(2)生成动态库文件

$ gcc -shared -o libNAME.so file1.o file2.o file3.o


一般地, 连接器使用main()函数作为程序入口. 但在动态共享库中没有这样的入口. 所以就要指定-shared选项来避免编译器显示出错信息.

实际上, 上述的两条命令可以合并为下面这条:

$ gcc -Wall -shared -fpic -o libNAME.so file1.c file2.c file3.c



此后,将main函数所在的程序与libNAME.so连接

至此,与动态库连接的函数编译成了一个可执行文件。貌似成功了,但还差最后一步。如果直接运行该程序,会给出这样的错误信息:

error while loading shared libraries: libhello.so:
cannot open shared object file: No such file or directory


这是因为与动态库连接的程序在运行时,首先将该动态库加载到内存中,而gcc默认加载动态库文件所在目录为/usr/local/lib, /usr/lib。刚才的程序虽然能编译成功,但如果我们自己建立的动态库没有位于默认目录中,则执行时会应为无法找到它而失败。

解决办法:改变加载路径对应的环境变量,然后再执行。


export LD_LIBRARY_PATH=动态库所在目录:$LD_LIBRARY_PATH


查看archive内容

$ ar tv archiveNAME


t : 显示archive中member的内容,若不指定member,则列出所有。
v : 与t结合使用时,显示member的详细信息。

要想进了解ar的详细选项,参考ar的on-line manual

 

objcopy

objcopy可以将一种格式的目标文件转化为另外一种格式的目标文件. 它使用GNU BFD库进行读/写目标文件.使用BFD, objcopy就能将原格式的目标文件转化为不同格式的目标文件.
以我们在nm中使用的hello.o目标文件和hello可执行为例:

$ file hello.o hello


file命令用来判别文件类型, 输出如下:

hello.o: ELF 32-bit LSB relocatable, Intel 80386, version 1 (SYSV), not stripped
hello: ELF 32-bit LSB executable, Intel 80386, version 1 (SYSV), for GNU/Linux 2.2.0, dynamically linked (uses shared libs), not stripped

现在运行objcopy来改变hello的文件类型: 原先它是ELF格式的可执行程序, 现将它转换为srec格式. srec格式文件是Motolora S-Record格式的文件, 主要用来在主机和目标机之间传输数据.


$ objcopy -O srec hello hello_srec
$ file hello.o hello


file命令结果: hello_srec: Motorola S-Record; binary data in text format

注意objcopy的格式, "-O"指定输出文件类型; 输入文件名和输出文件名位于命令末尾. 关于objcopy命令的详细选项, 参考on-line manual

 

readelf

readelf用来显示ELF格式目标文件的信息.可通过参数选项来控制显示哪些特定信息.(注意: readelf不支持显示archive文档, 也不支持64位的ELF文件).
下面利用先前的hello可执行文件演示readelf的简单用法:


$ readelf -h hello


ELF Header:
Magic: 7f 45 4c 46 01 01 01 00 00 00 00 00 00 00 00 00
Class: ELF32
Data: 2's complement, little endian
Version: 1 (current)
OS/ABI: UNIX - System V
ABI Version: 0
Type: EXEC (Executable file)
Machine: Intel 80386
Version: 0x1
Entry point address: 0x80482c0
Start of program headers: 52 (bytes into file)
Start of section headers: 3848 (bytes into file)
Flags: 0x0
Size of this header: 52 (bytes)
Size of program headers: 32 (bytes)
Number of program headers: 7
Size of section headers: 40 (bytes)
Number of section headers: 34
Section header string table index: 31

注意: readelf只能用于ELF格式目标文件, 且选项中至少要指定一个(除V, H外)的选项!

 

gprof

gprof被用来测量程序的性能. 它记录每个函数被调用的次数以及相应的执行时间. 这样就能锁定程序执行时花费时间最多的部分, 对程序的优化就可集中于对它们的优化.

用一个简单的数值计算程序来掩饰gprof的用法:

collatz.c:
#include <stdio.h>
/* Computes the length of Collatz sequences */
unsigned int step (unsigned int x)
{
if (x % 2 == 0)
{
return (x / 2);
}
else
{
return (3 * x + 1);
}
}

unsigned int nseq (unsigned int x0)
{
unsigned int i = 1, x;
if (x0 == 1 || x0 == 0)
return i;
x = step (x0);
while (x != 1 && x != 0)
{
x = step (x);
i++;
}
return i;
}

int main (void)
{
unsigned int i, m = 0, im = 0;
for (i = 1; i < 500000; i++)
{
unsigned int k = nseq (i);
if (k > m)
{
m = k;
im = i;
printf ("sequence length = %u for %u\n", m, im);
}
}
return 0;
}


先将collatz.c编译成目标文件collatz.o, gcc通过 -pg选项来打开gprof支持:

$ gcc -Wall -c -pg collatz.c

$ gcc -Wall -pg -o collatz collatz.o


注意:两条命令都要加 "-pg"选项。前一条命令生成collatz.o目标文件。后一条命令生成可执行文件,该可执行文件中包含了记录函数执行时间的指令。
生成collatz可执行文件后,现执行它,结果与一般程序的执行无疑。但此时在PWD目录生成一个名为"gmon.out"的文件,gprof通过它来分析程序的执行。
如果不现执行程序,而直接用gprof来分析它,会提示“gmon.out: No such file or directory”。

gprof用法:

$ gprof ./collatz


 

posted @ 2021-12-30 15:20  Bigben  阅读(317)  评论(0编辑  收藏  举报