链接详解
一、基础
ld:GNU的链接器。用来把一定量的目标文件跟档案文件链接在一起,并重新定位它们的数据,链接符号引用。一般编译一个程序时,最后一步就是运行ld进行链接。每一个链接都被一个链接脚本所控制,这个脚本是用链接命令语言书写的。
链接脚本的一个主要目的是描述输入文件中的各个段(数据段,代码段,堆,栈,bss)如何被映射到输出文件中,并控制输出文件的内存排布。
链接器总是使用链接脚本的,如果不提供,则链接器会使用一个缺省的脚本,这个脚本是被编译进链接器可执行文件的。可以使用--verbose命令行显示缺省的链接器脚本的内容,你可以使用-T命令行来提供你自己的链接脚本来替换缺省的链接脚本。
许多脚本是相当简单的,可能最简单的脚本只含有一个命令:’SECTIONS’。你可以使用’SECTIONS’来描述输出文件的内存布局,‘SECTIONS’是一个功能很强大的命令。
假设你的程序只有代码段,初始化过的数据段,和未初始化过的数据段,这些会存在于’.text’,’data’,’bss’段中。对于这个例子,假设代码应该被载入到地址0x1000处,而数据应该从0x8000000开始,如下是实现这个功能的脚本:
SECTIONS { .=0x1000; .text:{*(.text)} .=0x8000000; .data:{*(.data)} .bss:{*(.bss)} }
具体分析: 关键字'SECTIONS'开始于这个配置,后面跟有一串放在花括号中的符号赋值和输出端描述的内容。
第一行是对一个特殊的符号’.’赋值,这是一个定位标识器.如果你没有以其他的方式制定输出段的地址,那地址值就会被设为定位标识器的现有值,即0x1000.
第二行定义一个输出段,’.text’.冒号’:’是语法需要,现在可以被忽略.段后面的花括号中,应该列出所有应该放入这个输出段中的输入端的名字.’*’是通配符,匹配所有文件名.即将所有输入文件中的.text段都保存在此段中。
余下的是.data和.bss段,同理,链接器会把所有.data段从地址0x8000000开始处放置。定位标识器的值变为0x8000000加上所有.data段的地址,此时链接器把所有.bss放在此处开始的地址。
设置入口点
在运行一个程序时,第一个被执行到的指令成为”入口点”。你可以使用”ENTRY”链接脚本命令来设置入口点,参数是一个符号名,如ENTRY(SYMBOL)。
有很多不同的方法来设置入口点,链接器会通过按顺序尝试一下方法来设置入口点,如果成功了,就会停止:
1)’-e’ 入口命令行选项。 2)链接脚本中的ENTRY(SYMBOL)命令。 3)如果定义了start,就使用start的值。 4)如果存在就使用’.text’段的首地址。 5)地址’0’。
二、命令
1)可用nm查看文件符号表。
2)可用readelf -a main查看elf格式文件。
3)bss段:未初始化的数据,block storage start,或better save apace。
ld用于将多个obj或者so(库)文件链接成可执行文件。
使用-T选项可以指定数据段,代码段,bss段起始位置。(-T只用于链接bootloader、内核等没有底层软件支持的软件,链接运行于操作系统之上的应用程序时,一般使用默认方式链接)。
1)直接指定代码段、数据段、bss段起始地址
如下:
-Ttext startaddr
-Tdata startaddr
-Tbss startaddr
例如:
ld –Ttext 0x00000000 –g led_on.o –o led_on_elf
2)直接使用链接脚本来设置起始地址
ld –Ttimer.lds –o timer_elf a.o b.o
链接脚本timer.lds内容如下:
SECTIONS{ .=0x30000000; .text : {*(.text)} .rodata ALIGN(4) : {*(.rodata)} .data ALIGN(4) : {*(.data)} .bss ALIGN(4) : {*.(.bss) *(COMMON)} }
一个SECTIONS命令内部包含一个或多个段,段(section)是连接脚本的基本单元,它表示输入文件中的某部分怎么放置。
三、示例
/* stack.c */ char stack[512]; int top = -1; void push (char c) { stack[++top] = c; } char pop(void) { return stack[top--]; } int is_empty(void) { return top == -1; } /* main.c */ #include <stdio.h> int a, b=1; int main(void) { push('a'); push('b'); push('c'); while(!is_empty()){ putchar(pop()); } putchar('\n'); return 0; }
编译过程:gcc main.c stack.c -o main
gcc -c main.c
gcc -c stack.c
gcc main.o stack.o -o main
main.o包含.bss段:a,.data段:b,.text段:main
stack.o包含.bss段:stack,.data段:top,.text段:push,pop,is_empty
main:包含.bss段:a, stack,.data段:b, top,.text段:main,push,pop,is_empty
main中每个段中来自main.o的变量或函数放在前面,是有gcc的链接顺序决定的。当gcc stack.o main.o -o main时stack相关变量和函数放在main前面。
链接过程是由一个链接脚本(linker script)控制的,链接脚本决定了给每个段分配什么地址,如何对齐,哪个段在前,哪个段在后,哪些段合并到同一个segment。
此外链接脚本还要插入一些符号到最终生成的文件中,例如_bss_start、_edata、_end等。