链接详解

一、基础

ld:GNU的链接器。用来把一定量的目标文件跟档案文件链接在一起,并重新定位它们的数据,链接符号引用。一般编译一个程序时,最后一步就是运行ld进行链接。每一个链接都被一个链接脚本所控制,这个脚本是用链接命令语言书写的。

链接脚本的一个主要目的是描述输入文件中的各个段(数据段,代码段,堆,栈,bss)如何被映射到输出文件中,并控制输出文件的内存排布。

链接器总是使用链接脚本的,如果不提供,则链接器会使用一个缺省的脚本,这个脚本是被编译进链接器可执行文件的。可以使用--verbose命令行显示缺省的链接器脚本的内容,你可以使用-T命令行来提供你自己的链接脚本来替换缺省的链接脚本。

许多脚本是相当简单的,可能最简单的脚本只含有一个命令:’SECTIONS’。你可以使用’SECTIONS’来描述输出文件的内存布局,‘SECTIONS’是一个功能很强大的命令。

假设你的程序只有代码段,初始化过的数据段,和未初始化过的数据段,这些会存在于’.text’,’data’,’bss’段中。对于这个例子,假设代码应该被载入到地址0x1000处,而数据应该从0x8000000开始,如下是实现这个功能的脚本:

SECTIONS

{

.=0x1000;

.text:{*(.text)}

.=0x8000000;

.data:{*(.data)}

.bss:{*(.bss)}

}
具体分析:
关键字'SECTIONS'开始于这个配置,后面跟有一串放在花括号中的符号赋值和输出端描述的内容。
第一行是对一个特殊的符号’.’赋值,这是一个定位标识器.如果你没有以其他的方式制定输出段的地址,那地址值就会被设为定位标识器的现有值,即0x1000.
第二行定义一个输出段,’.text’.冒号’:’是语法需要,现在可以被忽略.段后面的花括号中,应该列出所有应该放入这个输出段中的输入端的名字.’
*’是通配符,匹配所有文件名.即将所有输入文件中的.text段都保存在此段中。
余下的是.data和.bss段,同理,链接器会把所有.data段从地址0x8000000开始处放置。定位标识器的值变为0x8000000加上所有.data段的地址,此时链接器把所有.bss放在此处开始的地址。

设置入口点

在运行一个程序时,第一个被执行到的指令成为”入口点”。你可以使用”ENTRY”链接脚本命令来设置入口点,参数是一个符号名,如ENTRY(SYMBOL)。

有很多不同的方法来设置入口点,链接器会通过按顺序尝试一下方法来设置入口点,如果成功了,就会停止:

1)’-e’ 入口命令行选项。

2)链接脚本中的ENTRY(SYMBOL)命令。

3)如果定义了start,就使用start的值。

4)如果存在就使用’.text’段的首地址。

5)地址’0’。

 

二、命令

1)可用nm查看文件符号表。

2)可用readelf -a main查看elf格式文件。

3)bss段:未初始化的数据,block storage start,或better save apace。

ld用于将多个obj或者so(库)文件链接成可执行文件。

使用-T选项可以指定数据段,代码段,bss段起始位置。(-T只用于链接bootloader、内核等没有底层软件支持的软件,链接运行于操作系统之上的应用程序时,一般使用默认方式链接)。

1)直接指定代码段、数据段、bss段起始地址

如下:

-Ttext startaddr

-Tdata startaddr

-Tbss  startaddr

例如:

ld –Ttext 0x00000000 –g led_on.o –o led_on_elf

2)直接使用链接脚本来设置起始地址

ld –Ttimer.lds –o timer_elf a.o b.o

链接脚本timer.lds内容如下:

SECTIONS{

.=0x30000000;

.text : {*(.text)}

.rodata ALIGN(4) : {*(.rodata)}

.data ALIGN(4) : {*(.data)}

.bss ALIGN(4) : {*.(.bss) *(COMMON)}

}

一个SECTIONS命令内部包含一个或多个段,段(section)是连接脚本的基本单元,它表示输入文件中的某部分怎么放置。

 三、示例

/* stack.c */
char stack[512];

int top = -1;

void push (char c)
{
  stack[++top] = c;
}

char pop(void)
{
  return stack[top--];
}

int is_empty(void)
{
  return top == -1;
}

 
/* main.c */

#include <stdio.h>

int a, b=1;

int main(void)
{
  push('a');
  push('b');
  push('c');
 
  while(!is_empty()){
    putchar(pop());
  }
  putchar('\n');  

  return 0;
}

编译过程:gcc main.c stack.c -o main

              gcc -c  main.c 

              gcc -c stack.c

              gcc main.o stack.o -o main

main.o包含.bss段:a,.data段:b,.text段:main

stack.o包含.bss段:stack,.data段:top,.text段:push,pop,is_empty

main:包含.bss段:a, stack,.data段:b, top,.text段:main,push,pop,is_empty

main中每个段中来自main.o的变量或函数放在前面,是有gcc的链接顺序决定的。当gcc stack.o main.o -o main时stack相关变量和函数放在main前面。

链接过程是由一个链接脚本(linker script)控制的,链接脚本决定了给每个段分配什么地址,如何对齐,哪个段在前,哪个段在后,哪些段合并到同一个segment。

此外链接脚本还要插入一些符号到最终生成的文件中,例如_bss_start、_edata、_end等。

 

posted @ 2015-10-14 19:39  yuxi_o  阅读(548)  评论(0编辑  收藏  举报