<三>从编译器角度理解C++代码编译和链接原理

代码1

**sum.cpp**
int gdata=10;
int sum(int a,int b){
  return a+b;
}

**main.cpp**

extern int gdata;
int sum(int , int );
int data=20;
int main(){
    int a =gdata;
    int b=data;
    int ret=sum(a,b);
    return 0;
}

1:编译

需要关注的几个点
1：.o 文件的格式组成是什么样子？
2：.exe 文件的组成格式是什么样子?
3："所有.o文件段的合并符号表合并后,进行符号解析"
4: "符号的重定位(重定向)"
5: "符号表的输出"=> "符号"
6: 符号什么时候分配虚拟地址?

预编译
以#开头的命令

除#pragma lib -> 链接阶段处理
除#pragma link -> 链接阶段处理

编译
语法分析,语义分析,代码优化 gcc g++

编译汇编后生成相应平台的汇编代码 X86 和 AT&T

链接
链接所有 .o文件和静态库文件

.o 文件主要是由以下组成
elf 文件头
.text
.data
.bss
.symtab
.section table
....

符号表中,在自己文件中定义的,那就是符号定义,如果是引用外部的就是 "UND"符号引用
符号表中的符号都没有分配地址,如下图,所以编译过程中,符号是不分配虚拟地址的,是在链接的时候分配

经过了上面的预编译-》编译-》汇编各个阶段后下面开始进入了链接阶段

main.o 文件 sum.o 文件
上面我们看到 .o 文件是由各个段组成的,所以进入链接阶段的时候
第一步将各个.o 文件的各个段合并

main.o 文件的 .text段与 sum.o 文件的 .text 段合并
main.o 文件的 .data段与 sum.o 文件的 .data 段合并
main.o 文件的 .bss段与 sum.o 文件的 .bss 段合并
main.o 文件的符号表与 sum.o 文件的符号表段合并

第二步非常重要的一点是在main.o文件的符号表与sum.o文件的符号表段合并的时候,需要进行符号解析。
什么是"符号解析"？
所有对符号的引用,都要找到该符号定义的地方 “符号的引用” 即符号为 UND形式, 要找到该符号定义的地方即要找到该符号是在.text 段中定义还是在.data段中定义,
例如:链接器发现main.o文件的sum函数和gdata是UND形式的,那么链接器会去其他文件中找到sum和gdata的定义,如果没找到,那么链接器报错"符号未定义",
如果链接器找到了多个,那么链接器也会报错 “符号重定义”，所以在整个工程中,全局的名字是不能重名的,否则会产生冲突.

符号解析成功以后就开始回给所有的符号分配地址

第三步 "符号重定向"
在符号解析成功以后并且给所有的符号分配地址后,需要继续做 "符号重定向"
在我们指令编译汇编生成.O文件的时候,生成的指令中的符号的地址都是用0 代理,如下图