【C语言深度解剖】一篇解决程序的环境【编译+链接详解】让面试官给我们竖起大拇指
【C语言深度解剖】【Linux操作系统】程序的环境【编译+链接详解】
那么这里博主先安利一下一些干货满满的专栏啦!
作者: #西城s
这是我的主页:#西城s
在食用这篇博客之前,博主在这里介绍一下其它高质量的编程学习栏目:
数据结构专栏:数据结构 这里包含了博主很多的数据结构学习上的总结,每一篇都是超级用心编写的,有兴趣的伙伴们都支持一下吧!
算法专栏:算法 这里可以说是博主的刷题历程,里面总结了一些经典的力扣上的题目,和算法实现的总结,对考试和竞赛都是很有帮助的!
力扣刷题专栏:Leetcode想要冲击ACM、蓝桥杯或者大学生程序设计竞赛的伙伴,这里面都是博主的刷题记录,希望对你们有帮助!
C的深度解剖专栏:C语言的深度解剖想要深度学习C语言里面所蕴含的各种智慧,各种功能的底层实现的初学者们,相信这个专栏对你们会有帮助的!
今天博主将带大家详细深入地解剖C程序编译的过程,这些是我们内功修炼的必要知识,学会这些,让面试官给你竖起大拇指。
不收藏必后悔系列篇~
程序的翻译环境
- 在ANSI C的任何一种实现中,存在两个不同的环境。
第1种是翻译环境,在这个环境中源代码被转换为可执行的机器指令(.exe)
。
第2种是执行环境,它用于实际执行代码。
即:
翻译环境详解
首先,我们知道编译这个过程,可以将test.c
变成test.exe
,那么,在此期间的过程,我们也要深入研究。
翻译环境基本原理:
每个源文件单独经过编译器处理后,生成相对应的目标文件(.obj)
之后,结合链接库,经过编译器处理后,形成可执行程序(.exe)
。
IDE介绍:
VS2022
DEV C++
CodeBlocks
Clion
集成开发环境-IDE
继承了编辑,编译,链接,调试等功能
这些IDE里面在下载的时候都一定带有两个可执行程序
cl.exe(编译器),link.exe(编译器)
具体过程如下:
如图:
test.c----test.obj
contact.c-----contact.obj
每个源文件经过编译器生成对应的目标文件(.obj)
文件之后
加上链接库经过链接器—可执行程序(链接库:库函数等)
编译
编译:预处理+编译+汇编
经过上述阶段之后,我们就可以得到.obj
文件了。
讲解代码:
我们创建两个源文件test.c和add.c
test.c:
extern int Add(int, int);
int main() {
int a = 10;
int b = 20;
int c = Add(a, b);
printf("%d\n", c);
return 0;
}
add.c:
int Add(int x, int y) {
return x + y;
}
我们就用这两个简单的代码给大家解释编译的详细过程,以及预处理,编译,汇编的每一步的结果
- 由于
VS
等IDE软件已经高度集成,我们无法看到编译中间的详细过程,因此博主在这里使用linux
操作系统下的gcc
编译器为大家演示。
我们先写好代码:
使用vim编辑器编辑源文件:
写好代码,我们先跑一次,看看有没有问题出现先,后面我们再拆开每一步讲解:
我们可以看到,结果是30。说明没问题,ok,我们开始拆解编译过程。
预编译
为了更好的观察每一个步骤,这里食用Linux gcc来演示
gcc test.c -E (在预编译之后停下来)
再-o 放到test.i里面
所以
gcc test.c -E -o test.i
用vim
打开来观察一下
预编译结果:
预编译结果其实完成了这么几件事情:
- 头文件的包含 我们刚才打开
test.i
看到前面的一大堆,其实都是头文件的包含,就是把头文件内容复制进去了。 - 预定义指令实现的替换和删除 #define所定义的符号完成替换,宏完成替换,条件编译(为假)的内容完成删除。如果对C语言预定义问题还存在疑问的伙伴,可以通过博主的传送门学习,也是满满干货的噢!【预定义】C语言预定义代码(宏、条件编译等)内容介绍【最全的保姆级别教程】
- 注释完成删除
编译
指令:-S
结果:生成一个.i
文件,里面是汇编代码。
所以在这时期:把C语言代码翻译成了汇编代码
- 语法词法分析
- 语义分析
- 符号汇总(把一些全局的符号汇总起来,为下一步汇编时符号表的生成做准备)
汇编
指令: -c
结果:生成test.o
文件
windows环境下:目标文件:xxx.obj
linux环境下:目标文件:xxx.o
目标文件是二进制的—是看不懂的
此过程:
- 把汇编指令翻译成二进制指令
完成的东西:
- 形成符号表
关于形成符号表
在汇编这个过程,符号表的形成时需要我们理解的,这是在为链接做准备。
形成符号表是啥意思呢?
- 简单来说就是让全局的符号形成一个符号和地址的表:比如
Add
,因为这个符号是要跨文件使用的,test.c
里要用,add.c
里也要用,这些符号是要形成符号表的,但是add.c
里面的临时变量x
,y
这些是不用的,因为它们只在add.c
里面的一个函数里能用。
比如:
test.o的符号表
符号 | 地址 |
---|---|
Add | 0x00 |
main | 0x19 |
add.o的符号表
符号 | 地址 |
---|---|
Add | 0xff |
注意:
- 我们
test.o
所对应的Add
符号的地址,是无效地址,为什么:因为在test.c
里面我们根本没有定义Add
这个函数所以无效,而add.o
里面那个才是有效的。
那么我们如何去演示呢?
首先.o
文件我们肯定是看不懂的,因为这个文件的格式其实是叫做elf
格式,Linux
上有一个工具叫做readelf
可以帮我们翻译这个.o
文件。
里面有很多选项可以看,我们看符号表就行了
对比两个符号表:
形成符号表之后,我们编译这个环节,就完成了,cl.exe
(编译器)的使命就完成了。
那么符号表到底有啥用呢?接下来,到了链接环节。
链接
链接:
- 合并段表
- 符号表的合并和重定位
合并段表:就是把相同的东西合并在一起。 这个过程博主不详细给大家讲解了。
接下来我们来详细说说,符号表的合并和重定位。
我们来看看上一阶段我们生成的两个符号表:
我们要将其合并。
合并的意思就是,我们来找相同的符号。
比如Add
符号,链接器找到两个Add
。这时,链接器会发现,有一个Add
的地址是有效的,有一个是无效的,此时链接器会丢弃无效的那个地址,保留有效的地址。
其实简单来说就是把源文件弄在一起了。
那么我们懂得这个知识之后,我们就可以知道我们平时在学习过程中常见的错误是什么意思了。
- 如果我们将刚才的
add.c
里面的内容删掉,或者把Add
函数改个名字,这样我们在合并符号表的时候,test.c
里面那个Add
是无效的,这时,链接器就会去表里找,找有效的Add,找不到,就会报错了,这个错误就是链接错误!
这样我们就能很好地理解这个错误是怎么报出来的了。
成功生成目标文件之后,链接期间,找不到Add
了—报链接错误。
运行环境
程序执行的过程:
- 程序必须载入内存中。在有操作系统的环境中:一般这个由操作系统完成。在独立的环境中,程序
的载入必须由手工安排,也可能是通过可执行代码置入只读内存来完成。 - 程序的执行便开始。接着便调用
main
函数。
尾声
如果对预编译(预处理)这个过程感兴趣的伙伴,可以通过博主提供 的传送门食用。【预定义】C语言预定义代码(宏、条件编译等)内容介绍【最全的保姆级别教程】
看到这里,相信大家已经对程序的编译,运行等过程有了比较深入的了解了,其实学习这些对我们写代码能力的帮助其实是不大的,但是这些都是内功的修炼,都是硬核知识,在我们找工作,或者在完成项目时,这种深入的理解对我们的帮助是非常大的。
如果你觉得这篇文章对你有帮助的话,不要忘了一键三连后再离开噢!