C语言真正的编译过程

说实话，很多人做了很久的C/C++,也用了很多IDE，但是对于可执行程序的底层生成一片茫然，这无疑是一种悲哀，可以想象到大公司面试正好被问到这样的问题，有多悲催不言而喻，这里正由于换工作的缘故，所以打算系统的把之前用到的C/C++补一补。这里权且当做抛砖引玉，大神飘过。

【总述】

从一个源文件(.c)到可执行程序到底经历了哪几步，我想大多数的人都知道，到时到底每一步都做了什么，我估计也没多少人能够说得清清楚楚，明明白白。

其实总的流程是这样的。

【第一步】编辑hello.c

1 #include <stdio.h>
2 #include <stdlib.h>
3 int main()
4 {
5         printf("hello world!\n");
6         return 0;
7 }

【第二步】预处理

预处理过程实质上是处理“#”，将#include包含的头文件直接拷贝到hell.c当中；将#define定义的宏进行替换，同时将代码中没用的注释部分删除等

具体做的事儿如下：

（1）将所有的#define删除，并且展开所有的宏定义。说白了就是字符替换

（2）处理所有的条件编译指令，#ifdef #ifndef #endif等，就是带#的那些

（3）处理#include，将#include指向的文件插入到该行处

（4）删除所有注释

（5）添加行号和文件标示，这样的在调试和编译出错的时候才知道是是哪个文件的哪一行

（6）保留#pragma编译器指令，因为编译器需要使用它们。

gcc -E hello.c -o a.c可以生成预处理后的文件。通过查看文件内容和文件大小可以得知a.c讲stdio.h和stdlib.h包含了进来。

【第三步】编译

编译的过程实质上是把高级语言翻译成机器语言的过程，即对a.c做了这些事儿

（1）词法分析，

（2）语法分析

（3）语义分析

（4）优化后生成相应的汇编代码

从高级语言->汇编语言->机器语言（二进制）

gcc -S hello.c -o a.s可以生成汇编代码

汇编代码如下。

 1         .file   "hello.c"
 2         .section        .rodata
 3 .LC0:
 4         .string "hello world!"
 5         .text
 6         .globl  main
 7         .type   main, @function
 8 main:
 9 .LFB0:
10         .cfi_startproc
11         pushl   %ebp
12         .cfi_def_cfa_offset 8
13         .cfi_offset 5, -8
14         movl    %esp, %ebp
15         .cfi_def_cfa_register 5
16         andl    $-16, %esp
17         subl    $16, %esp
18         movl    $.LC0, (%esp)
19         call    puts
20         movl    $0, %eax
21         leave
22         .cfi_restore 5
23         .cfi_def_cfa 4, 4
24         ret 
25         .cfi_endproc
26 .LFE0:
27         .size   main, .-main
28         .ident  "GCC: (Ubuntu/Linaro 4.6.3-1ubuntu5) 4.6.3"
29         .section        .note.GNU-stack,"",@progbits

gcc -c hello.c -o a.o将源文件翻译成二进制文件。类Uinx系统编译的结果生生成.o文件，Windows系统是生成.obj文件。

编译的过程就是把hello.c翻译成二进制文件

【第四步】链接

就像刚才的hello.c它使用到了C标准库的东西“printf”，但是编译过程只是把源文件翻译成二进制而已，这个二进制还不能直接执行，这个时候就需要做一个动作，

将翻译成的二进制与需要用到库绑定在一块。打个比方编译的过程就向你对你老婆说，我要吃雪糕。你只是给你老婆发出了你要吃雪糕的诉求而已，但是雪糕还没有到。

绑定就是说你要吃的雪糕你的老婆已经给你买了，你可以happy。

gcc hello.c -o a可以生成可执行程序。即gcc不带任何参数。ldd就可以看到你的可执行程序依赖的库。

可以看到a.o的大小是1.1k，毕竟他只是把源文件翻译成二进制文件。a却有7k，应该是他多了很多“绳子”吧。在运行的时候这些“绳子”就将对应的库函数“牵过来”。很形象的比喻是不是？哈哈。libc.so.6 中就对咱们用的printf进行了定义。

posted @ 2020-05-20 10:36 鲸小鱼- 阅读(157) 评论(0) 编辑收藏举报

刷新页面返回顶部

登录后才能查看或发表评论，立即登录或者逛逛博客园首页

阅读排行：
· TypeScript + Deepseek 打造卜卦网站：技术与玄学的结合
· Manus的开源复刻OpenManus初探
· AI 智能体引爆开源社区「GitHub 热点速览」
· C#/.NET/.NET Core技术前沿周刊 | 第 29 期（2025年3.1-3.9）
· 从HTTP原因短语缺失研究HTTP/2和HTTP/3的设计差异

历史上的今天：
2019-05-20 C++继承-重载-多态-虚函数

公告

昵称：鲸小鱼-
园龄： 6年6个月
粉丝： 69
关注： 14

+加关注

2025年3月

日

一

二

三

四

五

六

鲸小鱼的博客

富强民主文明和谐自由平等公正法治爱国敬业诚信友善

C语言真正的编译过程

【总述】

【第一步】编辑hello.c

【第二步】预处理

【第三步】编译

【第四步】链接

公告

搜索

常用链接

最新随笔

积分与排名

合集 (1)

随笔分类 (273)

随笔档案 (260)

阅读排行榜

评论排行榜

推荐排行榜

最新评论

鲸小鱼的博客

富强 民主 文明 和谐 自由 平等 公正 法治 爱国 敬业 诚信 友善

C语言真正的编译过程

【总述】

【第一步】编辑hello.c

【第二步】预处理

【第三步】编译

【第四步】链接

公告

搜索

常用链接

最新随笔

积分与排名

合集 (1)

随笔分类 (273)

随笔档案 (260)

阅读排行榜

评论排行榜

推荐排行榜

最新评论

富强民主文明和谐自由平等公正法治爱国敬业诚信友善