Linux——Gcc
1. Gcc简介
GCC 原名为 GNU C Compiler,是一个用于Linux系统下编程的编译器。经过了这么多年的发展,GCC 已经不仅仅能支持 C 语言;它现在还支持 Ada 语言、C++ 语言、Java 语言、Objective C 语言、Pascal 语言、COBOL语言,以及支持函数式编程和逻辑编程的 Mercury 语言,等等。而 GCC 也不再单只是 GNU C 语言编译器的意思了,而是变成了 GNU Compiler Collection 也即是 GNU 编译器家族的意思了。另一方面,说到 GCC 对于操作系统平台及硬件平台支持,概括起来就是一句话:无所不在。
2.单个文件的简单编译
示例程序test.c
//test.c
#include <stdio.h>
int main(void)
{
printf("Hello World!\n");
return 0;
}
这个程序一步到位的编译指令为:
#gcc test.c -o test
实质上,上述编译过程是分为四个阶段进行的,即预处理(也称预编译,Preprocessing)、编译(Compilation)、汇编 (Assembly)和连接(Linking)。
2.1 预处理
#gcc -E test.c -o test.i //可以查看test.i,里面存放着test.c经过预处理后的代码
或者
#gcc -E test.c //直接在命令行窗口中输出预处理后的代码
gcc的-E选项,可以让编译器在预处理后停止,并输出预处理结果。在本例中,预处理结果就是将stdio.h 文件中的内容插入到test.c中了。
2.2 编译为汇编代码
预处理之后,可以直接对生成的test.i进行编译,生成汇编代码:
#gcc -S test.i -o test.s
gcc的-S选项,表示在程序编译期间,在生成汇编代码后,停止,-o输出汇编代码文件。
2.3 汇编
对上面生成的汇编代码test.s,gas汇编器负责将其编译为目标文件。
#gcc -c test.s -o test.o
gas汇编器是Linux平台的标准汇编器,它是gcc所依赖的后台汇编工具,通常包含在binutils软件包中。gas使用标准的AT&T汇编语法。
2.4 连接
gcc连接器是gas提供的,负责将程序的目标文件与所需的所有附加的目标文件连接起来,最终生成可执行文件。附加的目标文件包括静态连接库和动态连接库。
对于上面生成的test.o,将其与C标准输入输出库进行连接,最终生成程序test。
#gcc test.o -o test
运行./test即可输出“Hello World!”。
3.多个程序文件的编译
通常整个程序是由多个源文件组成的,相应地也就形成了多个编译单元,使用GCC能够很好地管理这些编译单元。假设有一个由test1.c和 test2.c两个源文件组成的程序,为了对它们进行编译,并最终生成可执行程序test,可以使用下面这条命令:
#gcc test1.c test2.c -o test
如果同时处理的文件不止一个,GCC仍然会按照预处理、编译和链接的过程依次进行。如果深究起来,上面这条命令大致相当于依次执行如下三条命令:
#gcc -c test1.c -o test1.o
#gcc -c test2.c -o test2.o
#gcc test1.o test2.o -o test
4.检错
#gcc -pedantic illcode.c -o illcode -pedantic
编译选项并不能保证被编译程序与ANSI/ISO C标准的完全兼容,它仅仅只能用来帮助Linux程序员离这个目标越来越近。或者换句话说,-pedantic选项能够帮助程序员发现一些不符合 ANSI/ISO C标准的代码,但不是全部,事实上只有ANSI/ISO C语言标准中要求进行编译器诊断的那些情况,才有可能被GCC发现并提出警告。
除了-pedantic之外,GCC还有一些其它编译选项也能够产生有用的警告信息。这些选项大多以-W开头,其中最有价值的当数-Wall了,使用它能够使GCC产生尽可能多的警告信息。
#gcc -Wall illcode.c -o illcode GCC
给出的警告信息虽然从严格意义上说不能算作错误,但却很可能成为错误的栖身之所。一个优秀的Linux程序员应该尽量避免产生警告信息,使自己的代码始终保持标准、健壮的特性。所以将警告信息当成编码错误来对待,是一种值得赞扬的行为!所以,在编译程序时带上-Werror选项,那么GCC会在所有产生警告的地方停止编译,迫使程序员对自己的代码进行修改,如下:
#gcc -Werror test.c -o test
5. gcc链接外部函数库
5.1以数学函数库为例
库是预编译的目标文件(object files)的集合,它们可被链接进程序。静态库以后缀为‘.a’的特殊的存档文件(archive file)存储。
标准系统库可在目录 /usr/lib 与 /lib 中找到。比如,在类 Unix 系统中 C 语言的数学库一般存储为文件 /usr/lib/libm.a。该库中函数的原型声明在头文件 /usr/include/math.h 中。
C 标准库本身存储为 /usr/lib/libc.a,它包含 ANSI/ISO C 标准指定的函数,比如‘printf’。对每一个 C 程序来说,libc.a 都默认被链接。
下面的是一个调用数学库 libm.a 中 sin 函数的的例子。源文件sin.c
#include <math.h>
#include <stdio.h>
int main (void)
{
double x = 2.0;
double y = sin (x);
printf ("The value of sin(2.0) is %f\n", y);
return ;
}
(1)如果试图单独从该文件生成一个可执行文件将导致一个链接阶段的错误:
#gcc -Wall sin.c -o sin
/tmp/ccbR6Ojm.o: In function 'main':
/tmp/ccbR6Ojm.o(.text+0x19): undefined reference to ‘sin’
因为函数sin未在本程序中定义,也不在默认库‘libc.a’中;除非被指定,否则编译器也不会链接‘libm.a’。
(2)为使编译器能将 sin 链接进主程序‘sin.c’,我们需要提供数学库‘libm.a’。一个比较麻烦的做法是在命令行中显式地指定它:
#gcc -Wall sin.c /usr/lib/libm.a -o sin
函数库‘libm.a’包含所有数学函数的目标文件,比如sin,cos,exp,log及sqrt。链接器将搜索所有文件来找到包含 sin 的目标文件。一旦包含 sin 的目标文件被找到,主程序就能被链接,一个完整的可执行文件就可生成了。直接运行./sin即可。
可执行文件包含主程序的机器码以及函数库‘libm.a’中 sin 对应的机器码。
(3)为避免在命令行中指定长长的路径,编译器为链接函数库提供了快捷的选项‘-l’。例如,下面的命令
#gcc -Wall sin.c -lm -o sin
与我们上面指定库全路径‘/usr/lib/libm.a’的命令等价。
一般来说,选项 -lNAME使链接器尝试链接系统库目录中的函数库文件 libNAME.a。一个大型的程序通常要使用很多 -l选项来指定要链接的数学库,图形库,网络库等。
注:在实际运行的过程中,上述命令#gcc sin.c -lm -o sin 会出现编译不通过的错误信息(/usr/bin/ld: skipping incompatible ...)。查了一下,解决的办法是,加上参数-m32,即#gcc -m32 sin.c -lm -o sin 。原因在于,所用的linux系统是64位,加上-m32,生成32位的应用程序。
5.2 另外一个连接外部函数库的例子
开发软件时,完全不使用第三方函数库的情况是比较少见的,通常来讲都需要借助许多函数库的支持才能够完成相应的功能。从程序员的角度看,函数库实际上就是一些头文件(.h)和库文件(so、a或lib、dll)的集合。虽然Linux下的大多数函数都默认将头文件放到/usr/include/目录下,而库文件则放到/usr/lib/目录下;Windows所使用的库文件主要放在Visual Stido的目录下的include和lib,以及系统文件夹下。但也有的时候,我们要用的库不再这些目录下,所以GCC在编译时必须用自己的办法来查找所需要的头文件和库文件。
例如我们的程序test.c是在linux上使用C连接mysql,这个时候我们需要去mysql官网下载MySQL Connectors的C库,下载下来解压之后,有一个include文件夹,里面包含mysql connectors的头文件,还有一个lib文件夹,里面包含二进制so文件libmysqlclient.so。其中inclulde文件夹的路径是/usr/dev/mysql/include,lib文件夹是/usr/dev/mysql/lib。
(1)编译成可执行文件
首先我们要编译test.c为目标文件,因为头文件在/usr/dev/mysql/include中(不是系统默认存放头文件的路径),所以需要使用-I指明头文件所在的路径:
#gcc –c –I /usr/dev/mysql/include test.c –o test.o
(2)连接
然后我们把所有目标文件链接成可执行文件:
#gcc –L /usr/dev/mysql/lib –lmysqlclient test.o –o test
如果是像上面那个例子中,数学函数库在linux默认的库文件/usr/lib目录下,则命令中可以省去“-L /usr/lib”,但本例中库函数不在默认路径中,所以需要
“-L /usr/dev/mysql/lib” 指明路径。“-L /usr/dev/mysql/lib” 结构让gcc先在/usr/dev/mysql/lib下查找库文件,然后再到默认的库文件搜索路径下进行查找。-l选项使得链接程序使用指定的函数库中的目标代码,也就是本例中的libmysqlclient.so。把函数库命名为lib{名字}是UNIX的约定,与许多其他编译器一样,gcc 也遵循此约定。如果忘了使用-l选项,则与库的链接将失败,并且gcc产生错误,说明程序中引用了未定义的函数名。
(3)强制链接时使用静态链接库
默认情况下,GCC在链接时优先使用动态链接库,只有当动态链接库不存在时才考虑使用静态链接库,如果需要的话可以在编译时加上-static选项,强制使用静态链接库。 在/usr/dev/mysql/lib目录下有链接时所需要的库文件libmysqlclient.so和libmysqlclient.a,为了让GCC在链接时只用到静态链接库,可以使用下面的命令:
#gcc –L /usr/dev/mysql/lib –static –lmysqlclient test.o –o test
6.搜索路径顺序
静态库链接时搜索路径顺序:
1. ld会去找GCC命令中的参数-L
2. 再找gcc的环境变量LIBRARY_PATH
3. 再找内定目录 /lib /usr/lib /usr/local/lib 这是当初compile gcc时写在程序内的
动态链接时、执行时搜索路径顺序:
1. 编译目标代码时指定的动态库搜索路径
2. 环境变量LD_LIBRARY_PATH指定的动态库搜索路径
3. 配置文件/etc/ld.so.conf中指定的动态库搜索路径
4. 默认的动态库搜索路径/lib 5. 默认的动态库搜索路径/usr/lib
有关环境变量:
LIBRARY_PATH环境变量:指定程序静态链接库文件搜索路径
LD_LIBRARY_PATH环境变量:指定程序动态链接库文件搜索路径