Linux高级编程--02.gcc和动态库

在Linux环境下,我们通常用gcc将C代码编译成可执行文件,如下就是一个简单的例子:

小实验:hello.c

#include <stdlib.h>
#include <stdio.h>
void main(void)
{
    printf("hello world!\r\n");
}

可以通过如下指令来编译出一个可执行文件:

gcc hello.c

执行完该命令后,就会得到一个a.out的可执行文件。

编译的过程

前面的例子只是简单的介绍了一下gcc的使用方法,熟悉c编程的朋友就会知道,该步骤其实包含了预处理–>编译–>汇编–>链接四步,这四步分别实现的功能如下:

  • 预处理阶段:主要处理源文件中的#ifdef、 #include和#define命令,展开宏、读取定义的符号等(.i)
  • 编译阶段:检查代码的规范性,把代码翻译成汇编语言(.s)
  • 汇编阶段:是把编译阶段生成的文件转成二进制目标代码(.o)
  • 链接阶段:将汇编阶段生成的机器码汇集成一个可执行的二进制代码文件

由此可以看出,每一个阶段的输出其实就是下一个阶段的输入,用gcc是可以单独执行这四步的:

gcc -E hello.c -o hello.i
gcc -S hello.i -o hello.s
gcc -c hello.s -o hello.o
gcc hello.o -o hello

实际上,由于这四个步骤太过于复杂,往往可以像我上面那样全部集中到一个命令中来执行:

gcc hello.c -o hello

这里我加了一个-o参数来指定输出名称,而不是默认的a.out。

-o 优化选项, 这个选项不是标准的

  • -O和 -O1指定1级优化
  • -O2 指定2级优化
  • -O3 指定3级优化
  • -O0指定不优化

    gcc hello.c -O3 -O0 hello 当出现多个优化时,以最后一个为准!!

如果有多个文件,则可以通过如下方式全部集中起来。

gcc -o test first.c second.c third.c

这个全生成的方式虽然非常简单,但是存在的一个问题就是:当项目较大时,如果只改了一个文件,仍需要重新编译索引文件。

为了解决这个问题,我们往往把这个编译过程拆分成两步:

  • 将各个.c文件分别编译成.o文件
  • 将所有.o文件链接成执行文件

    gcc –c first.c
    gcc –c second.c
    gcc –c third.c
    gcc -o test first.o second.o third.o

这样,当third.c文件发生改变时,只需要重新编译third.c和链接即可,这样就省去了未变化文件的编译时间,也就是我们通常所说的增量编译。

gcc –c third.c
gcc -o test first.o second.o third.o

从上面的使用方法中我们也可以看到:

  • 当使用-c参数时,若输入文件时.c则会同时执行执行了预处理、编译、汇编三个阶段,直接生成.o文件。
  • 输入文件为.o时,可以直接执行链接操作

由于程序员往往并不关心前面两个几个阶段生成的输出文件,通常我们也把预处理、编译、汇编三个阶段合并在一起,统称为编译,输入.c,生成.o。

常用参数:

前面其实已经演示过-E、–S、–c、–o等几个参数的用法,其中-E及-S很少会用到,-c用于编译生成.o文件,-o用于指定输出文件名称。除了这几个生成控制的参数外,还有许多参数设置,这里主要介绍一下几个常用的:

包含头文件和库:

  • -Idir :指定编译查找头文件的目录,常用于查找第三方的库的头文件,例:gcc test.c –I../inc -o test。
  • -Ldir :指定链接时查找lib的目录,常用于查找第三方库。
  • -llibrary :指定额外链接的lib库

宏定义:

  • -DMACRO :以字符串”1”(默认值)定义 MACRO 宏。
  • -DMACRO=DEFN :以字符串”DEFN”定义MACRO 宏,注意中间不能有空格。
  • -UMACRO :取消对 MACRO 宏的定义。

调试和可执行文件形式:

  • -g :指示编译器,在编译的时产生调试信息。
  • -ggdb :尽可能的生成gdb的可以使用的调试信息(比-g生成的信息更多些)。
  • -static :禁止使用动态库,编译得到的程序会比较大,但可以自由运行。
  • -share :尽量使用动态库,所以生成文件比较小,但是需要系统由动态库。

告警选项:

  • -Wall :产生尽可能多的警告信息,建议始终带上
  • -Werror :将所有的警告当成错误进行处理

gcc和g++

除了gcc编译器外,还有另外一个编译器g++,很多人往往搞不清楚这两个编译器的区别,很多人望文生义的认为gcc只能编c代码,g++只能编c++代码。实际上这两个编译器的主要区别如下:

  1. 后缀为.c的,gcc把它当作是C程序,而g++当作是c++程序来编译,后缀为.cpp的,两者都会认为是c++程序,注意,虽然c++是c的超集,但是两者对语法的要求是有区别的。C++的语法规则更加严谨一些。
  2. 链接的时候gcc不会默认加上-lstdc++选项,而g++会,所以导致gcc编译c++代码时,用到了stl库时会出现链接失败。
  3. gcc不会定义__cplusplus宏,而g++会,这个宏只是标志着编译器将会把代码按C还是C++语法来解释,如果后缀为.c,并且采用gcc编译器,则该宏就是未定义的,否则,就是已定义。

静态链接库

有时我们需要将一组代码编成一个库,从而方便其复用。例如,我们调用的STL和系统函数都是以这种方式提供的。另外,当项目工程较大时,为了使其模块化方便分工,有时也需要将其创建自己的链接库。

代码演示:

// stack.c
#include <stdio.h>
char stack[512];
int top = -1;
char pop(void){
    return stack[top--];
}
void push(char c){
    stack[++top] = c;
}

要把stack.c编成lib,需要经过如下两个步骤:

  1. 通过gcc –c命令将stack.c编成stack.o gcc -c stack.c
  2. 通过ar命令将stack.o封装成libstack.a ar cr libstack.a stack.o

创建测试文件

// main.c
#include <stdio.h>
char pop();
void push(char c);
void main(void){
    push('a');
    push('b');
    printf("%c\n", pop());
}

链接编译:

gcc -o run main.c -L. -lstack

上述过程中,用到了条之前没见过的命令ar。ar是archive的缩写,也就是归档的意思,平时我们用得更多的是另一条归档命令tar。ar和tar的功能其实比较类似,但ar命令做了一些额外的处理,它会为被归档的目标文件中的符号建立索引,当和应用程序链接时,建立的这些索引将回收链接过程

ar命令的参数比较多,如果只是创建lib库的话,通常只用到了cr这两个组合参数。该命令是可以接受多个输入文件,统一合并到一个库中。

ar cr libtest.a first.o second.o third.o

在通过ar创建lib后,可以通过ar -t命令查看该lib里打包了那些.o文件

ar -t libstack.a
stack.o

此外,还可以通过nm命令来查看符号表等更多信息

nm libstack.a
stack.o:
0000000000000000 T pop
0000000000000021 T push
0000000000000200 C stack
0000000000000000 D top

动态链接库

传统方式下,库函数的链接是在编译器完成的,所有相关对象在编译的时候被整合成一个可执行文件。与此相比,我们也可以把对库函数的链接载入推迟到程序运行的时期,也就是我们所称作的动态链接。

动态链接的优点

除了静态链接库所有的模块化和代码复用外,动态链接库还有如下优点:

  1. 可以实现进程之间的库共享:当多个进程共享一个库时(如stl库和一些系统库是基本上大多数程序都用的),动态链接方式可以只在内存中保留一份副本,节约内存。
  2. 升级变得简单:用户只需要升级动态链接库,而无需重新编译链接其他原有的代码就可以完成整个程序的升级(很多Windows的补丁就是这种方式发布的)。
  3. 可以动态载入:当软件比较大的时候,可以根据需要动态载入/卸载相应的链接库,而无需像静态链接的方式那样必须一次性全部载入

创建动态链接库的方式比较简单,还是按静态链接库的例子,我们只需要通过gcc -shared指令即可创建一个libstack.so的动态库(静态库一般以.a作为扩展名,动态库一般以.so作为扩展名)。

gcc -c -fpic stack.c
gcc -shared -o libstack.so stack.o

这里必须带上-fpic,使输出的对象模块是按照可重定位地址方式生成的。

在链接阶段使用动态库的方式基本上和静态库一致。

gcc -o run main.c -L. -lstack

编译玩这个程序后,我们执行后却发现,它报动态链接库找不到的错误提示。

./run
./run: error while loading shared libraries: libstack.so: cannot open shared object file: No such file or directory

我们也可以通过ldd命令查看某程序当前对动态链接库的依赖情况:

ldd run
linux-vdso.so.1 =>  (0x00007fff366fe000)
libstack.so => not found
libc.so.6 => /lib64/libc.so.6 (0x00002ba53ad1f000)
/lib64/ld-linux-x86-64.so.2 (0x00002ba53ac03000)

ldd的结果表明了我们生成的libstack.so找不到。因为动态链接库是一个可以共享的文件,因此往往存放在一个公共的位置,在Linux系统中程序查找动态链接库的规则如下:

  • 首先在环境变量LD_LIBRARY_PATH所记录的路径中查找。
  • 然后从缓存文件/etc/ld.so.cache中查找。
  • 如果上述步骤都找不到,则到默认的系统路径中查找,先是/lib然后是/usr/lib。

很明显,这几个路径都不包含当前路径。要解决上述问题,一个简单的方式就是把当前路径加到环境变量中:

export LD_LIBRARY_PATH=$LD_LIBRARY_PATH:.

然后再次用ldd名称测试,发现现在就能找到我们的链接库了。

ldd run
linux-vdso.so.1 =>  (0x00007fff581ff000)
libstack.so (0x00002ad148cf0000)
libc.so.6 => /lib64/libc.so.6 (0x00002ad148e0b000)
/lib64/ld-linux-x86-64.so.2 (0x00002ad148bd4000)

不过,很多大牛并不建议通过修改LD_LIBRARY_PATH这种方式

LD_LIBRARY_PATH is not the answer http://prefetch.net/articles/linkers.badldlibrary.html
Why LD_LIBRARY_PATH is bad     http://xahlee.org/UnixResource_dir/_/ldpath.html
LD_LIBRARY_PATH - just say no     http://blogs.sun.com/rie/date/20040710




posted @ 2016-05-12 14:26  linzj  阅读(658)  评论(0编辑  收藏  举报