《Unix环境高级编程》读书笔记 第7章-进程环境
1. main函数
int main( int argc, char *argv[] );
- argc是命令行参数的数目,包括程序名在内
- argv是指向参数的各个指针所构成的数组,即
指针数组
- 当内核执行C程序时(使用exec函数),在调用main前先调用一个特殊的启动例程。可执行程序文件将此启动例程指定为程序的起始地址——这是由连接器设置的,而连接器则是由C编译器调用。启动例程从内核取得命令行参数和环境变量值,然后按上述方式调用main函数做好安排。
2. 进程终止
- 有8种方式使进程终止,其中5种为
正常终止
:- 从main返回
- 调用exit
- 调用_exit或_Exit
- 最后一个线程从其启动例程返回
- 从最后一个线程调用pthread_exit
异常终止
有3种方式:- 调用abort
- 接到一个信号
- 最后一个线程对取消请求做出响应
2.1 退出函数
#include <stdlib.h>
void exit(int status);
void _Exit(int status);
#include <unistd.h>
void _exit(int status);
- _exit(由POSIX.1说明)和_Exit(由ISO C说明)立即进入内核,而exit(由ISO C说明)则先执行一些清理处理,然后返回内核。
- 3个退出函数都带一个整型参数,称为
终止状态
或退出状态
。大多数Unix系统shell都提供检测进程终止状态的方法。 - 下面几种情况下,该进程的终止状态是未定义的:
- 调用这些函数时不带终止状态
- main执行了一个无返回值的return语句
- main没有声明返回类型为整型
2.2 函数atexit
#include <stdlib.h>
int atexit(void (*func)(void)); // 参数是一个函数指针
Returns: 0 if OK, nonzero on error
- 按照ISO C的规定,一个进程可以登记多至32个函数,这些函数将由exit自动调用。称这些函数为
终止处理程序
。 - exit首先调用各终止处理程序,然后关闭所有打开流。exit调用这些函数的顺序与它们登记的顺序相反。
- 如若程序调用exec函数,则将清除所有已安装的终止处理程序。
注意:内核使程序执行的唯一方法是调用一个exec函数。进程自愿终止的唯一方法是显式或隐式(通过调用exit)地调用_exit或_Exit。进程也可非自愿地由一个信号使其终止。
一个C程序的启动,以及它的各种终止方式
3. 命令行参数
- 当执行一个程序时,调用exec的进程可将命令行参数传递给新程序。这是Unix shell的一部分常规操作。
4. 环境表
extern char **environ;
称environ为环境指针
;指针数组为环境表
,其中各指针指向的字符串为环境字符串
。
5. C 程序的存储空间布局
历史沿袭至今,C程序一直由以下几部分组成:
- 正文段。这是由CPU执行的机器指令部分。通常,正文段是可由多个应用程序共享的,在存储器中只需一个副本。正文段常常是只读的。
- 初始化数据段,也称为数据段。包含了程序中需明确地赋初值的变量。
- 未初始化数据段,也称为bss段(block started by symbol,由符号开始的块)。在程序开始执行之前,内核将此段中的数据初始化为0或空指针。
- 栈。自动变量以及每次函数调用时所需保存的信息都存放在此段中。
- 堆。通常在堆中进行动态存储分配。惯例,堆位于未初始化数据段和栈之间。
一种典型安排方式,这是程序的逻辑布局
size命令报告正文段、数据段和bss段的长度(以字节为单位)
$ size /usr/bin/cc /bin/sh
text data bss dec hex filename
346919 3576 6680 357175 57337 /usr/bin/cc
102134 1776 11272 115182 1c1ee /bin/sh
第4、5列分别是以十进制和十六进制表示的3段总长度
6. 共享库
- 共享库使得可执行文件中不再需要包含公用的库函数,而只需要在所有进程都可以引用的存储区中保存这种库例程的一个副本。减少了每个可执行文件的长度,但增加了一些运行时间开销。这种时间开销发生在该程序第一次被执行时,或者每个共享函数库函数第一次被调用时。
- 另一个优点是可以用库函数的新版本代替老版本而无需对使用该库的程序重新连接编译。
7. 存储空间分配
- ISO C说明了3个用于存储空间动态分配的函数
malloc,初始值不确定
calloc,每一位都初始化为0
realloc,新增区域内的初始值不确定
#include <stdlib.h>
void *malloc(size_t size);
void *calloc(size_t nobj, size_t size);
void *realloc(void *ptr, size_t newsize);
All three return: non-null pointer if OK, NULL on error
void free(void *ptr);
- 这3个分配函数所返回的指针一定是适当对齐的,满足最苛刻的对齐要求,使其可用于任何数据对象。
- 返回通用指针void *
- 这些分配例程通常用sbrk系统调用实现。该系统调用扩充或缩小进程的堆。虽然sbrk可以扩充或缩小进程的存储空间,但是大多数malloc和free的实现都不减少进程的存储空间。释放的空间可供以后再分配,将它们保持在malloc池中而不返回给内核。
- 大多数实现所分配的存储空间比所要求的要稍大一些,额外的空间用来记录管理信息——分配块的长度、指向下一个分配块的指针等。
- 常见错误:1. 释放一个已经释放了的块;2. 调用free时所用的指针不是3个alloc函数的返回值;3. 忘记调用free造成内存泄露。
8. 替代的存储空间分配程序
- libmalloc
- vmalloc
- quick-fit,历史上所使用的标准malloc算法是最佳适配或首次适配存储分配策略。quick-fit算法比上述两种快,但可能使用较多存储空间
- jemalloc
- TCMalloc,高性能、高扩展性和高存储效率。开源,是Google-perftools工具中的一个
- 函数alloca,在当前函数的栈帧上分配存储空间,而不是在堆上。
优点:当函数返回时,自动释放它所使用的栈帧,不再需要自己释放空间
缺点:alloca函数增加了栈帧的长度,而某些系统在函数已经被调用后不能增加栈帧长度,于是也就不能支持alloca函数。本书4个平台均支持该函数。
9. 环境变量
- Unix内核并不查看这些字符串,它们的解释完全取决于各个应用程序。
- LANG、PATH、HOME、PWD、TERM ...
#include <stdlib.h>
char *getenv(const char *name);
Returns: pointer to value associated with name, NULL if not found
#include <stdlib.h>
int putenv(char *str); // name已存在,替换
Returns: 0 if OK, nonzero on error
int setenv(const char *name, const char *value, int rewrite); // 当name已存在时,根据rewrite参数而覆盖或保持原值
int unsetenv(const char *name); // 即使name不存在也不算出错
Both return: 0 if OK, −1 on error
- 这些函数在修改环境表时是如何进行操作的呢?
- 删除一个字符串很简单
- 但是增加一个字符串或修改一个现有的字符串就困难得多。因为环境表和环境字符串通常占用的是进程地址空间的顶部,故不能向上扩展;而其下方是各栈帧,故也不能向下扩展。两者组合使得该空间的长度不能再增加。
19. 函数setjmp、longjmp
- 在C中,goto语句是不能跨越函数的,而执行这种类型的跳转功能是函数setjmp和longjmp。它们对于处理发生在很深层嵌套函数调用中的出错情况是非常有用的
#include <setjmp.h>
int setjmp(jmp_buf env);
Returns: 0 if called directly, nonzero if returning from a call to longjmp
void longjmp(jmp_buf env, int val);
- 直接调用setjmp,返回0;调用longjmp导致程序在setjmp处返回,返回值为val
- 特殊类型jmp_buf,是某种形式的数组,其中存放在调用longjmp时能用来恢复栈状态的所有信息。
19.1 自动变量、寄存器变量、易失变量volatile
- 当调用longjmp函数后,在main函数中,自动变量和寄存器变量的状态如何?
1. 看情况。大多数实现并不回滚这些自动变量和寄存器变量的值,而所有标准则称它们的值是不确定的。
2. 如果有一个自动变量,而不想其值回滚,可定义为具有volatile属性。
3. 声明为全局变量或静态变量的值在执行longjmp时保持不变。
19.2 自动变量的潜在问题
- 在某个函数调用返回后,仍然在使用分配在该函数栈上的变量。
20. 函数getrlimit、setrlimit
#include <sys/resource.h>
int getrlimit(int resource, struct rlimit *rlptr);
int setrlimit(int resource, const struct rlimit *rlptr);
Both return: 0 if OK, −1 on error
struct rlimit {
rlim_t rlim_cur; /* soft limit: current limit */
rlim_t rlim_max; /* hard limit: maximum value for rlim_cur */
};
在更改资源限制时,须遵循下列3条规则:
- 任何一个进程都可将一个软限制更改为小于或等于其硬限制值
- 任何一个进程都可降低其硬限制值,但它必须大于或等于其软限制值。这种降低,对普通用户而言是不可逆的
- 只有超级用户进程可以提高硬限制值。常量RLIM_INFINITY为无限制
resource参数的取值列举:
RLIMIT_AS 进程总的的可用存储空间的最大长度(字节)
RLIMIT_CORE core文件的最大字节数
RLIMIT_FSIZE 可以创建的文件的最大字节长度
RLIMIT_NOFILE 每个进程能打开的最多文件数
RLIMIT_NPROC 每个实际用户ID可拥有的最大子进程数
RLIMIT_STACK 栈的最大字节长度