Linux 进程
Linux 专用进程
ID为0的进程通常是调度进程,又被称为交换进程。该进程是内核的一部分,它不执行磁盘上的程序。
ID为1的进程通常是init进程,在自举过程结束时由内核调用。该进程程序文件早期是 /etc/init 新版本是 /sbin/init。该进程负责在自举内核后启动一个UNIX系统,init通常读取与系统有关的初始化文件(/etc/rc*文件或 /etc/inittab 文件,以及 /etc/init.d 中的文件),并将系统引导到一个状态。init进程绝不会终止,它是一个普通用户进程,但以root特权运行。是所有孤儿进程的父进程。
创建子进程
子进程拥有父进程的副本。例如:数据空间、堆、栈。父子进程不共享这些空间,共享正文段。因为fork后常常跟随exec,作为替代使用写时复制技术。
子进程会继承的属性:
- 打开的文件
二者区别:
接收子进程结束状态
当进程正常或异常终止时,内核向父进程发送SIGCHLD信号。父进程可以忽略该信号,或提供一个该信号发生时被调用的信号处理函数。这种信号默认忽略它。
这两函数区别:
- 在一个子进程结束前,wait使调用者阻塞,waitpid有一选项可使调用者不阻塞
- waitpid有若干个选项可控制它所等待进程
当调用wait或waitpid时:
- 若所有子进程都在运行则出错
- 若一个子进程终止,父进程获得终止状态并返回
- 若没有子进程则立即出错
函数返回值是整形,其中某些位表示退出状态(正常返回),其他位指示信号编号(异常返回),有一位指示是否产生了core文件等。终止状态用定义<sys/wait.h>中各个宏查看。有4个互斥的宏可用于获取进程终止的原因。基于这四个宏哪一个未真,就可以选用其他宏来取得退出状态、信号编号。
waitid类似waitpid,但是更灵活
options 参数必须有 WCONTINUED WEXITED WSTOPPED 3个常量之一
孤儿进程 僵尸进程
- 孤儿进程:
一个父进程退出,而它的一个或多个子进程还在运行,那么那些子进程将成为孤儿进程。孤儿进程将被init进程(进程号为1)所收养,并由init进程对它们完成状态收集工作。
init进程会调用wait函数,所以孤儿进程没有危害 - 僵尸进程:
一个进程使用fork创建子进程,如果子进程退出,而父进程并没有调用wait或waitpid获取子进程的状态信息,那么子进程的进程描述符仍然保存在系统中。这种进程称之为僵死进程。
系统所能使用的进程号是有限的,如果大量的产生僵死进程,将因为没有可用的进程号而导致系统不能产生新的进程. 此即为僵尸进程的危害,应当避免。
在每个进程退出的时候,内核释放该进程所有的资源,包括打开的文件,占用的内存等。 但是仍然为其保留一定的信息(包括进程、,退出状态、运行时间等)。直到父进程通过wait来取时才释放。
任何一个子进程(init除外)在exit()之后,并非马上就消失掉,而是留下一个称为僵尸进程(Zombie)的数据结构,等待父进程处理。这是每个 子进程在结束时都要经过的阶段。如果子进程在exit()之后,父进程没有来得及处理,这时用ps命令就能看到子进程的状态是“Z”。如果父进程能及时 处理,可能用ps命令就来不及看到子进程的僵尸状态,但这并不等于子进程不经过僵尸状态。
处理已有的僵尸进程:
问题出在僵尸进程的父进程上,它没有处理SIGCHLD信号
发送SIGTERM或SIGKILL信号杀死僵尸进程的父进程,僵尸进程就会变为孤儿进程,然后init进程就会处理调用wait函数处理并释放资源。
防止僵尸进程:
- 在附近注册SIGCHLD信号的处理函数,调用wait
- fork两次。先fork出一个子进程,再fork出一个孙进程,然后杀死子进程。孙进程会变为孤儿进程。
函数 exec
调用exec函数时,该进程执行的程序完全替换为新程序,新程序从main函数开始执行。因为调用exec不创建新进程,所以进程id未改变。exec是用磁盘上一个新程序替换了当前进程的正文段、数据段、堆段、栈段。
区别:
- 前4个路径名作为参数,后两个文件名作为参数,最后一个文件描述符为参数
当指定filename时,如果filename包含/,则视为路径名;否则按PATH环境变量搜索可执行文件 - 参数表的传递不同,l表示list(最后必须根一个空指针),v表示vector
- 传递的环境变量表不同,以e结尾的3个函数可以传递一个执行字符串指针数组的指针。其他4个函数调用进程中的environ变量为新程序复制现有的环境。
新程序从调用程序继承了以下属性:
7个exec函数中只有execve是内核的系统调用,另外6个只是库函数。关系如下:
更改用户ID和组ID
这两个函数用于设置实际用户id和有效用户id
现考虑更改用户ID的规则(也使用于组ID):
- 若进程具有root特权,则setuid函数将 实际用户ID、有效用户ID、保存的设置用户ID 设置为uid
- 若进程没有root特权,但uid等于实际用户ID或保存的设置用户ID,则setuid只将有效用户ID设置为uid。不更改实际用户ID和保存的设置用户ID。
- 如果上面两个条件都不满足,则errno设置为EPERM,并返回-1。
进程调度
nice值默认为 NZERO,nice范围为 [0, 2*NZERO - 1] 或 [0, 2*NZERO]。nice值越小优先级越高。nice的incr参数被加到nice值上,如果incr太大系统直接把它降到最大值;如果incr太小会将其提高到最小合法值。由于-1是合法的成功返回值,在调用nice函数前要清除errno,在nice返回-1是,检查它的值。如果调用成功并返回-1,那么errno仍为0;若errno不为0,说明nice调用失败。
which可取值如下,控制who参数如何解释:
- PRIO_PROCESS 表示进程
- PRIO_PGRP 表示进程组
- PRIO_USER 表示用户ID
进程组
每个进程除了有进程id外,还属于一个进程组。进程组是一个或多个进程的集合。通常,它们是在同一作业中结合起来的,同一进程中个进程接收来自同一终端的各种信号。每个进程组有唯一的进程组id,可存放于pid_t类型中。
每个进程组有一个组长进程,组长进程的进程组id等于其进程id。
进程组组长可以创建一个进程组、创建该组中的进程,然后终止。子要进程组中有一个进程存在,则该进程组就存在,这与其组长进程是否终止无关。从进程组创建开始到其中最后一个进程离开的时间区域被称为进程组的生命周期。某个进程组中最后一个进程可以终止,也可以转移到另一个进程组。
进程调用setpgid可以加入一个现有进程组或创建一个新进程组。
会话
会话是一个或多个进程组的集合。
通常是由shell的管道将几个进程编成一组的。例如 proc1 | proc2 &
proc3 | proc4 | proc5
。进程调用 setsid 函数建立一个会话:
控制终端
会话和进程组还有一些其他特性:
- 一个会话可以由一个控制终端。这通常是终端设备(在终端登录情况下)或伪终端设备(网络登录情况下)
- 建立于控制终端连接的会话首进程被称为控制进程
- 一个会话中几个进程组可以被分为一个前台进程组以及一个或多个后台进程组
- 如果一个会话有一个控制终端,则它有一个前台进程组,其他进程组伪后台进程组
- 无论何时键入终端的中断键(Delete或Ctrl+C),都会将中断信号发送给前台进程组的所有进程
- 无论何时键入终端的退出键(Ctrl+\),都会将退出信号发送至前台进程组的所有进程
- 如果终端接口检测到调制解调器(或网络)断开,则将挂断信号发送至控制进程(会话首进程)
守护进程
编写规则
- 首先调用 umask 将文件模式创建屏蔽字设置伪一个已知值(通常为0).
- 调用 fork,然后父进程exit。
原因一:如果是一条shell命令启动的,让父进程终止会让shell认为命令已执行完毕;
原因二:子进程继承了父进程进程组id,但获得了新进程id。这保证子进程不是一个进程组的组长进程,这是setsid调用的先决条件。 - 调用setsid创建一个新会话。然后使调用进程:
- 成为新会话的首进程
- 成为一个新进程组的组长进程
- 没有控制终端
- 将当前工作目录改为根目录或指定目录。从父进程继承来的工作目录可能为一个挂载目录,为了能让文件系统能被卸载
- 关闭不需要的继承来的文件描述符。可以通过 open_max getrlimit 函数来判定最高文件描述符值,并关闭直到该值的所有文件描述符值
- 某些守护进程打开 /dev/null 使其具有文件描述符 0 1 2,使得进程没有交互功能
将程序初始化为守护进程
#include "apue.h"
#include <syslog.h>
#include <fcntl.h>
#include <sys/resource.h>
void
daemonize(const char *cmd)
{
int i, fd0, fd1, fd2;
pid_t pid;
struct rlimit rl;
struct sigaction sa;
/*
* Clear file creation mask.
*/
umask(0);
/*
* Get maximum number of file descriptors.
*/
if (getrlimit(RLIMIT_NOFILE, &rl) < 0)
err_quit("%s: can't get file limit", cmd);
/*
* Become a session leader to lose controlling TTY.
*/
if ((pid = fork()) < 0)
err_quit("%s: can't fork", cmd);
else if (pid != 0) /* parent */
exit(0);
setsid();
/*
* Ensure future opens won't allocate controlling TTYs.
*/
sa.sa_handler = SIG_IGN;
sigemptyset(&sa.sa_mask);
sa.sa_flags = 0;
if (sigaction(SIGHUP, &sa, NULL) < 0)
err_quit("%s: can't ignore SIGHUP", cmd);
if ((pid = fork()) < 0)
err_quit("%s: can't fork", cmd);
else if (pid != 0) /* parent */
exit(0);
/*
* Change the current working directory to the root so
* we won't prevent file systems from being unmounted.
*/
if (chdir("/") < 0)
err_quit("%s: can't change directory to /", cmd);
/*
* Close all open file descriptors.
*/
if (rl.rlim_max == RLIM_INFINITY)
rl.rlim_max = 1024;
for (i = 0; i < rl.rlim_max; i++)
close(i);
/*
* Attach file descriptors 0, 1, and 2 to /dev/null.
*/
fd0 = open("/dev/null", O_RDWR);
fd1 = dup(0);
fd2 = dup(0);
/*
* Initialize the log file.
*/
openlog(cmd, LOG_CONS, LOG_DAEMON);
if (fd0 != 0 || fd1 != 1 || fd2 != 2) {
syslog(LOG_ERR, "unexpected file descriptors %d %d %d",
fd0, fd1, fd2);
exit(1);
}
}
出错记录
守护进程没有交互界面,使用syslog设施记录错误。
3种产生日志的方法:
- 内核例程调用log函数。此处不讨论内核编程
- 大多数用户进程(守护进程)调用syslog函数产生日志消息。这使消息被发送至UNIX域数据报套接字 /dev/log
- 无论一个用户进程在此进程上,还是通过TCP IP网络连接到此主机其他主机上,都可以将日志消息发向UDP端口514。注意,syslog函数不产生这些UDP数据报,它们要求产生此日志消息的进程进行显式的网络编程
通常,syslogd 守护进程读取所有3种格式的日志消息。此守护进程在启动时读一个配置文件,文件名一般为 /etc/syslog.conf,该文件决定了不同种类的消息该送往何处。例如,紧急消息发送至控制台打印,警告i信息记录到文件中。
单实例文件守护进程
使用文件和记录锁,保证每次只有一个进程获得文件写锁。open(filename, O_RDWR|O_CREATE, S_IRUSR|S_IWUSR|S_IRGP|S_IROTH)
守护进程的惯例