《Unix/Linux系统编程》学习笔记9
第六章 信号和信号处理
一、知识点归纳
(一)信号和中断
“中断”是从1/0设备或协处理器发送到CPU的外部请求,它将CPU从正常执行转移到中断处理。与发送给CPU的中断请求一样,“信号”是发送给进程的请求,将进程从正常执行转移到中断处理。在讨论信号和信号处理之前,我们先来回顾中断的概念和机制,这有助于正确看待信号。
(1)首先,我们将进程的概念概括为:一个“进程”(引号中)就是一系列活动。广义的 “进程”包括
- 从事日常事务的人。
- 在用户模式或内核模式下运行的Unix/Linux进程。
- 执行机器指令的CPU。
(2)“中断”是发送给“进程”的事件,它将“进程”从正常活动转移到其他活动,称为“中断处理”。“进程”可在完成“中断”处理后恢复正常活动。
(3)“中断” 一词可应用于任何“进程”,并不仅限于计算机中的CPU。例如,我们可能会提到以下几种“中断”。
(3).1人员中断
(3).2进程中断
这类中断是发送给进程的中断。当某进程正在执行时,可能会收到来自3个不同来源的 中断: - 来自硬件的中断:终端、间隔定时器的“Ctrl+C”组合键等。
- 来自其他进程的中断:kill(pid, SIG#)、death_of_child 等。
- 自己造成的中断:除以0、无效地址等。
每个进程中断都被转换为一个唯一ID号,发送给进程。与多种类的人员中断不同,我们始终可限制在一个进程中的中断的数量。Unix/Linux中的进程中断称为信号,编号为1到31进程的PROC结构体中有对应每个信号的动作函数,进程可在收到信号后执行该动作函数。与人员类似,进程也可屏蔽某些类型的信号,以推迟处理。必要时,进程还可能会修改信号动作函数。
(3).3硬件中断
这类中断是发送给处理器或CPU的信号。它们也有三个可能的来源: - 来自硬件的中断:定时器、I/O设备等.
- 来自其他处理器的中断:FFP. DMA、多处理器系统中的其他CPU。
- 自己造成的中断:除以0、保护错误、INT指令。
毎个中断都有唯一的中断向量号。动作函数是中断向量表中的中断处理程序。前面说 过,CPU始终执行一个进程。CPU不会导致任何自己造成的中断(除非出错)。这种中断是 由于进程正在使用或在大多数情况下误用CPU造成的。前一种情况包括INT n或等效指令,使CPU从用户模式切换到内核模式。后一种情况包括CPU识别为异常的所有陷阱错误。因此,我们可以排除CPU自身造成的中断,只留下CPU外部的中断。
(3).4进程的陷阱错误
进程可能会自己造成中断。这些中断是由被CPU识别为异常的错误引起的,例如除以0、无效地址、非法指令、越权等。当进程遇到异常时,它会陷入操作系统内核,将陷阱原因转换为信号编号,并将信号发送给自己。如果在用户模式下发生异常,则进程的默认操作是终止,并使用一个可选的内存转储进行调试。我们会在后面学习到,进程可以用信号捕捉 器代替默认动作函数,允许它在用户模式下处理信号。如果在内核模式下发生陷阱,原因一定是硬件错误,或者很可能是内核代码中的漏洞,在这种情况下,内核无法处理。在Unix/ Uinux中,内核只打印一条PANIC错误消息,然后就停止了°希望在下一个内核版本中可以跟踪并修复这个问题。
(二)Unix/Linux 信号示例
(1) 按"Ctrl+C”组合键通常会导致当前运行的进程终止。原因如下。“Ctrl+C”组合 键会生成一个键盘硬件中断。键盘中断处理程序将"Ctrl+C”组合键转换为SIGINT (2)信 号,发送给终端上的所有进程,并唤醒等待键盘输入的进程。在内核模式F,每个进程都要 检查和处理未完成的信号。进程对大多数信号的默认操作是调用内核的kexit(exitValue)函 数来终止-在Linux中,exitValue的低位字节是导致进程终止的信号编号。
(2) 用户可使用nohup a.out &命令在后台运行一个程序。即使在用户退出后,进程 仍将继续运行。nohup命令会使sh像往常一样复刻子进程来执行程序,但是子进程会忽略 SIGHUP ( 1 )信号。当用户退出时,sh会向与终端有关的所有进程发送一个S1GHUP信号。 后台进程在接收到这一信号后,会忽略它并继续运行。为防止后台进程使用终端进行I/O, 后台进程通常会断开与终端的连接(通过将其文件描述符0、1、2重定向到/dev/null),使 其完全不受任何面向终端信号的影响。
(3) 也许几天后,用户再次登录时会发现(通过ps-u LTD)后台进程仍在运行。用户可以使用sh命令
kill pid (or kill -s 9 pid)
杀死该进程。方法如下。执行杀死的进程向pid标识的目标进程发送一个SIGTERM (15) 信号,请求它死亡。目标进程将会遵从请求并终止。如果进程选择忽略SIGTERM信号,它可能拒绝死亡。在这种情况下,我们可以使用kill -s9pid,肯定能杀死它。因为进程不能修 改对9号信号的动作。读者可能会问,为什么是9号信号呢?在最初的Unix中,只有9个 信号。9号信号被保留为终止进程的终极手段。虽然后来的Unix/ Linux系统将信号编号扩 展到了 31,但是信号编号9的含义仍然保留了下来。
(三)Unix/Linux 信号处理
1.信号类型
Unix/Linux支持31种不同的信号,每种信号在signal.h文件中都有定义。
每种信号都有一个符号名,如 SIGHUP ( 1 )、SIGEMT ( 2 )、SIGKILL ( 9 )、S1GSEGV (11)等。
2.信号的来源
- 来自硬件中断的信号:在进程执行过程中,一些硬件中断被转换为信号发送给进程。 硬件信号示例是
- 中断键(Ctrl+C),它产生一个SIGINT ( 2 )信号。
- 间隔定时器,当它的时间到期时,会生成一个SIGALRM ( 14 ) .SIGVTALRM ( 26 ) 或 SIGPROF ( 27 )信号。
- 其他硬件错误,如总线错误、IO陷阱等。
- 来自异常的信号:当用户模式下的进程遇到异常时,会陷入内核模式,生成一个信 号,并发送给自己。常见的陷阱信号有SIGFPE ( 8 ),表示浮点异常(除以0),最常 见也是最可怕的是SIGSEGV (11),表示段错误,等等。
- 来自其他进程的信号:进程可使用kill(pid, sig)系统调用向pid标识的目标进程发送 信号。读者可以尝试以下实验。在LinuxT,运行简单的C程序
main()( while(1>; }
使进程无限循环。从另一个(X-window)终端,使用ps-u查找循环进程pid。然后 输入sh命令
kill -s 11 pid
循环进程会因为段错误而死亡。读者可能会问:这怎么可能呢?所有进程都在一个 While(l)循环中执行,它是如何产生段错误的呢?答案是:这并不重要。当某进程被 某个信号终止时,它的exitValue就包含这个信号编号。父进程sh只是将死亡子进程 的信号编号转换为一个错误字符串,不管它是什么。
3.进程PROC结构体中的信号
每个进程PROC都有一个32位向量,用来记录发送给进程的信号。在位向量中,每一 位(0位除外)代表一个信号编号。此外,它还有一个信号MASK位向量,用来屏蔽相应的 信号。可使用一系列系统调用,如sigmasks sigsetmask, siggetmask. sigblock等设置、清除和检查MASK位向量。待处理信号只在未被屏蔽的情况下才有效。这样可以让进程延迟 处理被屏蔽的信号,类似于CPU屏蔽某些中断。
4.信号处理函数
每个进程PROC都有一个信号处理数组int sig[32]o sig[32]数组的每个条目都指定了如何处理相应的信号,其中0表示DEFault (默认),1表示IGNore (忽略),其他非零值表示用户模式下预先安装的信号捕捉(处理)函数。图6.1给岀了信号位向量、屏蔽位向量和信号处理函数。
5.安装信号捕捉系统
(四)信号处理步骤
(1 )当某进程处于内核模式时,会检査信号并处理未完成的信号,如果某信号有用户安 装的捕捉函数,该进程会先清除信号,获取捕捉函数地址,对于大多数陷阱信号,则将已安 装的捕捉函数重置为DEFault,,然后,它会在用户模式下返回,以执行捕捉函数,以这种方 式篡改返回路径当捕捉函数结束时.它会返间到最初的中断点,即它最后进入内核模式的 地方 因此,该进程会先迂回执行捕捉函数,然后再恢复正常执行。
(2) 重置用户安装的信号捕捉函数:用户安装的陷阱相关信号捕捉函数用于处理用户代 码中的陷阱错误。由于捕捉函数也在用户模式下执行,因此可能会再次出现同样的错误如 果是这样,该进程最终会陷入无限循环,一直在用户模式和内核模式之间跳跃:为了防止这 种情况,Unix内核通常会在允许进程执行捕捉函数之前先将处理函数重置为DEFault这意 味着用户安装的捕捉函数只对首次出现的信号有效若要捕捉再次出现的同-信号,则必须 重新安装捕捉函数°但是,用户安装的信号捕捉函数的处理方法并不都一样,在不同Unix 版本中会有所不同.例如,在BSD Unix中,信号处理函数不会被重置.但是该信号在执行 信号捕捉函数时会被阻塞,感兴趣的读者•可参考关于Linux信号和sigaction函数的手册页, 以了解更多详细侑息
(3) 信号和喚醒:在Unix/Linux内核中有两种SLEEP进程;深度休眠进程和浅度休 眠进程。前一种进程不可中断,而后一种进程可由信号中断。如果某进程处于不可中断的 SLEEP状态,到达的信号(必须来自硬件中断或其他进程)不会唤醒进程一如果它处于可中 断的SLEEP状态,到达的信号将会唤醒它:例如,当某进程等待终端输入时,它会以低优 先级休眠.这种休眠是可中断的.S1G1NT这类信号即可唤輩它
(五)信号与异常
Unix信号最初设计用于以下用途。
- 作为进程异常的统一处理方法:当进程遇到异常时,它会陷入内核模式,将陷阱原因 转换为信号编号,并将信号发送给自己。如果在内核模式下发生异常,内核只打印一 条PANIC错误消息,然后就停止了。如果在用户模式下发生异常,则进程通常会终 止,并以内存转储进行调试。
- 让进程通过预先安装的信号捕捉函数处理用户模式下的程序错误。这类似于MVS [IBM MVS]中的 ESPIE 宏。
- 在特殊情况下,它会让某个进程通过信号杀死另一个进程。注意,这里所说的杀死并 不是直接杀死某个进程.而只是向目标进程发出“死亡”请求 为什么我们不直接杀 死某个进程呢?我们鼓励读者思考其中的原因(提示:瑞士银行有大量无人认领的 匿名账户。)
(六)信号用作IPC
在许多操作系统的书籍中,信号被归类为进程间的通信机制.基本原理是-个进程可以 向另一个进程发送信号,使它执行预先安装的信号处理函数。由于以F原因,这种分类即使 不算不恰当也颇具争议。
- 该机制并不可靠,因为可能会丢失信号。每个信号由位向量中的一个位表示,只能记 录一个信号的一次岀现.如果某个进程向另一个进程发送两个或多个相同的信号,它 们可能只在接收PROC中出现一次。实时信号被放入队列,并保证按接收顺序发送, 但操作系统内核可能不支持实时信号。
- 竞态条件:在处理信号之前,进程通常会将信号处理函数重置为DEFault。要想捕捉 同一信号的再次出现,进程必须在该信号再次到来之前重新安装捕捉函数。否则,下 一个信号可能会导致该进程终止。在执行信号捕捉函数时,虽然可以通过阻塞同一信 号来防止竞态条件,但是无法防止丢失信号.
- 大多数信号都有预定义的含义。不加区别地任意使用信号不仅不能达到通信的目的, 反而会造成混乱。例如,向循环进程发送SIGSEGV (11)段错误信号,就像对水里游 泳的人大喊:“你的裤子着火了!"
因此,试图将信号用作进程间通信手段实际上是对信号预期用途的过度延伸.应避免出现这种情况
二、问题与解决思路
三、实践内容与截图
1.实现一个消息的PIC
#include<stdio.h>
#include<signal.h>
#include<fcntl.h>
#include<string.h>
#define LEN 64
int ppipe[2];
int pid;
char line[LEN];
int parent()
{
printf("parent %d running\n",getpid());
close(ppipe[0]);
while(1){
printf("parent %d: input a line : \n",getpid());
fgets(line,LEN,stdin);
line[strlen(line)-1]=0;
printf("parent %d write to pipe\n",getpid());
write(ppipe[1],line,LEN);
printf("parent %d send signal 10 to %d\n",getpid(),pid);
kill(pid,SIGUSR1);
}
}
void chandler(int sig)
{
printf("\nchild %d got an interrupt sig=%d\n",getpid(),sig);
read(ppipe[0],line,LEN);
printf("child %d get a message = %s\n",getpid(),line);
}
int child()
{
char msg[LEN];
int parent=getppid();
printf("child %d running\n",getpid());
close(ppipe[1]);
signal(SIGUSR1,chandler);
while(1);
}
int main()
{
pipe(ppipe);
pid=fork();
if(pid)
parent();
else
child();
}