linux进程管理总结

一、进程相关的概念
二、关闭会话时子进程进程被杀死
三、nohup的原理
四、setsid原理
五、daemon &和守护进程的区别
六、服务进程为什么要fork两次
七、systemd管理daemon
八、僵尸进程
九、进程名字和启动时指定进程名字
十、source command、bash command、 /command 和exec命令的区别
十一、常见的Linux进程状态
十二、disown命令

一、进程相关的概念

进程需要了解进程，父进程，进程组,会话和控制终端的相关概念。

进程和父进程：每个进程都有父进程，而所有的进程以init进程为根，形成一个树状结构
进程组：每个进程都会属于一个进程组(process group)，每个进程组中可以包含多个进程。进程组会有一个进程组领导进程 (process group leader)，领导进程的PID成为进程组的ID (process group ID, PGID)，以识别进程组。

kill给组发送信号进程组号前加负号如：kill -9 -2189
会话：一个或是多个进程组集合。进程可以通过调用 pid_t setsid(); 来建立一个新会话，如果调用此函数的进程不是进程组长，就会创建一个新的会话，那么此时会：
1. 该进程称为会话首进程 (session leader)
2. 该进程称为进程组组长
3. 该进程没有控制终端，即使之前有控制终端这种联系也会断掉
可以使用第三个特性来创建 daemon 进程。调用 getsid 可以获得会话首进程进程组 pid，也就是会话首进程进程 id。
控制终端：
1. 一个会话持有一个控制终端 (controlling terminal)，可以是终端设备也可以是伪终端
2. 建立与控制终端连接的会话首进程被称为控制进程 (controlling process)
3. 一个会话有多个进程组，允许存在多个后台进程组 (backgroup process group) 和一个前台进程组 (foregroup process group)
4. 键入终端的中断键 (Ctrl+C) 会发送中断信号给前台进程组所有进程
5. 键入终端的退出键 (Ctrl+) 会发送退出信号给前台进程组所有进程
6. 终端或是网络断开会将挂断信号发送给会话首进程

可以看到执行ps -fj结果如下：


UID         PID   PPID   PGID    SID  C STIME TTY          TIME CMD
chen      36829  36825  36829  36829  0 10:56 pts/0    00:00:00 -bash
chen      37247  36829  37247  36829  0 10:57 pts/0    00:00:00 vim
chen      90490  36829  90490  36829  0 11:57 pts/0    00:00:00 ps -fj

其中PID就是进程id，PPID是父进程id，PGID为进程组id，SID为会话ID

二、关闭会话时子进程进程被杀死

终端在关闭时会发送SIGHUP信号给session leader，此处就是bash进程，bash收到后向session内的所有进程发送SIGHUP然后退出。
SIGHUP信号如果为注册处理函数默认行为就是退出。所以会话退出时子进程都被杀死。

解决方案：

注册SIGHUP信号处理函数：可以在代码中处理或者使用nohup命令(nohup daemon & &>daemon.log)
重新设置setsid：可以在代码中处理或者使用setsid命令(setsid daemon)

三、nohup的原理

其实很简单就是注册了SIGHUP的一个处理函数，忽略这个信号，然后去执行实际的命令。
源码地址：https://github.com/MaiZure/coreutils-8.3/blob/master/src/nohup.c

关键代码：

   // 注册处理函数
  signal (SIGHUP, SIG_IGN);

  char **cmd = argv + optind;
  //执行实际的代码
  execvp (*cmd, cmd);

四、setsid原理

fork进程之后的子进程共享父进程的很多东西，并且会话组长就是父进程的会长组长，所以会收到来自父进程会话组长的信号。
setsid用余新建一个会话，调用这个函数之后会当当前进程成为进程组组长和会话组组长，那么原来的会话产生的信号便不会发送到这个进程，从而不会受影响。

五、daemon &和守护进程的区别

因为守护进程的实现是用的setsid，所以其实就是setsid和nohup的区别，两者都可以用来防止进程在终端断开的时候被杀死，nohup还需要配合&放入后台运行。区别的的话守护进程已经脱离了终端，不受终端控制，也就没有了stdin，stdout和stderr，而使用nohup之后的进程还是有一个终端，只是忽略了其中的SIGHUP信号，存在正常的stdin，stdout和stderr，nohup默认将stdout和stderr重定向到了nohup.out，nohup的使用也推荐< /dev/null来重定向stdin

最佳实践：

如果是一次性的后台任务，可以使用nohup十分方便
如果是长期运行的服务，则推荐使用系统的systemd来管理服务
如果是定时运行的任务则推荐使用cron来运行

六、服务进程为什么要fork两次

首先说明两次不是必须的，有很多程序都采用了一次fork。

第一次：为了调用setsid，这也解释了为什么调用setsid之前需要先fork的原因：
linux规定调用这个函数之前,当前进程不允许是session leader。进程组leader是该进程组的第一个进程，fork出来的进程必定不是第一个，所以可以调用setsid。另外父进程一般直接退出，可以让shell收到进程结束的通知继续执行，而不是等待他结束。

第二次：为了限制进程打开控制终端，只有会话组长能打开控制终端（非必须，相当于加了个限制条件Daemon不需要打开终端）

七、systemd管理daemon

现在很多的linux发行版都采用systemd来代替原来的init程序，systemd提供了很优秀的进程管理功能，我们需要注册服务时可以利用systemd功能，可以参看鸟哥的systemd介绍。

另外补充点内核进程和Systemd进程：
0号进程为内核进程，1号为Systemd进程，其他还有些内核进程在ps命令查看时以[]包裹。具体关系见：LINUX PID 1 和 SYSTEMD

八、僵尸进程

这个定义摘抄自维基百科：在类UNIX系统中，僵尸进程是指完成执行（通过exit系统调用，或运行时发生致命错误或收到终止信号所致）但在操作系统的进程表中仍然有一个表项（进程控制块PCB），处于"终止状态"的进程。这发生于子进程需要保留表项以允许其父进程读取子进程的exit status：一旦退出态通过wait系统调用读取，僵尸进程条目就从进程表中删除，称之为"回收（reaped）"。

九、进程名字和启动时指定进程名字

kill，ps，top，pstree这些命令都比较熟悉就不再提了。

至于还有一组命令则不是通过进程号而是通过进程名字来操作进程，pkill和killall一样都是通过名字来杀死进程，而pgrep是通过名字来寻找进程。
他们的原理都是通过查找/proc这个内存文件系统。

在启动的时候可以通过exec命令重命名：
bash -c "exec -a myname sleep 500 &"

你可以通过ps -ef|grep myname来查看进程的详细信息

十、source command、bash command、 /command 和exec命令的区别

通常执行脚本有三种方式

./command(同sh command)
source command(同. command)
exec command
bash command

简单说明下上面三种方式：

第一种其实就是对应了linux的fork系统调用，在执行command时候，command是在子进程中执行的，当前shell等待直到子进程的command运行完毕在返回到当前shell。第二种则是直接在当前的进程中直接执行，执行完继续接受用户输入。第三种则对应了linux的exec系统调用，当前进程的执行流程会转向command，command是在当前进程直接执行，但是执行完之后便会直接退出。第四种其实和第一种相同原理都是fork方式，只不过第四种不需要脚本有可执行权限

所以我们一般用的是第一和第二两种，这种的主要区别就是开不开新的进程（开进程是要一定开销的），另外因为第二种是在当前进程执行的，所以如果在command中设置了变量，那么相当于在当前进程中设置了变量，所以我们一般是用第一种去执行避免当前进程的变量被污染。

十一、常见的Linux进程状态

R：处于cpu的可执行队列中，正在运行或者等待运行
S：处于可中断的sleep
D：处于不可中断的sleep，例如读取文件过程中的等待
T：收到SIGSTOP信号停止的进程
Z：僵尸进程

十二、disown命令

有这么一种场景，如果你已经在运行一个软件了，但是中途想要退出，但是如果此时关闭中断会导致进程收到SIGHUP信号，对于已经启动的进程，disown命令就是用来解决这个问题的。对于运行中的命令，我们可以通过ctrl+z命令放入后台，注意此时进程转为stop状态，我们可以利用bg命令恢复进程的运行。然后执行disown命令，这样进程就不会收到SIGHUP信号了。如下：

[chen@chen ~]$ disown
-bash: warning: deleting stopped job 1 with process group 12882

注意上面的警告，我使用ctrl+z命令后没有使用bg恢复进程的执行，然后直接使用了disown命令，他会警告移除了一个停止状态的任务。此时可以使用kill -CONT pid恢复进程的运行

命令解释：

disown [-ar] [-h] [jobspec ...]

-a：移除所有的后台任务
-r：移除正在运行中的任务
-h：不移除任务，但是会阻止控制进程给任务进程发SIGHUP信号
jobspec :可以是进程号，也可以是任务列表

默认直接执行disown就是移除最近的任务

遗留：

进程调试工具：ltrace strace ftrace

参考链接：

posted on 2019-04-05 22:51 远方789 阅读(4608) 评论(0) 编辑收藏举报

刷新页面返回顶部

欢迎来到远方的博客！