linux 程序进程管理

一. job control

1. 直接将命令丢到背景中『运行』的 &

[root@study ~]# ping 114.1114.114.114 > ping.txt 2>&1 &
[1] 28053
[root@study ~]# jobs
[1]+  运行中               ping 114.1114.114.114 > ping.txt 2>&1 &
[root@study ~]#
提示:这个是针对终端而言的背景运行,如果终端断开,则任务中断。

2. 将『目前』的工作丢到背景中『暂停』:[ctrl]-z

如果我正在使用 vi ,却发现我有个文件不知道放在哪里,需要到 bash 环境下进行搜寻,此时是否要结束 vi 呢?呵呵!当然不需要啊!只要暂时将 vi 给他丢到背景当中等待即可.

3. 观察正在运行在背景中的工作

[root@www ~]# jobs [-lrs]

选项与参数:

-l  :除了列出 job number 与命令串之外,同时列出 PID 的号码;

-r  :仅列出正在背景 run 的工作;

-s  :仅列出正在背景当中暂停 (stop) 的工作。

4. 将背景工作拿到前景来处理:fg

[root@www ~]# fg %jobnumber

选项与参数:

%jobnumber :jobnumber 为工作号码(数字)。

范例一:先以 jobs 观察工作,再将工作取出:

[root@www ~]# jobs

[1]- 10314 Stopped                 vim ~/.bashrc

[2]+ 10833 Stopped                 find / -print

[root@www ~]# fg      <==默认取出那个 + 的工作,亦即 [2]。立即按下[ctrl]-z

[root@www ~]# fg %1   <==直接规定取出的那个工作号码!再按下[ctrl]-z

[root@www ~]# jobs

[1]+  Stopped                 vim ~/.bashrc

[2]-  Stopped                 find / -print

5. 让工作在背景下的状态变成运行中: bg

范例一:一运行 find / -perm +7000 > /tmp/text.txt 后,立刻丢到背景去暂停!

[root@www ~]# find / -perm +7000 > /tmp/text.txt

# 此时,请立刻按下 [ctrl]-z 暂停!

[3]+  Stopped                 find / -perm +7000 > /tmp/text.txt



范例二:让该工作在背景下进行,并且观察他!!

[root@www ~]# jobs ; bg %3 ; jobs

[1]-  Stopped                 vim ~/.bashrc

[2]   Stopped                 find / -print

[3]+  Stopped                 find / -perm +7000 > /tmp/text.txt

[3]+ find / -perm +7000 > /tmp/text.txt &  <==用 bg%3 的情况!

[1]+  Stopped                 vim ~/.bashrc

[2]   Stopped                 find / -print

[3]-  Running                 find / -perm +7000 > /tmp/text.txt &

6. 管理背景中的工作kill

[root@www ~]# kill -signal %jobnumber

[root@www ~]# kill -l

选项与参数:

-l  :这个是 L 的小写,列出目前 kill 能够使用的讯号 (signal) 有哪些?

signal :代表给予后面接的那个工作什么样的指示罗!用 man 7 signal 可知:

  -1 :重新读取一次参数的配置档 (类似 reload);

  -2 :代表与由键盘输入 [ctrl]-c 同样的动作;

  -9 :立刻强制删除一个工作;

  -15:以正常的程序方式终止一项工作。与 -9 是不一样的。



范例一:找出目前的 bash 环境下的背景工作,并将该工作『强制删除』。

[root@www ~]# jobs

[1]+  Stopped                 vim ~/.bashrc

[2]   Stopped                 find / -print

[root@www ~]# kill -9 %2; jobs

[1]+  Stopped                 vim ~/.bashrc

[2]   Killed                  find / -print

# 再过几秒你再下达 jobs 一次,就会发现 2 号工作不见了!因为被移除了!



范例:找出目前的 bash 环境下的背景工作,并将该工作『正常终止』掉。

[root@www ~]# jobs

[1]+  Stopped                 vim ~/.bashrc

[root@www ~]# kill -SIGTERM %1

# -SIGTERM 与 -15 是一样的!您可以使用 kill -l 来查阅!
kill

kill的特殊信号0的作用:

kill -0 pid 不发送任何信号,但是系统会进行错误检查。
所以经常用来检查一个进程是否存在,存在返回0;不存在返回1

7. 离线管理的问题

还记得第一点里的&并不能让终端断开时程序继续运行把,那么nohup和&的配合可以解决这个问题。

[root@www ~]# nohup [命令与参数]   <==在终端机前景中工作

[root@www ~]# nohup [命令与参数] & <==在终端机背景中工作

# 1. 先编辑一支会『睡著 500 秒』的程序:

[root@www ~]# vim sleep500.sh

#!/bin/bash

/bin/sleep 500s

/bin/echo "I have slept 500 seconds."



# 2. 丢到背景中去运行,并且立刻注销系统:

[root@www ~]# chmod a+x sleep500.sh

[root@www ~]# nohup ./sleep500.sh &

[1] 5074

[root@www ~]# nohup: appending output to ‘nohup.out’ <==会告知这个信息!

[root@www ~]# exit

 

二. 程序进程管理

1. ps

[root@www ~]# ps aux  <==观察系统所有的程序数据

[root@www ~]# ps -lA  <==也是能够观察所有系统的数据

[root@www ~]# ps axjf <==连同部分程序树状态

选项与参数:

-A  :所有的 process 均显示出来,与 -e 具有同样的效用;

-a  :不与 terminal 有关的所有 process ;

-u  :有效使用者 (effective user) 相关的 process ;

x   :通常与 a 这个参数一起使用,可列出较完整资讯。

输出格式规划:

l   :较长、较详细的将该 PID 的的资讯列出;

j   :工作的格式 (jobs format)

-f  :做一个更为完整的输出。
PS常用命令

 

2.top

[root@www ~]# top [-d 数字] | top [-bnp]

选项与参数:

-d  :后面可以接秒数,就是整个程序画面升级的秒数。默认是 5 秒;

-b  :以批量的方式运行 top ,还有更多的参数可以使用喔!

      通常会搭配数据流重导向来将批量的结果输出成为文件。

-n  :与 -b 搭配,意义是,需要进行几次 top 的输出结果。

-p  :指定某些个 PID 来进行观察监测而已。

在 top 运行过程当中可以使用的按键命令:

    ? :显示在 top 当中可以输入的按键命令;

    P :以 CPU 的使用资源排序显示;

    M :以 Memory 的使用资源排序显示;

    N :以 PID 来排序喔!

    T :由该 Process 使用的 CPU 时间累积 (TIME+) 排序。

    k :给予某个 PID 一个讯号  (signal)

    r :给予某个 PID 重新制订一个 nice 值。

    q :离开 top 软件的按键。
top语法总结
范例一:每两秒钟升级一次 top ,观察整体资讯:

[root@www ~]# top -d 2

范例二:将 top 的资讯进行 2 次,然后将结果输出到 /tmp/top.txt

[root@www ~]# top -b -n 2 > /tmp/top.txt

# 这样一来,嘿嘿!就可以将 top 的资讯存到 /tmp/top.txt 文件中了。

范例三:我们自己的 bash PID 可由 $$ 变量取得,请使用 top 持续观察该 PID

[root@www ~]# echo $$

13639  <==就是这个数字!他是我们 bash 的 PID

[root@www ~]# top -d 2 -p 13639


范例四:承上题,上面的 NI 值是 0 ,想要改成 10 的话?

# 在范例三的 top 画面当中直接按下 r 之后,
按下 r 然后输入这个 PID 号码,然后再输入NI值

 
top范例

 

3. pstree

[root@www ~]# pstree [-A|U] [-up]

选项与参数:

-A  :各程序树之间的连接以 ASCII 字节来连接;

-U  :各程序树之间的连接以万国码的字节来连接。在某些终端介面下可能会有错误;

-p  :并同时列出每个 process 的 PID;

-u  :并同时列出每个 process 的所属帐号名称。
pstree语法总结

 

4. kill


[root@study ~]# kill -signal PID


代号 名称 内容
1 SIGHUP 启动被终止的程序,可让该 PID 重新读取自己的配置档,类似重新启动 2 SIGINT 相当於用键盘输入 [ctrl]-c 来中断一个程序的进行 9 SIGKILL 代表强制中断一个程序的进行,如果该程序进行到一半, 那么尚未完成的部分可能会有『半产品』产生,类似 vim会有 .filename.swp 保留下来。 15 SIGTERM 以正常的结束程序来终止该程序。由於是正常的终止, 所以后续的动作会将他完成。不过,如果该程序已经发生问题,就是无法使用正常的方法终止时, 输入这个 signal 也是没有用的。 17 SIGSTOP 相当於用键盘输入 [ctrl]-z 来暂停一个程序的进行

5. killall 

[root@www ~]# killall [-iIe] [command name]

选项与参数:

-i  :interactive 的意思,互动式的,若需要删除时,会出现提示字节给使用者;

-e  :exact 的意思,表示『后面接的 command name 要一致』,但整个完整的命令

      不能超过 15 个字节。

-I  :命令名称(可能含参数)忽略大小写。



范例一:给予 syslogd 这个命令启动的 PID 一个 SIGHUP 的讯号

[root@www ~]# killall -1 syslogd

# 如果用 ps aux 仔细看一下,syslogd 才是完整的命令名称。但若包含整个参数,

# 则 syslogd -m 0 才是完整的呢!



范例二:强制终止所有以 httpd 启动的程序

[root@www ~]# killall -9 httpd



范例三:依次询问每个 bash 程序是否需要被终止运行!

[root@www ~]# killall -i -9 bash

Kill bash(16905) ? (y/N) n <==这个不杀!

Kill bash(17351) ? (y/N) y <==这个杀掉!

# 具有互动的功能!可以询问你是否要删除 bash 这个程序。要注意,若没有 -i 的参数,

# 所有的 bash 都会被这个 root 给杀掉!包括 root 自己的 bash
killall语法总结

 

6. 程序的运行优先级管理

1)程序的优先级PRI是系统自己计算的,我们无法控制PRI,但是我们可以通过NI值配置影响PRI(值越小越优先),公式为:PRI(new) = PRI(old) + nice 

2)NICE的调整知识:

  • nice 值可调整的范围为 -20 ~ 19 ; 
  • root 可随意调整自己或他人程序的 Nice 值,且范围为 -20 ~ 19 ; 
  • 一般使用者仅可调整自己程序的 Nice 值,且范围仅为 0 ~ 19 (避免一般用户抢占系统资源); 
  • 一般使用者仅可将 nice 值越调越高,例如本来 nice 为 5 ,则未来仅能调整到大於 5;

3)NICE的调整方法:

  • 一开始运行程序就立即给予一个特定的 nice 值:用 nice 命令; 
    • [root@www ~]# nice [-n 数字] command
      
      选项与参数:
      
      -n  :后面接一个数值,数值的范围 -20 ~ 19。
      
      
      
      范例一:用 root 给一个 nice 值为 -5 ,用於运行 vi ,并观察该程序!
      
      [root@www ~]# nice -n -5 vi &
      
      [1] 18676
      
      [root@www ~]# ps -l
      
      F S   UID   PID  PPID  C PRI  NI ADDR SZ WCHAN  TTY          TIME CMD
      
      4 S     0 18625 18623  0  75   0 -  1514 wait   pts/1    00:00:00 bash
      
      4 T     0 18676 18625  0  72  -5 -  1242 finish pts/1    00:00:00 vi
      
      4 R     0 18678 18625  0  77   0 -  1101 -      pts/1    00:00:00 ps
      
      # 原本的 bash PRI 为 75  ,所以 vi 默认应为 75。不过由於给予 nice  为 -5 ,
      
      # 因此 vi 的 PRI 降低了!但并非降低到 70 ,因为核心还会动态调整!
      
      
      
      [root@www ~]# kill -9 %1 <==测试完毕将 vi 关闭
      NICE用法

       

  • 调整某个已经存在的 PID 的 nice 值:用 renice 命令。
    • [root@www ~]# renice [number] PID
      
      选项与参数:
      
      PID :某个程序的 ID 啊!
      
      
      
      范例一:找出自己的 bash PID ,并将该 PID 的 nice 调整到 10
      
      [root@www ~]# ps -l
      
      F S   UID   PID  PPID  C PRI  NI ADDR SZ WCHAN  TTY          TIME CMD
      
      4 S     0 18625 18623  0  75   0 -  1514 wait   pts/1    00:00:00 bash
      
      4 R     0 18712 18625  0  77   0 -  1102 -      pts/1    00:00:00 ps
      
      
      
      [root@www ~]# renice 10 18625
      
      18625: old priority 0, new priority 10
      
      
      
      [root@www ~]# ps -l
      
      F S   UID   PID  PPID  C PRI  NI ADDR SZ WCHAN  TTY          TIME CMD
      
      4 S     0 18625 18623  0  85  10 -  1514 wait   pts/1    00:00:00 bash
      
      4 R     0 18715 18625  0  87  10 -  1102 -      pts/1    00:00:00 ps
      renice用法
  • top中调整,具体见top方法。

7. 系统资源的观察

[root@www ~]# free [-b|-k|-m|-g] [-t]

选项与参数:

-b  :直接输入 free 时,显示的单位是 Kbytes,我们可以使用 b(bytes), m(Mbytes)

      k(Kbytes), 及 g(Gbytes) 来显示单位喔!

-t  :在输出的最终结果,显示实体内存与 swap 的总量。



范例一:显示目前系统的内存容量

[root@www ~]# free -m

          total       used    free   shared   buffers    cached

Mem:        725        666      59        0       132       287

-/+ buffers/cache:     245     479

Swap:       996          0     996
free
[root@www ~]# uname [-asrmpi]

选项与参数:

-a  :所有系统相关的资讯,包括底下的数据都会被列出来;

-s  :系统核心名称

-r  :核心的版本

-m  :本系统的硬件名称,例如 i686 或 x86_64 等;

-p  :CPU 的类型,与 -m 类似,只是显示的是 CPU 的类型!

-i  :硬件的平台 (ix86)



范例一:输出系统的基本资讯

[root@www ~]# uname -a

Linux www.vbird.tsai 2.6.18-92.el5 #1 SMP Tue Jun 10 18:49:47 EDT 2008 i686

i686 i386 GNU/Linux
uname
[root@www ~]# uptime

 15:39:13 up 8 days, 14:52,  1 user,  load average: 0.00, 0.00, 0.00

# top 这个命令已经谈过相关资讯。
uptime
[root@www ~]# netstat -[atunlp]

选项与参数:

-a  :将目前系统上所有的连线、监听、Socket 数据都列出来

-t  :列出 tcp 网络封包的数据

-u  :列出 udp 网络封包的数据

-n  :不以程序的服务名称,以埠号 (port number) 来显示;

-l  :列出目前正在网络监听 (listen) 的服务;

-p  :列出该网络服务的程序 PID 



范例一:列出目前系统已经创建的网络连线与 unix socket 状态

[root@www ~]# netstat

Active Internet connections (w/o servers) <==与网络较相关的部分

Proto Recv-Q Send-Q Local Address        Foreign Address      State

tcp        0    132 192.168.201.110:ssh  192.168.:vrtl-vmf-sa ESTABLISHED

Active UNIX domain sockets (w/o servers)  <==与本机的程序自己的相关性(非网络)

Proto RefCnt Flags       Type       State         I-Node Path

unix  20     [ ]         DGRAM                    9153   /dev/log

unix  3      [ ]         STREAM     CONNECTED     13317  /tmp/.X11-unix/X0

unix  3      [ ]         STREAM     CONNECTED     13233  /tmp/.X11-unix/X0

unix  3      [ ]         STREAM     CONNECTED     13208  /tmp/.font-unix/fs7100

....(中间省略)....
netstat
范例一:输出所有的核心启动时的资讯

[root@www ~]# dmesg | more



范例二:搜寻启动的时候,硬盘的相关资讯为何?

[root@www ~]# dmesg | grep -i hd

    ide0: BM-DMA at 0xd800-0xd807, BIOS settings: hda:DMA, hdb:DMA

    ide1: BM-DMA at 0xd808-0xd80f, BIOS settings: hdc:pio, hdd:pio

hda: IC35L040AVER07-0, ATA DISK drive

hdb: ASUS DRW-2014S1, ATAPI CD/DVD-ROM drive

hda: max request size: 128KiB

....(底下省略)....
dmesg-分析启动过程
[root@www ~]# vmstat [-a] [延迟 [总计侦测次数]] <==CPU/内存等资讯

[root@www ~]# vmstat [-fs]                      <==内存相关

[root@www ~]# vmstat [-S 单位]                  <==配置显示数据的单位

[root@www ~]# vmstat [-d]                       <==与磁碟有关

[root@www ~]# vmstat [-p 分割槽]                <==与磁碟有关

选项与参数:

-a  :使用 inactive/active(活跃与否) 取代 buffer/cache 的内存输出资讯;

-f  :启动到目前为止,系统复制 (fork) 的程序数;

-s  :将一些事件 (启动至目前为止) 导致的内存变化情况列表说明;

-S  :后面可以接单位,让显示的数据有单位。例如 K/M 取代 bytes 的容量;

-d  :列出磁碟的读写总量统计表

-p  :后面列出分割槽,可显示该分割槽的读写总量统计表



范例一:统计目前主机 CPU 状态,每秒一次,共计三次!

[root@www ~]# vmstat 1 3

procs -----------memory---------- ---swap-- -----io---- --system-- -----cpu------

 r  b   swpd   free   buff  cache   si   so    bi    bo   in   cs us sy id wa st

 0  0     28  61540 137000 291960    0    0     4     5   38   55  0  0 100  0  0

 0  0     28  61540 137000 291960    0    0     0     0 1004   50  0  0 100  0  0

 0  0     28  61540 137000 291964    0    0     0     0 1022   65  0  0 100  0  0


范例二:系统上面所有的磁碟的读写状态

[root@www ~]# vmstat -d

disk- ------------reads------------ ------------writes----------- -----IO------

       total merged sectors      ms  total merged sectors      ms    cur    sec

ram0       0      0       0       0      0      0       0       0      0      0

....(中间省略)....

hda   144188 182874 6667154 7916979 151341 510244 8027088 15244705      0    848

hdb        0      0       0       0      0      0       0       0      0      0
vmstat-侦测系统资源变化
[root@www ~]# fuser [-umv] [-k [i] [-signal]] file/dir

选项与参数:

-u  :除了程序的 PID 之外,同时列出该程序的拥有者;

-m  :后面接的那个档名会主动的上提到该文件系统的最顶层,对 umount 不成功很有效!

-v  :可以列出每个文件与程序还有命令的完整相关性!

-k  :找出使用该文件/目录的 PID ,并试图以 SIGKILL 这个讯号给予该 PID;

-i  :必须与 -k 配合,在删除 PID 之前会先询问使用者意愿!

-signal:例如 -1 -15 等等,若不加的话,默认是 SIGKILL (-9) 罗!



范例一:找出目前所在目录的使用 PID/所属帐号/权限 为何?

[root@www ~]# fuser -uv .

                     USER        PID ACCESS COMMAND

.:                   root      20639 ..c.. (root)bash


看到输出的结果没?他说『.』底下有个 PID 为 20639 的程序,该程序属於 root 且命令为 bash 。 比较有趣的是那个 ACCESS 的项目,那个项目代表的意义为:

c :此程序在当前的目录下(非次目录);
e :可被触发为运行状态;
f :是一个被开启的文件;
r :代表顶层目录 (root directory);
F :该文件被开启了,不过在等待回应中;
m :可能为分享的动态函式库;


范例二:找到所有使用到 /proc 这个文件系统的程序吧!

[root@www ~]# fuser -uv /proc

# 不会显示任何数据,因为没有任何程序会去使用 /proc 这个目录啊!

# 会被用到的是 /proc 底下的文件啦!所以你应该要这样做:



[root@www ~]# fuser -mvu /proc

                     USER        PID ACCESS COMMAND

/proc:               root       4289 f.... (root)klogd

                     root       4555 f.... (root)acpid

                     haldaemon  4758 f.... (haldaemon)hald

                     root       4977 F.... (root)Xorg

# 有这几支程序在进行 /proc 文件系统的存取喔!这样清楚了吗?


范例三:找到 /var 底下属於 FIFO 类型的文件,并且找出存取该文件的程序

[root@www ~]# find /var -type p

/var/gdm/.gdmfifo     <==我们针对这玩意即可!

/var/run/autofs.fifo-misc

/var/run/autofs.fifo-net



[root@www ~]# fuser -uv /var/gdm/.gdmfifo

                     USER        PID ACCESS COMMAND

/var/gdm/.gdmfifo:   root       4892 F.... (root)gdm-binary



范例四:同范例三,但试图删除该 PID?且『不要』删除喔!

[root@www ~]# fuser -ki /var/gdm/.gdmfifo

/var/gdm/.gdmfifo:    4892

Kill process 4892 ? (y/N) n
fuser-由文件找使用的程序
[root@www ~]# lsof [-aUu] [+d]

选项与参数:

-a  :多项数据需要『同时成立』才显示出结果时!

-U  :仅列出 Unix like 系统的 socket 文件类型;

-u  :后面接 username,列出该使用者相关程序所开启的文件;

+d  :后面接目录,亦即找出某个目录底下已经被开启的文件!



范例一:列出目前系统上面所有已经被开启的文件与装置:

[root@www ~]# lsof

COMMAND PID  USER   FD  TYPE  DEVICE   SIZE     NODE NAME

init      1  root  cwd   DIR     3,2   4096        2 /

init      1  root  rtd   DIR     3,2   4096        2 /

init      1  root  txt   REG     3,2  38620  1426405 /sbin/init

....(底下省略)....

# 注意到了吗?是的,在默认的情况下, lsof 会将目前系统上面已经开启的

# 文件全部列出来~所以,画面多的吓人啊!您可以注意到,第一个文件 init 运行的

# 地方就在根目录,而根目录,嘿嘿!所在的 inode 也有显示出来喔!



范例二:仅列出关於 root 的所有程序开启的 socket 文件

[root@www ~]# lsof -u root -a -U

COMMAND     PID USER   FD   TYPE     DEVICE SIZE   NODE NAME

udevd       400 root    3u  unix 0xedd4cd40        1445 socket

auditd     4256 root    7u  unix 0xedd4c380        9081 socket

audispd    4258 root    0u  unix 0xedd4c1e0        9080 socket

# 注意到那个 -a 吧!如果你分别输入 lsof -u root 及 lsof -U ,会有啥资讯?

# 使用 lsof -u root -U 及 lsof -u root -a -U ,呵呵!都不同啦!

# -a 的用途就是在解决同时需要两个项目都成立时啊! ^_^



范例三:请列出目前系统上面所有的被启动的周边装置

[root@www ~]# lsof +d /dev

COMMAND     PID      USER   FD   TYPE     DEVICE SIZE  NODE NAME

init          1      root   10u  FIFO       0,16       1147 /dev/initctl

udevd       400      root    0u   CHR        1,3       1420 /dev/null

udevd       400      root    1u   CHR        1,3       1420 /dev/null

udevd       400      root    2u   CHR        1,3       1420 /dev/null

# 看吧!因为装置都在 /dev 里面嘛!所以罗,使用搜寻目录即可啊!



范例四:秀出属於 root 的 bash 这支程序所开启的文件

[root@www ~]# lsof -u root | grep bash

bash   20639 root  cwd    DIR    3,2    4096    648321 /root

bash   20639 root  rtd    DIR    3,2    4096         2 /

bash   20639 root  txt    REG    3,2  735004   1199424 /bin/bash

bash   20639 root  mem    REG    3,2   46680     64873 /lib/libnss_files-2.5.so

....(底下省略)....
lsof-由程序找文件
[root@www ~]# pidof [-sx] program_name

选项与参数:

-s  :仅列出一个 PID 而不列出所有的 PID

-x  :同时列出该 program name 可能的 PPID 那个程序的 PID



范例一:列出目前系统上面 init 以及 syslogd 这两个程序的 PID

[root@www ~]# pidof init syslogd

1 4286

# 理论上,应该会有两个 PID 才对。上面的显示也是出现了两个 PID 喔。

# 分别是 init 及 syslogd 这两支程序的 PID 啦。
pidof找出某支正在运行的程序的 PID

 

posted @ 2020-03-09 18:54  IamJet  阅读(182)  评论(0编辑  收藏  举报