Linux学习笔记(20) Linux系统管理
1.进程管理
进程是正在执行的一个程序或命令,每一个进程都是一个运行的实体,都有自己的地址空间,并占用一定的系统资源。
进程管理的作用有判断服务器健康状态、查看系统中所有进程及杀死进程。一般都可以采用正确的命令终止进程,只有当终止失效时,才强制杀死进程。
(1) 查看系统中所有进程
① ps aux命令表示查看系统中所有进程,使用BSD操作系统格式
USER:该进程是由哪个用户产生的;
PID:进程的ID号;
%CPU:该进程占用CPU资源的百分比,占用越高,进程越耗费资源;
%MEM:该进程占用物理内存的百分比,占用越高,进程越耗费资源;
VSZ:该进程占用虚拟内存的大小,单位为KB;
RSS:该进程占用实际物理内存的大小,单位为KB;
TTY:该进程是在哪个终端中运行的。其中tty1-tty7代表本地控制台终端,tty1-tty6是本地的字符界面终端,tty7是图形终端。pts/0-255代表虚拟终端;
STAT:进程状态。常见的状态有R—运行,S—睡眠,T—停止状态,s—包含子进程,+--位于后台;
START:该进程的启动时间;
TIME:该进程占用CPU的运算时间,注意不是系统时间;
COMMAND:产生此进程的命令名
② ps –le命令表示查看系统中所有进程,使用Linux标准命令格式。
(2) 查看系统健康状态
top命令即可完成这样的功能,其格式为:
top [选项]
其中,-d 秒数:指定top命令每隔几秒更新,默认3秒在top命令的交互模式当中可以执行的命令;
?或h:显示交互模式的帮助;
P:以CPU使用率排序,默认就是此项;
M:以内存的使用率排序;
N:以PID排序;
q:退出top
top命令的前五行信息表示如下:
第一行信息为任务队列信息
内容 |
说明 |
12:26:46 |
系统当前时间 |
up 1 day, 13:32 |
系统的运行时间,本机已经运行1天13小时32分钟 |
2 users |
当前登陆了两个用户 |
load average:0.00, 0.00, 0.00 |
系统在之前1分总,5分钟,15分钟的平均负载。一般认为小于1时,负载较小。如果大于1,系统已经超出负荷 |
第二行为进程信息
内容 |
说明 |
Task: 95 total |
系统中的进程数 |
1 running |
正在运行的进程数 |
94 sleeping |
睡眠的进程 |
0 stopped |
正在停止的进程 |
0 zombie |
僵尸进程,如果不是0,需手工检查僵尸进程 |
第三行为CPU信息
内容 |
说明 |
Cpu(s): 0.1%us |
用户模式占用的CPU百分比 |
0.1%sy |
系统模式占用的CPU百分比 |
0.0%ni |
改变过优先级的用户进程占用的CPU百分比 |
99.7%id |
空闲CPU的CPU百分比 |
0.1%wa |
等待输入/输出的进程占用的CPU百分比 |
0.0%hi |
硬中断请求服务占用的CPU百分比 |
0.0%si |
软中断请求服务占用的CPU百分比 |
0.0%st |
Steal time虚拟时间百分比,就是当有虚拟机时,虚拟CPU等待实际CPU的时间百分比 |
第四行为物理内存信息
内容 |
说明 |
Mem: 625344k total |
物理内存的总量,单位KB |
571504k used |
已经使用的物理内存数量 |
53840k free |
空闲的物理内存数量 |
65800k buffers |
作为缓冲的内存数量 |
第五行尾交换分区(swap)信息
内容 |
说明 |
Swap: 524280k total |
交换分区的总大小 |
0k used |
已经使用的交换分区的大小 |
524280k free |
空闲交换分区的大小 |
409280k cached |
作为缓存的交互分区的大小 |
(3) 查看进程树
pstree的作用是查看进程树,其格式为:
pstree [选项]
其中,-p选项显示进程的PID,-u选项显示进程的所属用户。
2. 终止进程
(1) kill命令
kill –l命令可查看可用的进程信号。
信号代码 |
信号名称 |
说明 |
1 |
SIGHUP |
该信号让进程立即关闭,然后重新读取配置文件之后重启 |
2 |
SIGINT |
程序终止信号,用于终止前台进程,相当于输出ctrl+c |
8 |
SIGFPE |
在发生致命的算数运算错误时发出,不仅包括浮点运算错误,还包括溢出及除数为0等其他所有的算术错误 |
9 |
SIGKILL |
用来立即结束程序的运行,本信号不能被阻塞,处理和忽略,一般用于强制终止进程 |
14 |
SIGALRM |
时钟定时信号,计算的是实际的时间或时钟时间,alarm函数使用该信号 |
15 |
SIGTERM |
正常结束进程的信号,kill命令的默认信号。有时如果进程已经发生问题,这个信号是无法正常终止进程的,我们才会尝试SIGKILL信号,也就是信号9 |
18 |
SIGCONT |
该信号可以让暂停的进程恢复执行,本信号不能被阻断 |
19 |
SIGSTOP |
该信号可以暂停前台进程,相当于输入ctrl+z快捷键,本信号不能被阻断 |
例:重启进程
kill -1 22354
强制杀死进程
kill -9 22368
(2) killall命令
killall可以按照进程名杀死进程,其格式为:
killall [选项][信号] 进程名
其中,-i选项表示交互式,询问是否要杀死某个进程,-I选项表示忽略进程名的大小写
例:[root@localhost ~]# killall -9 httpd
(3) pkill命令
与killall类似,其格式为:
pkill [选项][信号] 进程名
其中,-t 终端号选项表示按照终端号踢出用户
例:
#使用w命令查询本机已经登录的用户
w
#强制杀死从pts/1虚拟终端登录的进程
pkill -9 –t pts/1
3. 工作管理
把进程放入后台,有两种方法:1) tar –zcf etc.tar.gz /etc &;2)top,在top命令执行的过程中,按下ctrl+z快捷键。其中前者是后台运行,后者是后台暂停,通过jobs可以查看后台暂停的进程。
jobs –l命令可以显示工作的PID,注意:"+"代表最近一个放入后台的工作,也是工作恢复时,默认恢复的工作。"-"带包倒数第二个放入后台的工作。
将后台暂停的工作恢复到前台执行的命令是fg,其格式为:
fg %工作号
参数%工作号中的%可以省略,但是注意工作号和PID的区别。
把后台暂停的工作恢复到后台执行,其命令为bg %工作号,注意:后台恢复执行的命令,是不能和前台有交互的,否则不能恢复到后台执行,如top和vi命令。
4. 系统资源查看
(1) vmstat命令用于监控系统资源,其格式为:
vmstat [刷新延时 刷新次数]
例:监听3次系统资源,每次间隔1秒钟
[root@localhost ~]# vmstat 1 3 procs -----------memory---------- ---swap-- -----io---- --system-- -----cpu----- r b swpd free buff cache si so bi bo in cs us sy id wa st 0 0 0 747736 34948 136040 0 0 35 4 34 21 0 1 97 2 0 0 0 0 747720 34948 136040 0 0 0 0 16 16 0 0 100 0 0 0 0 0 747720 34948 136040 0 0 0 0 11 12 0 0 100 0 0
(2) dmesg开机时内核检测信息
例:查看开机时内核的CPU信息或网卡信息
dmesg | grep CPU
dmesg | grep eth0
(3) free命令用于查看内存使用状态
free [-b|-k|-m|-g],其中-b,-k,-m,-g分别表示以字节,KB,MB,GB为单位进行显示,默认为KB。
缓冲和缓存的区别:简单来说,缓存(cache)使用来加速数据从硬盘中"读取"的,而缓冲(bugger)是用来加速数据"写入"硬盘的
(4) 查看CPU信息
cat /proc/cpuinfo,与前者相比,更加详细
(5) uptime命令显示系统的启动时间和平均负载,也就是top的第一行,w命令也可以看到这个数据。
(6) 查看系统与内核相关信息
uname [选项]
其中,-a选项表示查看系统所有相关信息;-r选项表示查看内核版本;-s选项表示查看内核名称
判断当前系统的位数:file [系统外部命令],如file /bin/ls,查询当前Linux系统的发行版本:lsb_release –a
(7) 列出进程打开或使用的文件信息
lsof [选项]
其中,-c 字符串选项表示只列出以字符串开头的进程打开的文件;-u 用户名选项表示只列出某个用户的进程打开的文件;-p pid选项表示列出某个PID进程打开的文件。
5. 系统定时任务
(1) crond服务管理与访问控制
启动命令:service crond restart
自启动命令:ckoconfig crond on
(2) 用户的crondtab设置
格式为:crontab [选项]
其中,-e选项编辑crontab定时任务,-l选项查询crontab任务,-r选项删除当前用户所有的crontab任务。
crontab –e将会进入crontab编辑界面,会打开vim编辑你的工作。
* * * * * 执行的任务
其中的星号含义如下:
项目 |
含义 |
范围 |
第1个“*” |
一小时当中的第几分钟 |
0-59 |
第2个“*” |
一天当中的第几小时 |
0-23 |
第3个“*” |
一个月当中的第几天 |
1-31 |
第4个“*” |
一年当中的第几月 |
1-12 |
第5个“*” |
一周当中的星期几 |
0-7(0和7都代表星期日) |
特殊符号 |
含义 |
* |
代表任何时间。比如第一个"*"就代表1小时中每分钟都执行一次的意思 |
, |
代表不连续的时间。比如"0 8,12,16 * * * 命令",就代表在每天的8点0分,12点0分,16点0分都执行一次命令 |
- |
代表连续的时间范围。比如"0 5 * * 1-6 命令",代表在周一到周六的凌晨5点0分执行命令 |
*/n |
代表每隔多久执行一次。比如"*/10 * * * * 命令",代表每隔10分钟就执行一遍命令 |
时间 |
含义 |
45 22 * * * 命令 |
在22点45分执行命令 |
0 17 * * * 1 命令 |
每周一的17点0分执行命令 |
0 5 1,15 * * 命令 |
每月的1号和15号的凌晨5点0分执行命令 |
40 4 * * 1-5 命令 |
每周一到周五的凌晨4点40分执行命令 |
*/10 4 * * * 命令 |
每天的凌晨4点,每隔十分钟执行一次命令 |
0 0 1,15 * 1 命令 |
每月的1号和15号,每周1的0点0分都会执行命令。注意:星期几和几号最好不要同时出现,因为他们定义的都是天,非常容易让管理员混乱。 |
注:在定时任务中,特殊符号前需要使用转义符"\"。如:date +\%y\%m\%d
[root@localhost ~]# crontab -e no crontab for root - using an empty one */5 * * * * /bin/echo "11" &> /tmp/crontab_test 5 5 * * * 2 /sbin/shutdown -r now 0 5 1,10,15 * * /root/sh/autobak.sh [root@localhost ~]# crontab -l */5 * * * * /bin/echo "11" &> /tmp/crontab_test 5 5 * * * 2 /sbin/shutdown -r now 0 5 1,10,15 * * /root/sh/autobak.sh