Loading

Linux命令拾遗-top中的%nice是啥

原创:打码日记(微信公众号ID:codelogs),欢迎分享,转载请保留出处。

简介

这是Linux命令拾遗系列的第八篇,本篇主要介绍top命令中nice%这个指标的含义以及进程优先级相关内容。

本系列文章索引
Linux命令拾遗-入门篇
Linux命令拾遗-文本处理篇
Linux命令拾遗-软件资源观测
Linux命令拾遗-硬件资源观测
Linux命令拾遗-剖析工具
Linux命令拾遗-动态追踪工具
Linux命令拾遗-理解系统负载

在各种查看CPU使用率的工具中(如top),一般都有us%、sy%、ni%等,us%与sy%含义是比较容易理解的,一个是用户态CPU使用率,一个是内核态CPU使用率。
但ni%就比较晦涩难懂了,它代表被调整过nice值的进程占用的CPU使用率,很难理解对不对,来看看下面的例子。

调整进程nice值

首先,我们使用stress命令起2个进程,对CPU制造一些压力,如下:

# 起2个吃CPU的后台进程
$ stress -c 2 &

# 查看两个stress进程,进程号为194022、194022
$ pstree -Tp $$
bash(193921)─┬─pstree(194101)
             └─stress(194017)─┬─stress(194022)
                              └─stress(194023)

由于我机器是多核的,操作系统会将两个stress进程调度到两个核上,为了达到效果,我们将这2个进程绑定到1号核上运行,如下:

# 绑定2个stress进程到CPU的1号核上
$ taskset -pc 1 194022
$ taskset -pc 1 194023

# 然后使用top查看,如下图
$ top

no_renice
可以看到,此时%Cpu1是占满的100%,两个stress进程各占50%,这很好理解,两个同样吃CPU进程跑在一个核上,大家各分一半嘛!

这里需要注意一下进程的PR与NI列,这两个都代表了进程的优先级,PR是内核调度时使用的优先级(priority),默认20,值越大优先级越低,而NI是开放给用户调整的优先级(nice),默认0,nice值越大,则进程会表现得越谦让(nice),先让别的进程获得CPU,表现为优先级越低。

如下,我们通过renice命令调整194023进程的nice值为5,以降低它的优先级:

$ renice -n 5 -p 194023
$ top

renice_5
可以发现,现在%Cpu1的us是75.7,ni是24.3,没被调整nice的进程194022的%CPU是75.1,而调整了的进程194023的%CPU是24.6,同时NI列从0变成了5,PR列从20变成了25,可以发现%ni的值24.3几乎等于被调整过nice值进程的CPU使用率,即24.6。

再看看我开头说的ni%的定义,ni%代表被调整过nice值的进程占用的CPU使用率,现在感觉这句话是不是再清楚不过了,被调整了nice值的进程,会从us%中分离出来单独显示,这样当一批非常吃CPU的进程被调整nice值后,调整的人就能非常清楚的知道,这些进程现在占用多少CPU了。

如下,再通过renice命令调用194023进程的nice值为19,这是nice值能设置的最大值:

$ renice -n 19 -p 194023
$ top

renice_19
可以发现194023这个进程CPU使用率更低了,且%Cpu1的ni也更低了,并且NI变成了19,PR变成了39。

PR与NI

上面可以看到,PR与NI好像满足这样一种等式关系:PR = 20 + NI,那么为什么Linux要设计这两套优化级呢?

其实,在进程执行的过程中,就算你调整了进程NI值导致PR变化,PR还是可以再次由CPU调度器根据需要动态调整的,在这种情况下,上面的公式就不成立了。并且,在内核代码里,PR才是CPU调度器真正使用的优化级,而NI只是开放给用户修改的。

另外,NI值是给普通进程使用的,范围是[-20 ~ 19]共39个级别,对应PR就是[0 ~ 39]
而PR的取值范围可以是[-100 ~ 39]共139个级别,其中[-100, -1]是给实时进程用的。
所以在Linux中PR大于0是普通进程,小于0是实时进程。

注:在top中会看到 PR = rt 的进程,这个rt等同于-100

可以发现,对于普通进程,不管用户怎么调整NI值,进程的PR都不会低于0,也就是保证所有实时进程的优先级,都要大于普通进程,像Linux中的一些内核进程就是实时进程(如:migration/0),必须保证他们被优先执行。

如下,在Linux中,可以通过chrt命令查看内核支持的实时进程调度策略:

$ chrt -m
SCHED_OTHER min/max priority    : 0/0
SCHED_FIFO min/max priority     : 1/99
SCHED_RR min/max priority       : 1/99
SCHED_BATCH min/max priority    : 0/0
SCHED_IDLE min/max priority     : 0/0
SCHED_DEADLINE min/max priority : 0/0

是的,你会发现SCHED_FIFO/SCHED_RR策略都有[1,99]共99个实时优先级(real_time_priority)可用,它和PR的关系是:PR = -1 - real_time_priority

如下,之前通过增大NI值而降低了优先级的194023进程,我再把它修改为实时进程:

# 设置194023进程为实时进程,调度策略为SCHED_RR,实时优先级为10,PR = -1 -10 = -11
$ sudo chrt --rr --pid 10 194023

# 查看实时优先级
$ chrt -p 194023
pid 194023's current scheduling policy: SCHED_RR
pid 194023's current scheduling priority: 10

# 再看CPU使用率
$ top

chrt
可以看到,194023被调整为实时进程后,把CPU占满了,没有给同核心运行的普通进程194022留下任何CPU时间。

所以实时进程的调度是抢占式的,只要其不结束,低优先级进程完全没有机会使用CPU,而对于普通进程而言,多少会留一点CPU时间给其它低优先级的普通进程使用的。

另外,使用ps -l也可以查看进程的PR与NI,如下:

$ ps -lp 194022 194023
F S   UID     PID    PPID  C PRI  NI ADDR SZ WCHAN  TTY        TIME CMD
1 R     0  194022  194017 97  80   0 -   964 -      ?        1943:32 stress -c 2
1 R     0  194023  194017  2  49   - -   964 -      ?         52:08 stress -c 2

看PRI这一列,可以发现,194022在top中是20,在ps中是80,而194023在top中是-11,在ps中是49,它们都相差60。

是的,他们含义是一致的,只是显示的基准值不同而已,top中0以下代表实时进程,而ps -l中60以下代表实时进程。

往期内容

Linux命令拾遗-入门篇
原来awk真是神器啊
Linux文本命令技巧(上)
Linux文本命令技巧(下)
字符编码解惑

posted @ 2022-03-26 20:22  扣钉日记  阅读(1381)  评论(0编辑  收藏  举报