linux rlimit资源限制


一、简介

每个进程在运行时系统不会无限制的允许单个进程不断的消耗系统资源,因此都会设置资源限制。Linux系统中使用 resource limit 来表示,每个进程都可以设置不同的资源限制,当前进程和其以后fork的子进程会遵循此限制,而其他进程不受当前进程条件的影响。


二、ulimit命令

通过该命令,我们可以设置当前shell环境中的一些资源限制值,这些设置会影响到该shell和由该shell中运行的其余命令,对于不相关的其他shell进程不受影响。

# ulimit -a
-t: time(cpu-seconds)     unlimited
-f: file(blocks)          unlimited
-c: coredump(blocks)      0
-d: data(KiB)             unlimited
-s: stack(KiB)            8192
-l: lockedmem(KiB)        65536
-n: nofiles(descriptors)  32768
-p: processes             53498
-i: sigpending            53498
-q: msgqueue(bytes)       819200
-e: maxnice               40
-r: maxrtprio             0
-m: resident-set(KiB)     unlimited
-v: address-space(KiB)    unlimited
-x: filelocks             unlimited

比如可以使用 ulimit -c 1 来使当前shell环境下的进程产生core文件,并且core文件大小限制在1个block。


三、rlimit系统调用

#include <sys/time.h>
#include <sys/resource.h>

int getrlimit(int resource, struct rlimit *rlim);
int setrlimit(int resource, const struct rlimit *rlim);

int prlimit(pid_t pid, int resource, const struct rlimit *new_limit, struct rlimit *old_limit);


1. getrlimit()/setrlimit()

getrlimit() 和 setrlimit() 系统调用分别获取和设置资源限制。每个资源都有一个关联的软限制和硬限制,由 rlimit 结构定义:

struct rlimit {
   rlim_t rlim_cur;  /* Soft limit */
   rlim_t rlim_max;  /* Hard limit (ceiling for rlim_cur) */
};

软限制是内核对相应资源强制执行的值。硬限制充当软限制的上限:非特权进程只能将其软限制设置为 0 到硬限制范围内的值,并(不可逆地)降低其硬限制。 特权进程(在 Linux 下:具有 CAP_SYS_RESOURCE 功能的进程)可以对任一限制值进行任意更改。

值 RLIM_INFINITY 表示对资源没有限制(无论是在 getrlimit() 返回的结构中还是在传递给 setrlimit() 的结构中)。

资源参数必须是以下之一:

(1) RLIMIT_AS

这是进程虚拟内存(地址空间)的最大大小。该限制以字节为单位指定,并向下舍入到系统页面大小。此限制会影响对 brk(2)、mmap(2) 和 mremap(2) 的调用,超过此限制后,这些调用会失败并出现错误 ENOMEM。

(2) RLIMIT_CORE

这是进程可以转储的核心文件(请参阅 core(5))的最大大小(以字节为单位)。 当 0 时,不创建核心转储文件。 当非零时,较大的转储将被截断至此大小。

(3) RLIMIT_CPU

这是进程可以消耗的 CPU 时间量的限制(以秒为单位)。当进程达到软限制时,会向其发送 SIGXCPU 信号。该信号的默认操作是终止进程。但是,信号可以被捕获,并且处理程序可以将控制权返回给主程序。 如果进程继续消耗CPU时间,则会每秒发送一次 SIGXCPU,直到达到硬限制,此时发送 SIGKILL。(后一点描述了 Linux 行为。实现方式因处理达到软限制后继续消耗 CPU 时间的进程的方式而异。需要捕获此信号的便携式应用程序应在首次收到 SIGXCPU 时执行有序终止。)

(4) RLIMIT_DATA

这是进程数据段(已初始化数据、未初始化数据和堆)的最大大小。 该限制以字节为单位指定,并向下舍入到系统页面大小。 此限制会影响对 brk(2)、sbrk(2) 和 mmap(2) 的调用,这些调用在遇到此资源的软限制时会失败并出现错误 ENOMEM。

(5) RLIMIT_FSIZE

这是进程可以创建的文件的最大大小(以字节为单位)。尝试将文件扩展至超出此限制会导致发送 SIGXFSZ 信号。 默认情况下,此信号终止进程,但进程可以捕获此信号,在这种情况下,相关系统调用(例如 write(2)、truncate(2))会失败并出现错误 EFBIG。

(6) RLIMIT_MEMLOCK

这是可以锁定到 RAM 中的最大内存字节数。 该限制实际上向下舍入到最接近的系统页面大小的倍数。 此限制会影响 mlock(2)、mlockall(2) 和 mmap(2) MAP_LOCKED 操作。 它还会影响 shmctl(2) SHM_LOCK 操作,它设置共享内存段中可能被真实用户 ID 锁定的共享内存段中总字节数的最大值(请参阅 shmget(2))。 调用过程。 shmctl(2) SHM_LOCK 锁与由 mlock(2)、mlockall(2) 和 mmap(2) MAP_LOCKED 建立的每进程内存锁分开计算; 进程可以在这两个类别中锁定最多达到此限制的字节。

在 2.6.9 之前的 Linux 内核中,此限制控制特权进程可以锁定的内存量。 从 Linux 2.6.9 开始,特权进程可以锁定的内存量没有限制,并且此限制控制非特权进程可以锁定的内存量。

(7) RLIMIT_MSGQUEUE

这是对 POSIX 消息队列分配的字节数的限制。 mq_open(3) 强制执行此限制。 用户创建的每个消息队列都会根据以下公式针对此限制进行计数(直到被删除):
从 Linux 3.5 开始:

bytes = attr.mq_maxmsg * sizeof(struct msg_msg) + min(attr.mq_maxmsg, MQ_PRIO_MAX) * sizeof(struct posix_msg_tree_node)+ attr.mq_maxmsg * attr.mq_msgsize;

其中 attr 是指定为 mq_open(3) 的第四个参数的 mq_attr 结构,msg_msg 和 posix_msg_tree_node 结构是内核内部结构。

公式中的“overhead”加数考虑了实现所需的开销字节,并确保用户不能创建无限数量的零长度消息(尽管如此,每个消息都会消耗一些系统内存用于簿记开销)。

(8) RLIMIT_NICE

这指定了使用 setpriority(2) 或 nice(2) 可以将进程的 nice 值提高到的上限。 nice 值的实际上限计算为 20 - rlim_cur。 因此,该限制的有用范围是从 1(对应于nice值 19)到 40(对应于nice值 -20)。 这种不寻常的范围选择是必要的,因为负数通常具有特殊含义,因此不能指定为资源限制值。 例如,RLIM_INFINITY 通常与 -1 相同。 有关 Nice 值的更多详细信息,请参阅 sched(7)。

(9) RLIMIT_NOFILE

这指定一个比该进程可以打开的最大文件描述符数大一的值。 尝试(open(2)、pipe(2)、dup(2) 等)超过此限制会产生错误 EMFILE。
从 Linux 4.5 开始,此限制还定义了非特权进程(没有 CAP_SYS_RESOURCE 功能的进程)可以通过 UNIX 域套接字传递到其他进程的文件描述符的最大数量。 此限制适用于 sendmsg(2) 系统调用。 有关更多详细信息,请参阅 unix(7)。

(10) RLIMIT_NPROC

这是对调用进程的真实用户 ID 的现有进程(或者更准确地说,在 Linux 上,线程)数量的限制。 只要属于该进程的真实用户 ID 的当前进程数大于或等于此限制,fork(2) 就会失败并出现错误 EAGAIN。
对于具有 CAP_SYS_ADMIN 或 CAP_SYS_RESOURCE 功能的进程,不强制执行 RLIMIT_NPROC 限制。

(11) RLIMIT_RTPRIO

这指定了可以使用 sched_setscheduler(2) 和 sched_setparam(2) 为此进程设置的实时优先级的上限。

(12) RLIMIT_RTTIME

这是对在实时调度策略下调度的进程在不进行阻塞系统调用的情况下可能消耗的 CPU 时间量的限制(以微秒为单位)。 出于此限制的目的,每次进程进行阻塞系统调用时,其消耗的 CPU 时间计数都会重置为零。 如果进程继续尝试使用 CPU 但被抢占、其时间片到期或调用 sched_yield(2),则 CPU 时间计数不会重置。

达到软限制后,会向进程发送 SIGXCPU 信号。 如果进程捕获或忽略该信号并继续消耗CPU时间,那么 SIGXCPU 将每秒生成一次,直到达到硬限制,此时向进程发送 SIGKILL 信号。

此限制的预期用途是阻止失控的实时进程锁定系统。

有关实时调度策略的更多详细信息,请参阅 sched(7)

(13) RLIMIT_SIGPENDING

这是对可以为调用进程的真实用户 ID 排队的信号数量的限制。 为了检查此限制,标准信号和实时信号都会被计数。 但是,该限制仅针对 sigqueue(3) 强制执行; 始终可以使用kill(2) 对尚未排队到进程的任何信号的一个实例进行排队。

(14) RLIMIT_STACK

这是进程堆栈的最大大小(以字节为单位)。 达到此限制后,会生成 SIGSEGV 信号。 要处理此信号,进程必须使用备用信号堆栈 (sigaltstack(2))。
此限制还决定了进程的命令行参数和环境变量使用的空间量; 有关详细信息,请参阅 execve(2)。


2. prlimit()

Linux 特定的 prlimit() 系统调用组合并扩展了 setrlimit() 和 getrlimit() 的功能。 它可用于设置和获取任意进程的资源限制。

资源参数与 setrlimit() 和 getrlimit() 具有相同的含义。

如果 new_limit 参数不为 NULL,则它指向的 rlimit 结构用于为资源的软限制和硬限制设置新值。 如果 old_limit 参数不为 NULL,则成功调用 prlimit() 会将先前的资源软限制和硬限制放置在 old_limit 指向的 rlimit 结构中。

pid 参数指定调用要操作的进程的 ID。 如果 pid 为 0,则用于调用进程。 要设置或获取除自身以外的进程的资源,调用者必须在要更改资源限制的进程的用户命名空间中具有 CAP_SYS_RESOURCE 能力,或者目标进程的真实、有效和保存的设置用户 ID 必须与调用者的真实用户ID相匹配,并且目标进程的真实、有效、保存的设置组ID必须与调用者的真实组ID相匹配。

成功返回0,失败返回-1和设置errno.


3. RLIM_INFINITY

如果读取和设置的rlimit中的值为 RLIM_INFINITY 宏,那么表示是无限制,unlimited。


4. 例子

#define _GNU_SOURCE
#define _FILE_OFFSET_BITS 64
#include <stdio.h>
#include <time.h>
#include <stdlib.h>
#include <unistd.h>
#include <sys/resource.h>

#define errExit(msg) do { perror(msg); exit(EXIT_FAILURE); } while (0)

int main(int argc, char *argv[])
{
    struct rlimit old, new;
    struct rlimit *newp;
    pid_t pid;

    if (!(argc == 2 || argc == 4)) {
        fprintf(stderr, "Usage: %s <pid> [<new-soft-limit> <new-hard-limit>]\n", argv[0]);
        exit(EXIT_FAILURE);
    }

    pid = atoi(argv[1]); /* PID of target process */

    newp = NULL;
    if (argc == 4) {
        new.rlim_cur = atoi(argv[2]);
        new.rlim_max = atoi(argv[3]);
        newp = &new;
    }

    /* Set CPU time limit of target process; retrieve and display
    previous limit */

    if (prlimit(pid, RLIMIT_CPU, newp, &old) == -1)
        errExit("prlimit-1");
    printf("Previous limits: soft=%lld; hard=%lld\n", (long long) old.rlim_cur, (long long) old.rlim_max);

    /* Retrieve and display new CPU time limit */

    if (prlimit(pid, RLIMIT_CPU, NULL, &old) == -1)
        errExit("prlimit-2");
    printf("New limits: soft=%lld; hard=%lld\n", (long long) old.rlim_cur, (long long) old.rlim_max);

    exit(EXIT_SUCCESS);
}

 

四、补充

1. prlimit 命令和ulimit命令类似

$ prlimit
RESOURCE   DESCRIPTION                             SOFT      HARD UNITS
AS         address space limit                unlimited unlimited bytes
CORE       max core file size                         0 unlimited bytes
CPU        CPU time                           unlimited unlimited seconds
DATA       max data size                      unlimited unlimited bytes
FSIZE      max file size                      unlimited unlimited bytes
LOCKS      max number of file locks held      unlimited unlimited locks
MEMLOCK    max locked-in-memory address space  67108864  67108864 bytes
MSGQUEUE   max bytes in POSIX mqueues            819200    819200 bytes
NICE       max nice prio allowed to raise             0         0 
NOFILE     max number of open files                1024   1048576 files
NPROC      max number of processes               256521    256521 processes
RSS        max resident set size              unlimited unlimited bytes
RTPRIO     max real-time priority                     0         0 
RTTIME     timeout for real-time tasks        unlimited unlimited microsecs
SIGPENDING max number of pending signals         256521    256521 signals
STACK      max stack size                       8388608 unlimited bytes

 

 


参考:
man getrlimit

 

posted on 2024-03-06 10:42  Hello-World3  阅读(214)  评论(0编辑  收藏  举报

导航