[13]APUE:KQUEUE / FreeBSD

[a] 概述

  • kqueue API 由两个函数(kqueue、kevent)、一个辅助宏(EV_SET)、一个结构体(struct kevent)构成,可以应用于 socket、FIFO、pipe、aio、signal、process、regular file、path 等对象
  • 与 Linux 下的 epoll 功能类似,性能相当

[b] kqueue / kevent / EV_SET

#include <sys/types.h>
#include <sys/event.h>
#include <sys/time.h>
int kqueue(void) 
//成功返回 kqueue 标识符,供 kevent 函数首个参数使用,出错返回 -1 int kevent(int kq, const struct kevent *changelist, int nchange, struct kevent *eventlist, int nevent, const struct timespec *timeout)
//成功返回 eventlist 数组的元素个数,出错信息写入 struct kevent 中的 flag 字段,不能写入的出错信息返回 -1,若 timeout 超时,则返回 0 EV_SET(kev, ident, filter, flags, fflags, data, udata)
//kev 是指向 struct kevent 的指针,其余字段依次对应于 struct kevent 中的字段 
struct kevent {
    uintptr_t    ident; //event 标识符,根据 filter 的不同可以为 fd、pid 等
    short    filter; //监听类别(目标),如 socket、process 等
    u_short    flags; //通用标志,可用于保存返回信息
    u_int    fflags; //特定 filter 的专有标志,可用于保存专有返回信息
    intptr_t    data; //特定 filter 存储专有信息
    void    *udata; //进程预定义内容,常作识别用途,kqueue 不更改此项,原样返回其内容
  • kqueue 函数用于初始化一个 kqueue 队列,单个进程可以建立多个 kqueue,kqueue 描述符与文件描述符类似,也可以复用,不能被 fork 出的子进程继承
  • kevent 用于设置策略及如何获取结果,其中:
    • changelist 用于添加或修改 event
    • eventlist 用于向调用进程返回 event 结果,若实际产生的事件数量超过了 nevent,可通过多次调用获取全部结果;若 nevent 为 0,则即使指定了 timeout 也会立即返回,不阻塞
    • changelist 与 eventlist 可以指向同一个 kevent 结构体数组;nchange 与 nevent 分别代表两个结构体数组的元素数量上限
    • 如果 timeout 参数为 NULL,则 kevent 函数将阻塞,直到有事件发生,若不为 NULL,阻塞到超时为止(<24h),若 timespec 结构体各字段均设置为 0,则立即返回当前尚未处理的所有事件
  • EV_SET 仅是预定义的一个用于设置 struct kevent 的辅助宏,与手动指定结构体的各字段效果相同

[c] filter 及专有规则

  • /usr/include/sys/event.h 中定义的 10 种 filter
  • #define EVFILT_READ             (-1)
    #define EVFILT_WRITE            (-2)
    #define EVFILT_AIO              (-3)    /* attached to aio requests */
    #define EVFILT_VNODE            (-4)    /* attached to vnodes */
    #define EVFILT_PROC             (-5)    /* attached to struct proc */
    #define EVFILT_SIGNAL           (-6)    /* attached to struct proc */
    #define EVFILT_TIMER            (-7)    /* timers */
    #define EVFILT_PROCDESC         (-8)    /* attached to process descriptors */
    #define EVFILT_FS               (-9)    /* filesystem events */
    #define EVFILT_LIO              (-10)   /* attached to lio requests */
  • EVFILT_READ:用于检测数据何时可读,不同的描述符将返回不同的信息
    • 若 ident 字段指定为一个文件描述符,则该事件表示文件偏移量尚未到达文件末尾,当前基于 SEEK_END 的 offset 值保存在 data 成员字段中
    • 若为 pipe 或 FIFO 则表示已有实际数据可读,data 字段存储可读的字节数量
  • EVFILT_WRITE:用于检测是否可以对描述符执行写操作;对 pipe、FIFO 或 socket,data 字段代表缓冲区中可用的空间(bytes),此 filter 对文件或目录没有意义(vnodes)
  • EVFILT_AIO:用于异步 I/O 操作,用于检测和 aio_error 系统调用类似的条件
  • EVFILT_VNODE:用于检测文件系统上某个文件的各种变动事件,ident 须指定一个有效的文件描述符,fflags 字段设定检测的事件类别(如下)
    • #define NOTE_DELETE     0x0001                  /* vnode was removed */
      #define NOTE_WRITE      0x0002                  /* data contents changed, a write occurred on the file */
      #define NOTE_EXTEND     0x0004                  /* size increased */
      #define NOTE_ATTRIB     0x0008                  /* attributes changed */
      #define NOTE_LINK       0x0010                  /* link count changed */
      #define NOTE_RENAME     0x0020                  /* vnode was renamed */
      #define NOTE_REVOKE     0x0040                  /* vnode access was revoked */
      #define NOTE_OPEN       0x0080                  /* vnode was opened */
      #define NOTE_CLOSE      0x0100                  /* file closed, fd did not allowed write */
      #define NOTE_READ       0x0400                  /* file was read */
  • EVFILT_PROC:用于检测发生在另一个进程里的事件,此时 ident 字段须指定进程 ID,fflags 字段设定检测的事件类别(如下)
    • #define NOTE_EXIT       0x80000000              /* process exited, exit status will be stored in 'data' */
      #define NOTE_FORK       0x40000000              /* process forked */
      #define NOTE_EXEC       0x20000000              /* process exec'd */
      #define NOTE_TRACK      0x00000001              /* follow across forks */
      #define NOTE_TRACKERR   0x00000002              /* could not track child */
      #define NOTE_CHILD      0x00000004              /* am a child process */
  • EVFILT_SIGNAL:检测是否有信号发送至 ident 所指定的进程 ID
    • 事件将在进行完常规的信号处理之后,放到 kqueue 中,data 字段存储收到的信号数量,包括被设置了 SIG_IGN 的信号(SIG_CHLD 除外,此信号若被忽略则不计数)
    • 此 filter 默认带有 EV_CLEAR 标志

[d] 通用标志:flags

  • /usr/include/sys/event.h 定义的通用 flags,按位 OR 进行组合
    • /* actions */
      #define EV_ADD          0x0001          /* add event to kq (implies enable) */
      #define EV_DELETE       0x0002          /* delete event from kq */
      #define EV_ENABLE       0x0004          /* enable event */
      #define EV_DISABLE      0x0008          /* disable event (not reported) */
      #define EV_FORCEONESHOT 0x0100          /* enable _ONESHOT and force trigger */
      
      /* flags */
      #define EV_ONESHOT      0x0010          /* only report one occurrence */
      #define EV_CLEAR        0x0020          /* clear event state after reporting */
      #define EV_RECEIPT      0x0040          /* force EV_ERROR on success, data=0 */
      #define EV_DISPATCH     0x0080          /* disable event after once reporting */
      
      #define EV_SYSFLAGS     0xF000          /* reserved by system */
      #define EV_DROP         0x1000          /* note should be dropped */
      #define EV_FLAG1        0x2000          /* filter-specific flag */
      #define EV_FLAG2        0x4000          /* filter-specific flag */
      
      /* returned values */
      #define EV_EOF          0x8000          /* EOF detected */
      #define EV_ERROR        0x4000          /* error, data contains errno */
  • EV_ADD:添加事件,默认附带 EV_ENABLE 行为,相同事件重复添加会导致旧的事件被覆盖
  • EV_DELETE:从 kqueue 中清除指定项(filter)
  • EV_DISABLE:禁止 kqueue 返回某个事件的信息,但并不删除
  • EV_ONESHOT:针对同一对象的同类事件仅返回一次
  • EV_CLEAR:返回事件后清空现有状态,用途是监测每次状态的改变,而非当前的状态;对可写、可读这种有持续存在的事件状态往往需要设置,对一次性状态,如信号计数,则不需要

[e] 样例 

#include <sys/types.h>
#include "sys/event.h"
#include <sys/time.h>
#include <fcntl.h>
#include <unistd.h>
#include <signal.h>
#include <stdio.h>
#include <stdlib.h>

char *t0 = "/tmp/test_0";
char *t1 = "/tmp/test_1";

void unlinktmp(int signo)
{
        unlink(t0);
        unlink(t1);
        printf("%s, %s deleted! \n", t0, t1);
        exit(0);
}

int main(void)
{
        struct kevent event[2];
        struct kevent tevent[2];
        int kq, ret;
        unsigned long fd_0, fd_1;
        
        struct sigaction act;
        act.sa_handler=unlinktmp;
        sigemptyset(&act.sa_mask);
        act.sa_flags=0;

        sigaction(SIGINT, &act, NULL);

        fd_0 = open(t0, O_WRONLY|O_CREAT|O_TRUNC, 0600);
        fd_1 = open(t1, O_WRONLY|O_CREAT|O_TRUNC, 0600);

        kq = kqueue();
        if (kq == -1)
        {
                perror("kqueue()");
        }

        EV_SET(&event[0], fd_0, EVFILT_VNODE, EV_ADD|EV_CLEAR, NOTE_LINK|NOTE_EXTEND, 0, NULL);
        EV_SET(&event[1], fd_1, EVFILT_VNODE, EV_ADD|EV_CLEAR, NOTE_LINK|NOTE_EXTEND, 0, NULL);

        kevent(kq, event, 2, NULL, 0, NULL);

        while(1) 
        {
                ret = kevent(kq, NULL, 0, tevent, 2, NULL);
                if (ret < 0) 
                {
                        perror("kevent");
                }
                else
                {
                        for(int i = 0; i < ret; ++i)
                        {
                                if (tevent[i].fflags & NOTE_LINK)
                                {
                                        printf("%s: link num changed! \n", tevent[i].ident == fd_0 ? t0 : t1);
                                }
                                else if (tevent[i].fflags & NOTE_EXTEND)
                                {
                                        printf("%s: extanded! \n", tevent[i].ident == fd_0 ? t0 : t1);
                                }
                                else
                                {
                                        printf("%s: nothing happened!\n", tevent[i].ident == fd_0 ? t0 : t1);
                                }
                        }
                }
        }
}
posted @ 2014-12-19 07:44  范辉  阅读(990)  评论(0编辑  收藏  举报