第五章读书笔记——系统调用
第五章 系统调用
与内核通信
系统调用在用户空间进程和硬件设备之间添加了一个中间层,该层主要作用有三个:
- 为用户空间提供了一种硬件的抽象接口
- 系统调用保证了系统的稳定和安全,作为硬件设备和应用程序之间的中间人,内核可以基于权限、用户类型和其他一些规则对需要进行的访问进行裁决
- 每个进程都运行在虚拟系统中,而在用户空间和系统的其余部分提供这样一层公共接口
在Linux中,系统调用是用户空间访问,内核的唯一手段;除异常和陷入外,它们是内核唯一的合法入口。
API、POSIX和C库
一个API定义了一组应用程序使用的编程接口,它们可以实现成一个系统调用,也可以通过调用多个系统调用来实现,而完全不使用任何系统调用也不存在问题
实际上,API可以在各种不同的操作系统实现,给应用程序提供完全相同的接口
在Unix中,最流行的应用编程接口是基于POSIX标准的
关于Unix的接口设计有一句格言:提供机制而不是策略
系统调用
要访问系统调用,通常通过C库中定义的函数调用来进行。
系统调用最终具有一种明确的操作。
定义系统调用:
- 注意函数声明中的asmlinkage限定词,这是一个编译指令,所有的系统调用都需要这个限定词
- 函数返回long,在用户空间为int在内核空间为long
- 注意系统调用get_pid()中的在内核中被定义成sys_getpid()
系统调用号
在Linux中,每个系统调用被赋予一个系统调用号
系统调用号相当重要,一旦分配就不能再有任何变更,否则编译好的应用程序就会崩溃。此外,如果一个系统调用被删除,它所占用的系统调用号也不允许被回收利用,否则,以前编译过的代码会调用这个系统调用,但事实上却调用的是另一个系统调用。
内核记录了系统调用表中的所有已注册过的系统调用的列表,存储在sys_call_table中。
每一种体系结构中,都明确定义了这个表,在×86-64中,它定义于arch/i386/kernel/syscall_64.c文件中。这个表为每一个有效的系统调用指定了唯一的系统调用号。
系统调用的性能
Linux系统执行快的原因:
- 很短的上下文切换时间
- 系统调用处理程序和每个系统调用本身也十分简洁
系统调用处理程序
用户空间的程序无法执行内核代码
通知内核的机制是靠软中断实现的:
通过引发一个异常来促使系统切换到内核态去执行异常处理程序,此时的异常处理程序实际上就是系统调用处理程序,在x86系统上预定义的软中断是中断号128。通过int¥0x80指令触发该中断,这条指令会触发一个异常导致系统切换到内核态并执行第128号异常处理程序,而该程序正是系统调用处理程序,这个处理程序名字起得很贴切,叫system_call().它与硬件体系结构紧密相关
指定恰当的系统调用
必须把系统调用号一并传给内核。
在x86上,系统调用号是通过eax寄存器传递给内核的。
系统调用的实现
参数验证
系统调用必须仔细检查它们所有的参数是否合法有效
系统调用在内核空间执行,如果任由用户将不合法的输入传递给内核,那么系统的安全和稳定将面临极大的考验
最重要的一种检查就是检查用户提供的指针是否有效
在接收一个用户空间的指针之前,内核必须保证:
- 指针指向的内存区域属于用户空间,进程决不能哄骗内核去读内核空间的数据。
- 指针指向的内存区域在进程的地址空间里,进程决不能哄骗内核去读其他进程的数据。
- 如果是读,该内存应被标记为可读;如果是写,该内存应被标记为可写;如果是可执行,该内存被标记为可执行。进程绝不能绕过内存访问权限。
系统调用上下文
内核在执行系统调用的时候处于进程上下文
绑定一个系统调用的最后步骤:
- 在系统调用表的最后加入一个表项
- 对于所支持的各种体系结构,系统调用号都必须定义于<asm/unistd.h>中
- 系统调用必须被编译进内核映象(不能被编译成模块)
从用户空间访问系统调用
通常,系统调用靠C库支持
Linux本身提供了一组宏
建立一个新的系统调用的好处:
- 系统调用创建容易且使用方便
- Linux系统调用的高性能显而易见