Linux内核分析——第五章 系统调用
第五章 系统调用
5.1 与内核通信
1、系统调用在用户空间进程和硬件设备之间添加了一个中间层,该层主要作用有三个:
(1)为用户空间提供了一种硬件的抽象接口
(2)系统调用保证了系统的稳定和安全
(3)每个进程都运行在虚拟系统中,而在用户空间和系统的其余部分提供这样一层公共接口。
2、在Linux中,系统调用是用户空间访问内核的唯一手段:除异常和陷入外,它们是内核唯一的合法入口。
5.2 API、POSIX和C库
1、一般情况下,应用程序通过在用户空间实现的应用编程接口(API)而不是直接通过系统调用来编程。
2、一个API定义了一组应用程序使用的编程接口。
3、API、POSIX、C库以及系统调用之间的关系:
4、在Unix世界中,最流行的应用编程接口是基于POSIX标准的。
5、Linux的系统调用作为C库的一部分提供。
6、C库实现了Unix系统的主要API,包括标准C库函数和系统调用接口。
5.3 系统调用
一、系统调用
1、要访问系统调用(syscall),通常通过C库中定义的函数调用来进行。
2、系统调用通过一个long类型的返回值来表示成功或者错误。通常,但也不绝对,用一个负的返回值来表明错误。返回一个0值通常表明成功。系统调用在出现错误的时候C库会把错误码写入errno全局变量,通过调用perror()库函数,可以把该变量翻译成用户可以理解的错误字符串。
3、系统调用在用户空间和内核空间有不同的返回值类型,在用户空间为int,在内核空间为long。
二、系统调用号
1、当用户空间的进程执行一个系统调用时,就用系统调用号指明到底执行哪个系统调用。进程不会提及系统调用的名称。
2、系统调用号独一无二,一旦分配就不能再有任何变更。否则编译好的应用程序就会崩溃。
3、Linux有一个“未实现”系统调用sys_ni_syscall(),它除了返回-ENOSYS外不做任何其他工作,这个错误号就是专门针对无效的系统调用而设的。
4、内核记录了系统调用表中的所有已注册过的系统调用的列表,存储在sys_call_table中。
三、系统调用的性能
1、Linux系统调用比其他许多操作系统执行得要快。
2、原因:
(1)上下文切换时间短。
(2)系统调用处理程序和每个系统调用本身也都非常简洁。
5.4 系统调用处理程序
一、系统调用处理程序
1、通知内核的机制是软中断实现的:通过引发一个异常来促使系统切换到内核态去指向异常处理程序,而此时的异常处理程序就是系统调用的处理程序。
2、在x86系统上预定义的软中断是中断号128,通过int $0x80指令触发该中断。
二、指定恰当的系统调用
1、在x86上,系统调用号是通过eax寄存器传递给内核的。
2、system_call()函数通过将给定的系统调用号与NR_syscalls作比较来检查其有效性。大于等于返回-ENOSYS,否则执行相应系统调用:call *sys_call_table(,%rax,8)
三、参数传递
1、在x86—32系统上,ebx,ecx,edx,esi和edi按顺序存放前五个参数。需要6个及以上参数,应用一个单独的寄存器存放指向这些参数在用户空间地址的指针。
2、给用户空间的返回值也通过寄存器传递。在x86系统上,它存放在eax寄存器中。
5.5 系统调用的实现
一、实现系统调用
1、实现一个新的系统调用的第一步是决定它的用途。在Linux中不提倡采用多用途的系统调用。
2、系统调用的接口应该力求简洁。
3、系统调用设计得越通用越好。
4、提供机制而不是策略。
5、时刻注意可移植性和健壮性。
二、参数验证
1、最重要的检查:检查用户提供的指针是否有效。
2、在接受一个用户空间的指针之前,内核必须保证:
(1)指针指向的内存区域必须属于用户空间。
(2)指针指向的内存区域在进程的地址空间里。
(3)决不能绕过内存访问限制。
3、两个方法检查在内核空间与用户空间之间数据的来回拷贝:
(1)向用户空间写入数据,内核提供了copy_to_user();
(2)从用户空间读取数据,内核提供了copy_from_user()。
如果成功:返回0;
如果失败:返回标准-EFAULT
4、copy_to_user()和copy_from_user()都有可能引起阻塞。当包含用户数据的页被换出到硬盘上而不是在物理内存上的时候,会引起阻塞,此时,进程就会休眠,直到缺页处理程序将该页从硬盘重新换回物理内存。
5、检查针对是否有合法权限——capable():返回0无权操作,返回非0有权操作。
5.6 系统调用上下文
一、系统调用上下文
1、内核在执行系统调用时处于进程上下文。current指针指向当前任务,即引发系统调用的那个进程。
2、在进程上下文中,内核可以休眠并且可以被抢占。
3、当系统调用返回时,控制权仍然在system_call()中,它最终会负责切换到用户空间,并让用户进程继续执行下去。
二、绑定一个系统调用的最后步骤
1、在系统调用表的最后加入一个表项。
2、对于所支持的各种体系结构,系统调用号都必须定义于<asm/unistd.h>中。
3、系统调用必须被编译进内核映像(不能被编译成模块)。放入kernel/下的一个相关文件中即可。
三、从用户空间访问系统调用
1、系统调用靠C库支持,用户程序通过包含标准头文件并和C库链接,就可以使用系统调用。
2、Linux本身提供了一组宏,用于直接对系统调用进行访问。它会设置好寄存器并调用陷入指令。这些宏是_syscalln(),其中n的范围从0到6,代表需要传递给系统调用的参数个数。
四、为什么不通过系统调用的方式实现
1、建立一个新的系统调用的好处:
(1)系统调用创建容易且使用方便。
(2)linux系统调用的高性能显而易见。
2、问题是:
(1)你需要一个系统调用号,而这需要一个内核在处于开发版本的时候由官方分配给你。
(2)系统调用被加入稳定内核后就被固化了,为了避免应用程序的崩溃,它的接口不允许做运动。
(3)需要将系统调用分别注册到每个需要支持的体系结构中去。
(4)在脚本中不容易调用系统调用,也不能从文件系统直接访问系统调用。
(5)如果仅仅进行简单的信息交换,系统调用就大材小用了。
3、替代方法:
实现一个设备节点,并对此实现read()和write()。使用ioctl()对特定的设置进行操作或者对特定的信息进行检索。
(1)像信号量这样的某些接口,可以用文件描述符来表示,因此也就可以按上述方式对其进行操作。
(2)把增加的信息作为一个文件放在sysfs的合适位置。
4、Linux系统尽量避免每出现一种新的抽象就简单地加入一个新的系统调用。
总结
系统调用(System Call)是操作系统为在用户态运行的进程与硬件设备(如CPU、磁盘、打印机等)进行交互提供的一组接口。当用户进程需要发生系统调用时,CPU 通过软中断切换到内核态开始执行内核系统调用函数。
一般情况下,应用程序通过在用户空间实现的应用编程接口(API)而不是直接通过系统调用来编程。一个API定义了一组应用程序使用的编程接口。
参考资料
《Linux内核设计与实现》 原书第3版