《Linux内核设计与实现》读书笔记——第五章

《Linux内核设计与实现》读书笔记——第五章

标签(空格分隔): 20135321余佳源


第五章 系统调用

操作系统中,内核提供了用户进程与内核进行交互的一组接口。这些接口让应用程序受限的访问硬件设备,提供了新进程与已有进程进行通信的机制,也提供了申请操作系统其他资源的能力。提供接口主要是为了保证系统稳定可靠,避免应用程序恣意妄行。

  • 使应用程序受限地访问硬件设备
  • 提供创建新进程与已有进程进行通信的机制
  • 提供申请操作系统其他资源的能力

知识点回顾:
系统调用:需要int 0x80模拟中断让硬件触发。同步、主动地进入系统空间。
硬中断:异步、被动地进入系统空间。CPU运行时发生错误则中断,中断后没有进程调度。
软中断:中断后还执行其他进程调度。
系统调用过程:切换执行路径&切换运行级别
系统调用表:定义于arch/i386/kernel/syscall_table.S ,映射系统调用号和与系统调用。
系统调用的过程:int 0x80 -> 中断向量表 ->系统调用表 JUMP(EAX*4+基地址)根据系统调用号找到对应的系统调用代码并执行。

一、与内核通信

系统调用在用户控件进程和硬件设备之间添加了一个中间层,作用如下:

·为用户空间提供了一种硬件的抽象接口
·系统调用保证了系统的稳定和安全
·每个进程都运行在虚拟系统中,而在用户控件和系统的其余部分提供这样一层公共接口

在Linux中,系统调用是用户控件访问内核的唯一手段;除异常和陷入外,他们是内核唯一的合法入口。

系统调用与API的不同在于运行级别的切换。

二、API、POSIX和C库

应用程序通过在用户空间实现的应用编程接口(API)而非直接通过系统调用来编程。

POSIX是应用编程接口的一个国际标准,C库提供了POSIX的绝大部分API。

在Unix世界中,最流行的应用编程接口是基于POSIX标准的。

关于Unix接口设计:提供机制而不是策略

POSIX、API、C库和系统调用之间的关系如下图:

三、系统调用

  • 系统调用也就是 --> syscall 通常通过C库中定义的函数调用来进行系统调用。返回值是long型变量,如果出错,C库会将错误代码写入errno全局变量。
  • 系统调用再出现错误的时候C库会把错误码写入errno全局变量。通过调用perror()库函数,可以把该变量翻译成用户可以理解的错误字符串。
  • SYSCALL_DEFINE0只是一个宏,它定义一个无参数的系统调用。
  • asmlinkage——这是一个编译指令,通知编译器仅从栈中提取该函数的参数。

所有的系统调用都需要这个限定词
其次函数返回long

  • 系统调用在用户空间和内核空间有不同的返回值类型,在用户空间为int在内核空间为long。

定义系统调用:要访问系统调用,通常通过C库定义的函数调用来进行

例:asmlinkage long sys_getpid(void)

  1. asmlingkage,这是一个编译指令,通知编译器仅从栈中提取该函数的参数。所有的系统调用都需要这个限定词。
  2. 返回值long。
    为了保证32位和64位系统的兼容,系统调用在用户空间返回值int,内核空间long
  3. 命名规则:sys_xxx

1.系统调用号

  1. 在Linux系统中每个系统调用被赋予一个系统调用号,当用户空间的进程执行一个系统调用时,系统调用号用来指明执行哪个系统调用
  2. 系统调用号一旦分配就不会再更改,被删除的系统调用号也不许再回收。
  3. sys _ ni _ syscall()专门针对无效的系统调用而设立的,只负责返回-ENOSYS
  4. 系统调用号被定义在arch/i386/kernel/syscall_64.c文件中

2.系统调用的性能——执行速度快

原因:

  • 很短的上下文切换时间
  • 系统调用处理程序和每个系统调用本身也十分简洁

四、系统调用处理程序

因为用户控件不能直接执行内核代码,需要切换内核态,它需要用某种方式告知内核,自己需要执行一个系统调用,请求切换到内核态,这个通知内核的机制是软中断

通过引发一个异常来促使系统切换到内核态去执行异常处理程序,此时的异常处理程序实际上即系统调用处理程序system_call(),中断号128,指令如下:
int 128
或者
int 0x80
退出是iret

它与硬件体系结构紧密相关

新指令sysenter,比int中断指令更快更专业。

1.指定恰当的系统调用

  1. 在x86上,系统调用号是通过eax寄存器传递给内核的。
  2. system_call()函数通过将给定的系统调用号与NR——syscall做比较来检查其有效性。
  3. 由于系统调用表中的表项是以64位类型存放的,内核需要将给定的系统调用号乘以4,然后用所得到的结果在该表中查询其位置。

2.参数调用

参数传递最简单的办法是像传递系统调用号一样,把这些参数也放在寄存器里。在X86-32系统上,ebx、ecx、edx、esi、edi按顺序存放前五个参数。需要六个或六个以上参数时应用一个单独的寄存器存放指向所有这些参数在用户空间地址的指针。

system_call()函数通过将给定的系统调用号与NR_syscalls作比较来检查其有效性。大于等于返回-ENOSYS,否则执行相应系统调用:

call *sys_call_table(,%rax,8)

过程:
int 0x80 → 中断向量表中找到对应中断向量 →系统调用表

JMP(EAX*4 + system_xxx),乘以4是因为系统调用表中的表象是以64位存放的。

五、系统调用的实现

1. 决定系统调用的用途

  • 明确新系统调用的参数、返回值和错误码,系统调用的接口力求简洁
  • 很多系统调用提供了标志参数以确保向前兼容。标志并不是用来让单个系统调用具有多个不同的行别行为,为了即使增加新的功能和选项,也不破坏向后兼容或不需要增加新的系统调用
  • 确保系统调用的可移植性和健壮性

2. 参数验证

  • 与文件I/O相关的系统调用必须检查文件描述符是否有效
  • 与进程相关的函数必须检查提供的PID是否有效
  • 最重要的一种检查就是检查用户提供的指针是否有效。内核必须保证:

指针指向的内存区域属于用户空间
指针指向的内存区域在进程的地址空间里,进程决不能绕过内存访问限制
进程不能绕过内存访问限制

  • 最后一项检查针对是否有合法权限

3. 系统调用上下文

  • 内核在执行系统调用的时候处于进程上下文
  • current指针指向当前任务,即引发系统调用的那个进程
  • 在进程上下文中,内核可以休眠并且可以被抢占
  • 当系统调用返回的时候,控制权仍在system_call()中,它最终会负责切换到用户空间,并让用户进程继续执行下去

4. 绑定系统调用

  • 首先在系统调用表的最后加入一个表项
  • 对于所支持的各种体系结构,系统调用号都必须定义于<asm/unistd.h>中(系统调用号是专属于体系结构ABI(应用程序二进制接口)的部分)
  • 系统调用必须被编译进内核映象(不能被编译成模块)。比如sys.c,它包含了各种各样的系统调用

5. 从用户空间访问系统调用

  • 用户程序通过包含标准头文件并和C库链接,就可以使用系统调用
  • 对于每个宏来说,都有2+2*n个参数

第一个参数对应着系统调用的返回值类型
第二个参数是系统调用的名称
在以后是按照系统调用参数的顺序排列的每个参数的类型和名称

六、系统调用上下文

内核在执行系统调用时处于进程上下文。
在进程上下文中,内核可以:
休眠说明系统调用可以使用内核提供的绝大部分功能
可以被抢占要求保证该系统调用是可重入的

1.绑定一个系统调用的最后步骤

1.在系统调用表的最后加入一个表项。
2.对于所支持的各种体系结构,系统调用号都必须定义于<asm/unistd.h>中
3.系统调用必须被编译进内核映像,不能被编译成模块。——放进kernel/下的一个相关文件中即可,例如sys.c。

2.从用户空间访问系统调用

Linux本身提供了一组宏,用于直接对系统调用进行访问。

_syscalln()     //n的范围从0到6,代表需要传递给系统调用的参数个数。

例如:

long open(const char *filename, int flags, int mode)=#define NR_open 5_syscall3(long, open,const char*, filename, int, flags, int, mode)
应用程序可以直接用open()了。

对于每个宏来说,都有(2+2xn)个参数:

1.系统调用的返回值类型
2.系统调用的名称
以后按照系统调用参数的顺序排列每个参数的类型和名称。

_NR_open在<asm/unistd.h>中定义。
这个宏会被扩展成为内嵌汇编的C函数。

3.为什么不通过系统调用的方式实现

建立一个新的系统调用的好处:

  • 系统调用创建容易且使用方便
  • Linux系统调用的高性能显而易见

问题是:

  • 你需要―个系统调用号,而这需要一个内核在处于开发版本的时候由官方分配给你
  • 系统调用被加入稳定内核后就被固化了,它的接口不允许做改动
  • 需要将系统调用分别注册到每个需要支持的体系结构中去
  • 在脚本中不容易调用系统调用,也不能从文件系统直接访问系统调用
  • 由于你需要系统调用号,因此在主内核树之外是很难维护和使用系统调用的

替代方法:
实现一个设备节点,并对此实现read()和write()。使用特定的信息进行检索。

  • 像信号量这样的某些接口,可以用文件描述符来表示,因此也就可以按上述方式对其进行操作
  • 把增加的信息作为一个文件放在sysfs的合适位置

七、总结

Linux尽量避免每出现一种新的抽象就简单地加入一个新的系统调用。

系统调用到底是什么?

  • 系统调用是操作系统为用户态进程与硬件设备进行交互提供的一组接口,让应用程序受限的访问硬件设备,提供了新进程与已有进程进行通信的机制,也提供了申请操作系统其他资源的能力。可以保证系统稳定可靠。

执行系统调用的连锁反应有?

  • 陷入内核
  • 传递系统调用号和参数
  • 执行正确的系统调用函数
  • 并把返回值带回用户空间。
posted @ 2016-03-23 22:13  20135321余佳源  阅读(233)  评论(0编辑  收藏  举报