Linux内核分析第五章读书笔记

第五章系统调用

在操作系统中，内核提供了用户进程与内核进行交互的一组接口，这些接口在应用程序和内核之间扮演了使者的角色，保证系统稳定可靠，避免应用程序肆意妄行。

5.1 与内核通信

系统调用在用户空间进程和硬件设备之间添加一个中间层，该层有三个作用：

为用户空间提供了一种硬件的抽象接口
系统调用保证了系统的稳定和安全，对需要进行的访问进行裁决
系统调用是用户空间访问内核的唯一手段，除异常和陷入外，它们是内核唯一的合法入口

5.2 API、POSIX和C库

应用程序通过在用户空间实现的应用编程接口（API）来编程

在UNIX中，最流行的应用编程接口是基于POSIX标准的，目标：提供一套大体基于Unix的可移植操作系统标准

Linux的系统调用作为C库的一部分，C库提供了POSIX的大部分API

程序员àAPI 内核à系统调用

Unix的系统调用抽象出了用于完成某种确定的目的函数，但函数怎么用并不在它的管辖范围，所谓“提供机制而不是策略”。（机制：需要提供什么功能；策略：怎样实现这些功能）

5.3 系统调用

访问系统调用通过C库中定义的函数调用来进行。

系统调用通过一个long型返回值表示成功或错误，通常（不绝对），一个负的返回值表示错误，0值表示成功。出现错误时C库会把错误码写入errno全局变量，通过调用perror（）库函数翻译成用户可以理解的错误字符串

下面举一个例子

SYSCALL_DEFINE0(getpid)
{
return task_tgit_vnr(current);//returns current->tgid
}

其中SYSCALL_DEFINE0是一个宏，由于后面写着0，所以它定义的是一个无参数的系统调用

展开：

asmlinkage long sys_getpid(void)

asmlinkage限定词，是一个编译指令，通知编译器仅从栈中提取该函数的参数，所有系统调用都需要这个限定词

为了保证32位和64位兼容，系统调用在用户空间和内核空间有不同的返回值类型，在用户空间为int，在内核空间为long

get_pid()在内核中被定义为sys_getpid()，这也是所有系统调用都要遵循的命名规则

5.3.1 系统调用号

系统调用号一旦分配就不能再变更，系统调用被删除也不允许回收利用

sys_ni_syscall()：“未实行”系统调用，唯一的工作是返回-ENOSYS，专门针对无效的系统调用，用了“填补空缺”

内核记录了系统调用表中所有已注册过的列表，存储于sys_call_table中，每个体系结构都明确的定义了这个表，在x86-64中，它定义于arch/i386/kernel/syscall_64.c文件中，为每一个有效的系统调用指定了唯一的系统调用号。

5.3.2 系统调用的性能

Linux系统调用比其他的快。

原因：Linux切换上下文时间很短，系统调用处理程序和每一个系统调用本身都很简洁。

5.4 系统调用处理程序

通知内核：通过引发一个异常来促使系统切换到内核态去执行异常处理程序，也就是系统调用处理程序，名为system_call,中断号128，通过int$0x80指令触发。

最近x86增加了sysenter指令，更快更专业。

5.4.1 指定恰当的系统调用

仅仅陷入内核不够，必须把系统调用号一并传给内核，x86中，通过eax寄存器传递

system_call将系统调用号与NR_syscalls，如果大于等于，返回-ENOSYS，否则，执行：

call *sys_call_table(,%rax,8)

5.4.2 参数传递

ebx、ecx、edx、esi、edi按顺序存放前五个参数，用一个单独的寄存器存放指向这些参数的用户空间地址的指针

返回值存放在eax寄存器

5.5 系统调用的实现

5.5.1 实现系统调用

第一步：决定它的用途

接口要简洁，参数尽量少，越通用越好。

很多系统调用提供了标志参数以确保向前兼容，目的：即使增加新的功能和选项，也不破坏向后兼容或不需要增加新的系统调用

注意：可移植性、健壮性、为将来做打算

5.5.2 参数验证

检查参数是否合法，最重要的是检查用户提供的指针是否有效

内核必须保证：

1.指针指向的内存区域属于用户空间，进程决不能哄骗内核去读内核空间的数据

2.指针指向的内存区域在进程的地址空间里，进程决不能哄骗内核去读其他程序的数据

3.进程决不能绕过内存访问限制（可读、可写、可执行）

内核无论何时都不能轻率接受来自用户空间的指针

copy_to_user()：向用户空间写入数据

copy_from_user()：从用户空间读取数据

三个参数：进程空间中的目的内存地址，内核空间内的源地址，需要拷贝的数据长度

执行失败，返回数据字节数，成功返回0，错误返回标准-EFAULT

这两个函数都有可能引起阻塞

最后一项检查是否有合法权限，使用capable（）函数检查是否有权能对指定的资源进行操作，返回非0值，有权进行操作，返回0，无权操作

5.6 系统调用上下文

内核在执行系统调用时处于进程上下文，current指针指向当前任务，即引发系统调用的那个进程

在进程上下文中，内核可以休眠，可以被抢占。

可以休眠说明系统调用可以使用内核提供的绝大部分功能（中断处理程序不能休眠，操作受到了极大限制）

当前进程可以被其他进程抢占，必须保证该系统调用是可重入的

当系统调用返回时，控制权扔在system_call()中，它最终负责切换到用户空间

5.6.1 绑定一个系统调用的最后步骤

以系统调用foo（）为例

1.在系统调用表的最后加入一个表项，从0开始算起，系统调用在该表的位置就是它的系统调用号

打开entry.s文件中的系统调用表，在表尾加入：

.long sys_foo     /* 338 */

对于每种需要支持的体系结构，都必须将自己的系统调用加入到其系统调用表中，每种体系结构不需要对于相同的系统调用号

系统调用号是专属于体系结构ABI（应用程序二进制接口）的部分。

2.系统调用号必须定义于<asm/unistd.h>中

在列表中加入：

#define __NR_foo            338

3.系统调用必须被编译进内核映像（不能编译成模块），把它放进kernel下得一个相关文件

将其放进kernel/sys.c：

#include <asm/page.h>
asmlinkage long sys_foo(void)
{
       return THREAD_size;
}

5.6.2 从用户空间访问系统调用

系统调用靠C库支持，用户程序通过包含标准头文件并和C库链接，就可以使用系统调用

_syscalln():Linux本身提供的一组宏，用于直接对系统调用进行访问，它会设置好寄存器并调用陷入指令，n的范围从0到6，代表参数个数

举个例子：

long open(const char *filename, int flags, int mode)

宏的形式：

#define NR_open      5
_syscall3(long,open,const char*,filename,int,flags,int,mode)

每个宏都有2+2*n个参数，第一个参数对应系统调用的返回值类型，第二个参数对应着系统调用的名称

该宏会被扩展成内嵌汇编的C函数，将系统调用号和参数压入寄存器并触发软中断来陷入内核

5.6.3 为什么不通过系统调用的方式实现

建立一个系统调用的好处：

1.系统调用创建容易使用方便

2.Linux系统调用性能高

但是有好多好多问题

替代方法：

实现一个设备节点，并对此实现read（）和write（），使用ioctl（）对特定的设置进行操作，或对特定的信息进行检索

1.信号量之类的接口，可以用文件描述符表示

2.把增加的信息作为文件放在sysfs的合适位置

Linux尽量避免每出现一个新的抽象就简单的加入一个新的系统调用，这体现了Linux是一个相对较为稳定并且功能以及比较完善的操作系统。