linux内核分析 第六周读书笔记
第三章 进程管理
3.1 进程
进程:处于执行期的程序
线程是在进程活动中的对象;内核调度的对象是线程而不是进程,在Linux系统中,并不区分线程和进程
在现代操作系统中, 进程提供两种虚拟机制:虚拟内存器和虚拟内存。
进程在创建它的时刻开始存活,这通常是调用fork系统的结果。该系统调用通过复制一个现有进程来创建一个全新的进程。fork系统调用从内核返回两次,一次到父进程,另一次回到新产生的子进程。
通常,创建新的进程都是为了立即执行新的不同的程序,而接着调用exec()这组函数就可以创建新的地址空间,并把新的程序载入其中,在现代Linux内核中,fork()实际上是由clone()系统调用实现的。
最终程序通过exit()系统调用退出执行,这个函数会终结进程并将其占用的资源释放掉。
3.2 进程描述符及任务结构
进程描述符:进程列表存放在任务队列(task list)这一双向链表中,链表的项是task_struct即进程描述符的结构。该类型定义在<linux/sched.h>中。进程描述符包含的数据能完整地描述一个正在执行的程序:
- 它打开的文件
- 进程的地址空间
- 挂起的信号
- 进程的状态
- 其他更多信息
3.2.1 分配进程描述符
Linux通过slab分配task_ struct结构,以达到对象复用以及和缓存着色的目的,避免资源动态分配和释放带来的资源消耗。
每个任务的thread_info结构在它的内核栈的尾端分配,结构中task域中存放的是指向该任务实际task_struct的指针。
3.2.2 进程描述符的存放
内核通过唯一的进程标志值火PID来标识每个进程,PID默认最大值是32768,需要的时候可以通过修改/proc/sys/kernel/pid_max来提高上限
内核中的大部分处理处理进程的代码都是通过task_ struct进行的;因此,需要通过current宏查找到当前正在运行进程的进程描述符
X86系统中,current把栈指针的后13个有效位屏蔽掉,用来计算出thread_ info的偏移
3.2.3 进程状态
进程在任何时刻,都必定处于五种状态中的一种
- TASK_RUNNING 运行——进程是可执行的
- TASK_INTERRUPT 可中断——进程正在睡眠
- TASK_UNINTERRUPT 不可中断
- TASK_TRACED 被其他进程跟踪的进程
- TASK_STOPPED 进程停止运行
3.2.4 设置当前进程状态
调用set_ task_ state(task,state)函数将进程设置为指定状态
3.2.5 进程上下文
可执行程序代码是进程的重要组成部分,这些代码从一个可执行文件载入到进程的地址空间执行。
3.2.6 进程家族树
所有进程都是PID为1的init进程的后代。
拥有同一个父进程的所有进程称为兄弟,进程间的关系存放在进程描述符中,每个task_struct都包含有一个指向其父进程的指针,还有一个子进程链表,对于当前进程,可以通过下面的代码获得父进程的进程描述符:
struct task_struct *my_parent = current->parent;
对于给定的进程,获取链表中下一个进程:
list_ entry(task->tasks.prev,struct task_struct,tasks)
3.3 进程创建
Unix系统的进程创建方式:
fork()通过拷贝当前进程创建一个子进程
exec()负责读取可执行文件并将其载入地址空间开始运行
3.3.1 写时拷贝
Linux的fork()使用写时拷贝推迟甚至免除拷贝。内核在创建新进程的时候并不复制整个地址空间,而是让父进程和子进程共享同一个拷贝;直到子进程/父进程需要写入的时候才进行拷贝
fork的实际开销只是复制父进程的页表以及给子进程创建唯一的进程描述符
3.3.2 fork()
Linux通过clone系统调用实现fork
fork()、vfork()、_clone()库函数根据各自需要的参数标志去调用clone(),然后由clone去调用do_fork()
定义在<kernel/fork.c>中的do_ fork()完成创建中的大部分工作,它调用copy_process函数,然后让进程开始运行
copy_process()函数完成的工作:
3.3.3 vfork()
vfork()不拷贝父进程的页表项。子进程作为父进程的一个单独的线程在它的地址空间里运行,父进程被阻塞,直到子进程退出或执行exec()。
vfork()系统调用的实现是通过向clone()系统调用传递一个特殊标志来进行的:
3.4 线程在linux中的实现
线程机制提供了在同一程序内共享内存地址空间运行的一组线程,这些线程还可以共享打开的文件和其他资源,线程机制支持并发程序设计技术,在多处理器系统上,它也能保证真正的并行处理。
在Linux系统中,线程仅仅被视为一个与其他进程共享某些资源的进程。每个线程都有自己的task_struct。
3.4.1 创建线程
线程的创建与普通进程类似,只不过在调用clone()的时候需要传递一些参数标志来指明共享的资源
传递给clone()的参数标志决定了新创建进程的行为方式和父子进程之间共享的资源种类
3.4.2 内核线程
内核线程没有独立的地址空间,只在内核空间运行,不切换到用户空间去,可以被调度,也可以被抢占。
它只能通过其他内核线程创建;内核通过kthread内核进程衍生所有的内核线程
新创建的线程处于不可运行状态,直到wake_ up_process()明确地唤醒它
3.5 进程终结
do_exit()的工作:
3.5.1 删除进程描述符
该任务是和清理工作分开进行的,因为这样在进程终结之后系统仍然可以获得它的信息
通过release_task()实现进程描述符的删除
3.5.2 孤儿进程造成的进退维谷
父进程在进程之前退出,就会遗留下子进程,也就是孤儿进程
在当前的线程组内给孤儿进程寻找新的父进程,否则直接以init作为其父进程
3.6 小结
进程与线程,linux如何存放和表示进程,如何创建进程,父进程如何收集后代信息,进程如何结束。