3.进程

  1. 进程:程序执行的一个实例,充分描述程序已经执行到何种程度的数据结构的集合.目的:担当资源分配的实体.每个线程是进程的一个执行流,可以由内核独立调度.
  2. 标示一个进程
    1. 进程和进程描述符一一对应.并且一个线程组公用一个PID.
    2. 进程描述符处理: Linux吧内核态的进程堆栈和紧挨进程描述符的小数据结构thread_info,紧凑地存放在一个单独为进程分配的存储区内.其Size=8K.即两个页框.且为了效率,第一个页框的起始地址=2(13)倍.
    3. 其中,thread_info的size=52B.位于存储区的开始处.堆栈起始于末端,并朝内存区开始的方向增长.用户态刚切换到内核态时,栈为空.esp寄存器指向栈顶.
    4. 标示当前进程: 因为Size =8K=2(13).所以屏蔽掉esp的低13位即可获得thread_info结构的基地址.但是经常使用的是进程描述符的地址,用current宏来代表.
    5. 双向链表: 不在链表中包含数据,而是在数据结构中包含链表节点.
    6. 当内核寻找一个新进程在CPU上运行时,必须只考虑处于Task_Running的进程.为了增加速度,为每一种进程优先级建立一个不同的进程链表.
  3. 进程间的关系
    1. 进程0和1由内核创建,1(init)是所有进程的祖先.
    2. 为了从进程的PID导出对应的进程描述符指针,建立散列表.又因为进程描述符包含了表示不同类型PID的字段,所以需要4种散列表.然后利用链表来处理冲突的PID.其表项是由冲突的进程描述符组成的双向链表.并且在进程数目远小于允许PID的最大数时,节省了空间.
  4. 如何组织进程
    1. 没有为暂停,僵死,死亡状态的进程创建专门的链表,因其访问比较简单.
    2. 等待队列: 表示一组睡眠的进程,当某一条件为真时,由内核唤醒他们.其列头含有一个Lock自旋锁.其链表元素含有指向进程描述符的指针,等待的时间,和Flags字段(=1,当多个进程等待相同资源时内核有选择地唤醒,=0为非互斥进程,总是唤醒).
    3. 进程的资源限制:限制(rlim)指定了进程能使用的系统资源数量.
  5. 进程切换
    1. 硬件上下文:每个进程用于自己的地址空间,但所有进程都共享CPU寄存器. 进程恢复执行前必须装入寄存器的一组数据称为硬件上下文.其是进程可执行上下文的一个子集.其一部分存放在TSS段,剩余的存放在内核态堆栈中.由于切换经常发生,所以减少保存和装入硬件上下文所花费的时间是很重要的.
    2. 以前的Linux版本使用硬件支持,并通过far jmp指令跳到next进程TSS描述符的选择符来执行进程切换.但基于以下理由,现有版本使用软件执行切换:
      1. 通过一组mov指令逐步执行切换,这样能控制所装入数据的合法性,并使检查ds和es寄存器的值成为可能.
      2. 新旧方法的时间消耗大致相同.
    3. 进程切换只发生于内核态.切换之前,用户态进程所使用的所有寄存器内容已保存在内核态堆栈上.
    4. 任务状态段:TSS.存放硬件上下文,Linux虽不使用硬件上下文切换,但为每一个CPU创建一个TSS.原因:
      1. CPU从用户态切换到内核态时,它就从TSS获取内核态堆栈的地址.
      2. 当用户态进程试图通过in/out指令访问I/O端口时,CPU通过访问TSS的I/O许可权位图来决定是否有访问权利.
    5. TSS反映了CPU上当前进程的特权级,而不必为没有运行的进程保留TSS.每个TSS都有一个TSSD描述符.存放在GDT中.但有tr寄存器存放TSSD的base和limit字段.所以CPU能够对TSSD直接寻址而非通过GDT.
    6. 执行进程切换: 分为两步:1)切换页全局目录以安装一个新的地址空间.2)切换内核态堆栈和硬件上下文.
    7. switch_to宏:3个参数:pre,next,last.首先,暂停A执行B,然后,内核激活A时,就必须暂停另一进程C(通常不是B).所以last为输出参数,表示把进程C的描述符地址写在内存的什么位置,该动作在A恢复执行后完成.
    8. 保存和加载FPU,MMX,XMM寄存器.
      1. FPU:已被集成到CPU内,如果进程使用了Escape指令,那么FPU就属于其硬件上下文,并且应被保存.
      2. MMX:家属多媒体APP的执行.其指令作用域FPU的浮点寄存器.缺点是不能把浮点指令与MMX指令混合使用,优点是能够忽略新指令,因为保存浮点单元的任务切换代码可以不修改地应用到保存MMX上.其在CPU内部引入了SIMD(单指令多数据)流水线.
      3. 之后,引入了SSE扩展,该扩展为处理包含在8个128位寄存器(XMM寄存器)的浮点值增加了功能.XMM寄存器不与FPU和MMX重叠.之后的SSE2支持高精度浮点值,并与SSE公用XMM寄存器.
      4. CPU并不在TSS中自动保存FPU,MMX,XMM寄存器.不过,硬件支持cr0寄存器中的一个TS标志,其遵循规则(1,每当执行硬件上下文切换时,设置TS; 2,每当TS标志被设置时执行ESCAPE,MMX,SSE或SSE2指令,控制单元产生一个"Device not available"异常.).TS标志使得内核只有在真正需要时才保存和恢复这些寄存器.只有当进程使用这些指令时,当发生上下文切换时,内核置TS标志并保存寄存器内容.
  6. 创建进程:
    1. 机制:1)写时复制允许父子进程读相同的物理页; 2)轻量级进程允许父子进程共享每进程在内核的很多数据结构; 3)vfork()创建的进程能共享其父进程的内存地址空间.
    2. 内核进程: 传统的Linux将一些重要任务委托给周期性执行的进程,但这样效率不高.而现在使用内核线程,其只运行在内核态.只能使用大于Page_Offset的线性地址空间.
    3. 以下为所有的内核线程:
      1. 进程0: idle进程.工作:初始化内核需要的数据结构,激活中断.创建进程1, ; 每个CPU一个进程0。
      2. 进程1: 一直存活到系统关闭.它创建和监控在OS外层执行的所有进程的活动.
      3. keventd:即事件,执行keventd_wq工作队列中的函数.
      4. kapmd:处理与高级电源管理(APM)相关的时间.
      5. kswapd:执行内存回收.
      6. pdflush:刷新脏缓冲区中的内容到磁盘以回收内存.
      7. kblockd:执行kblockd_workqueue工作队列中的函数,其实只是周期性地激活块设备驱动程序
      8. ksoftird:运行tasklet
  7. 撤销进程:
    1. 进程终止了它们本该执行的代码,此时必须通知内核以便内核释放其所拥有的资源(内存,打开文件,信号量等).可以终止一个线程,或者线程组.
    2. Unix允许查询内核以或得进程的子或父进程的PID或者执行状态.所以其不允许在进程一终止就丢弃包含在进程描述符字段中的数据.只有父进程发出了与被终止的进程相关的wait()类调用之后,才运行这样做.这就是引入僵死状态的原因:技术上进程已死,但是必须保存它的描述符,直到父进程得到通知.
    3. 如果父进程在子进程结束之前结束,系统会充满了僵死进程,并且他们的进程描述符永久占用RAM.所以,强迫所有的孤儿进程称为init进程的子进程来解决.init进程在用wait()类系统调用检查器合法的子进程终止时,就会撤销僵死的进程.

 

posted on 2011-10-12 14:08  RobynHYB  阅读(333)  评论(0编辑  收藏  举报

导航