第十二章 块设备I/O和缓冲区管理

第十二章 块设备I/O和缓冲区管理

摘要

  • 块设备 I/O 和缓冲区管理;
  • 块设备 I/O 的原理和 I/O 缓冲的优点;
  • Unix 的缓冲区管理算法;
  • 利用信号量设计了新的缓冲区管理算法提高 I/O 缓冲区的缓存效率和性能;
  • 简单的 PV 算法易于实现,缓存效果好,不存在死锁和饥饿问题;
  • 比较 Unix 缓冲区管理算法和 PV算法性能的编程方案。

块设备I/O缓冲区

  大多数文件系统使用I/O缓冲来减少进出储存设备的物理I/O数量。

  I/O缓冲的基本原理非常简单。文件系统使用一系列I/O缓冲区作为块设备的缓存内存。当进程试图读取(dev,blk)标识的磁盘块时,它首先在缓冲区缓存中搜索分配给磁盘块的缓冲区。如果该缓冲区存在并且包含有效数据,那么它只需从缓冲区中读取数据,而无须再次从磁盘中读取数据块。如果该缓冲区不存在,它会为磁盘块分配一个缓冲区,将数据从磁盘读人缓冲区,然后从缓冲区读取数据。

  当某个块被读入时、该缓冲区将被保存在缓冲区缓存中,以供任意进程对同一个块的下一次读/写请求使用。同样,当进程写入磁盘块时,它首先会获取一个分配给该块的缓冲区。然后,它将数据写入缓冲区,将缓冲区标记为脏,以延迟写入,并将其释放到缓冲区缓存中。由于脏缓冲区包含有效的数据,因此可以使用它来满足对同一块的后续读/写请求,而不会引起实际磁盘I/O。

  脏缓冲区只有在被重新分配到不同的块时才会写入磁盘。

物理块设备I/O:每个设备都有一个I/O队列,其中包含等待I/O操作的缓冲区。缓冲区上的start_io()如下

start_io(BUFFER *fp)
{
  enter bp into device I/O queue;
  if (bp is first buffer in I/O queue)
    issue I/O command for bp to device;
}

  当I/O操作完成后,设备中断处理程序会完成当前缓冲区上的I/O操作,并启动I/O队列中的下一个缓冲区I/O。设备中断处理程序的算法如下:

InterruptHandler()
{
  bp = dequeue(device I/O queue);
  (bp->opcode == ASYNC)? brelse(bp) : unblock process on bp;
  if (!empty(device I/O queue))
    issue I/O command for first bp in I/O queue;
}

Unix I/O缓冲区管理算法

  I/O缓冲区:内核中的一系列NBUF 缓冲区用作缓冲区缓存。每个缓冲区用一个结构体表示。

typdef struct buf[
struct buf*next__free;// freelist pointer
struct buf *next__dev;// dev_list pointer int dev.,blk;
// assigmed disk block;int opcode;
// READ|wRITE int dirty;
// buffer data modified
int async;
// ASYNC write flag int valid;
//buffer data valid int buay;
// buffer is in use int wanted;
// some process needs this buffer struct semaphore lock=1; /
// buffer locking semaphore; value=1
struct semaphore iodone=0;// for process to wait for I/0 completion;// block data area char buf[BLKSIZE];)
} BUFFER;
BUFFER buf[NBUF],*freelist;// NBUF buffers and free buffer list

  缓冲区结构体由两部分组成: 用于缓冲区管理的缓冲头部分和用于数据块的数据部分。

  设备表:每个块设备用一个设备表结构表示

struct devtab{
u16 dev;
// major device number // device buffer list BUFFER *dev_list;BUFFER*io_queue
// device I/0 queue ) devtab[NDEV];

  缓冲区初始化:当系统启动时,所有I/O缓冲区都在空闲列表中,所有设备列表和T/O队列均为空。

  缓冲区列表:当缓冲区分配给(dev,blk)时,它会被插入设备表的dev_list中。如果缓冲区当前正在使用,则会将其标记为BUSY(繁忙)并从空闲列表中删除

  Unix算法的独创性:1.数据的一致性;2.缓存效果;3.临界区;

  Unix算法的缺点:1.效率低下;2.缓存效果不可预知;3.可能会出现饥饿;4.该算法使用只适用于单处理系统的休眠/唤醒操作。

新的I/O缓冲区管理算法

信号量的主要优点是:

  (1)计数信号量可用来表示可用资源的数量,例如:空闲缓冲区的数量。

  (2)当多个进程等待一个资源时,信号量上的V操作只会释放一个等待进程,该进程不必重试,因为它保证拥有资源。

使用信号量的缓冲区管理算法

  1.保证数据一致性;

  2.良好的缓存效果;

  3.高效率:没有重试循环,没有不必要的进程“唤醒”

  4.无死锁和饥饿。

PV算法

BUFFER *getb1k(dev,blk):
while(1){
(1). P(free);
//get a free buffer first 
if (bp in dev_1ist){
(2). if (bp not BUSY){
remove bp from freelist;P(bp);
// lock bp but does not wait
(3).return bp;
// bp in cache but BUSY V(free);
// give up the free buffer
(4).P(bp);
// wait in bp queue
return bp;v
// bp not in cache,try to create a bp=(dev,blk)
(5).bp = frist buffer taken out of freelist;P(bp);
// lock bp,no wait
(6).if(bp dirty){
awzite(bp);
// write bp out ASYNC,no wait
continue;
// continue from (1)
(7).reassign bp to(dev,blk);1/ mark bp data invalid,not dir return bp;-
// end of while(1);
brelse(BUFFER *bp),
{
(8).iF (bp queue has waiter)( V(bp); return; ]
(9).if(bp dirty && free queue has waiter){ awrite(bp);zeturn;}(10).enter bp into(tail of) freelist;V(bp);V(free);
}

I/O缓冲区管理算法比较

系统组织

  •   Box#1:用户界面﹐这是模拟系统的用户界面部分,提示输人命令、显示命令执行、显示系统状态和执行结果等。在开发过程中,可以手动输入命令来执行任务。在最后测试过程中,任务应该有自己的输入命令序列

多任务处理系统

  •   Box#2:多任务处理系统的CPU端,模拟单处理器(单CPU)文件系统的内核模式。当系统启动时,它会创建并运行一个优先级最低的主任务,但它会创建ntask工作任务,所有任务的优先级都是1,并将它们输人readyQueue。然后,主任务执行以下代码,该代码将任务切换为从readyQueue运行工作任务。

磁盘驱动程序

两部分组成:

1.start_io():维护设备I/O队列,并对I/O队列中的缓冲区执行I/O操作。

2.中断处理程序:在每次I/O操作结束时,磁盘控制器会中断CPU。

磁盘控制器

  Box#3:磁盘控制器,它是主进程的一个子进程。因此,它与CPU端独立运行,除了它们之间的通信通道,通信通道是CPU和磁盘控制器之间的接口。通信通道由主进程和子进程之间的管道实现。

  命令:从CPU到磁盘控制器的I/O命令。

  DataOut:在写操作中从CPU到磁盘控制器的数据输出。 DataIn:在读操作中从磁盘控制器到CPU的数据。 IntStatus:从磁盘控制器到CPU的中断状态。 IntAck:从CPU到磁盘控制器的中断确认。

磁盘中断

  从磁盘控制器到CPU的中断由SIGUSR1(#10)信号实现。在每次IO操作结束时,磁盘控制器会发出 kill(ppid, SIGUSR1)系统调用,向父进程发送SIGUSR1信号,充当虚拟CPU中断。通常,虚拟CPU会在临界区屏蔽出/人磁盘中断(信号)。为防止竞态条件,磁盘控制器必须要从CPU接收一个中断确认,才能再次中断。

虚拟磁盘

  虚拟磁盘:Box#4:Linux文件模拟的虚拟磁盘。使用Linux系统调用lseek()、read(和write(),支持虚拟磁盘上的任何块I/O操作。为了简单起见,将磁盘块大小设置为16字节。由于数据内容无关紧要,所以可以将它们设置为16个字符的固定序列。

实现两个版本的缓冲区管理算法:

  1.使用休眠/唤醒的Unix算法;

  2.使用信号量的新算法。

posted @ 2022-10-31 14:57  20201327刘谨铭  阅读(89)  评论(0编辑  收藏  举报