学习笔记 10
学习笔记 10
第十二章 块设备I/O和缓冲区管理
12.1 块设备I/O缓冲区
文件系统使用一系列I/O缓冲区作为块设备的缓存内存。当进程试图读取(dev,blk)标识的磁盘块时。它首先在缓冲区缓存中搜索分配给磁盘块的缓冲区。如果该缓冲区存在并且包含有效数据、那么它只需从缓冲区中读取数据、而无须再次从磁盘中读取数据块。如果该缓冲区不存在,它会为磁盘块分配一个缓冲区,将数据从磁盘读人缓冲区,然后从缓冲区读取数据。当某个块被读入时、该缓冲区将被保存在缓冲区缓存中,以供任意进程对同一个块的下一次读/写请求使用。同样,当进程写入磁盘块时,它首先会获取一个分配给该块的缓冲区。然后,它将数据写入缓冲区,将缓冲区标记为脏,以延迟写入,并将其释放到缓冲区缓存中。由于脏缓冲区包含有效的数据,因此可以使用它来满足对同一块的后续读/写请求,而不会引起实际磁盘I/O。脏缓冲区只有在被重新分配到不同的块时才会写入磁盘。
-
BUFFER结构类型
BUFFER *bread(dev,blk) // return a buffer containing valid data { BUFFER *bp =» getblk(dev,blk)} // get a buffer for (dev,blk) if (bp data valid) return bp; bp->opcode = READ; // issue READ operation start_lo(bp): // ntart I/O on device wait for I/O completion; }
-
定义一个 write_block(dev, blk, data)函数
write_block(devf blk, data) { BUFFER *bp = bread(dev,blk); // read in the disk block first write data to bp; (synchronous write)? bwrite(bp) : dwrite(bp); }
12.2 Unix I/O缓冲区管理算法
(1)I/O 缓冲区:内核中的一系列 NBUF 缓冲区用作缓冲区缓存。每个缓冲区用一个结构体表示。
typdef struct buf{
struct buf *next_freei // freelist pointer
struct buf inext devi // dev list pointer
int dev,blki // assigmed disk block;
int opcode; //READ|WRITE
int airty: // buffer data modified
int asynci // ASYNC write flag
int valid; // buffer data valid
int buayi // buffer is in use
int wanted; // some process needs this buffer
struct gemaphore 1ock=1; // buffer 1ocking semaphore; value=1
struct semaphore iodone=0: // for process to wait Eor I/O completioni
char buf[BLKSIZE]1 // block data area
}BUFFER:
BUFFER buf[NBUFl,*freelist; // NBUF buffers and free buffer list
缓冲区结构体由两部分组成:用于缓冲区管理的缓冲头部分和用于数据块的数据部分。为了保护内核内存,状态字段可以定义为一个位向量,其中每个位表示一个唯一的状态条件。为了便于讨论,这里将它们定义为int。
(2)设备表:每个块设备用一个设备表结构表示。
struct devtab{
u16 devi // major device number
BUFFER *dev 1ist; /l device buffer 1ist
BUFFER +io_queuel // device I/O queue
}devtab[NDEV];
(3)缓冲区初始化:当系统启动时,所有I/O缓冲区都在空闲列表中,所有设备列表和I/O队列均为空。
(4)缓冲区列表:当缓冲区分配给(dev,blk)时,它会被插入设备表的dev_list中。如果缓冲区当前正在使用,则会将其标记为USY并从空闲列表中删除。繁忙缓冲区也可能回在设备表的I/O队列中。
(5)Unix getblk/brelse 算法((Lion 1996;(Bach 1990)第3章)。
Unix算法的缺点
- 效率低下;该算法依赖于重试循环。例如,释放缓冲区可能会唤醒两组进程:需要释放的缓冲区的进程,以及只需要空闲缓冲区的进程。由于只有一个进程可以获取释放的缓冲区,所以,其他所有被唤醒的进程必须重新进入休眠状态。从休眠状态唤醒后,每个被唤醒的进程必须从头开始重新执行算法,因为所需的缓冲区可能已经存在。这会导致过多的进程切换。
- 缓存效果不可预知:在Unix算法中,每个释放的缓冲区都可被获取。如果缓冲区由需要空闲缓冲区的进程获取,那么将会重新分配缓冲区,即使有些进程仍然需要当前的缓冲区。
- 可能会出现饥饿:Unix算法基于“自由经济”原则,即每个进程都有尝试的机会,但不能保证成功。因此,可能会出现进程饥饿。
- 该算法使用只适用于单处理器系统的休眠/唤醒操作。
12.3 新的I/O缓冲区管理算法
我们在信号量上使用P/V来实现进程同步,而不是使用休眠/唤醒。与休眠/唤醒相比,信号量的主要优点是:
(1)计数信号量可用来表示可用资源的数量,例如:空闲缓冲区的数量。
(2)当多个进程等待一个资源时,信号量上的V操作只会释放一个等待进程,该进程不必重试,因为它保证拥有资源。
12.4 PV算法
证明PV算法正确,并且满足要求
- 缓冲区唯一性
- 无重试循环
- 无不必要唤醒
- 缓存效果
- 无死锁和饥饿