第十二章学习笔记

第十二章块设备I/O和缓冲区管理

1.块设备I//O缓冲区

文件系统使用一系列I/O缓冲区作为块设备的缓存内存。当进程试图读取（dev，blk）标识的磁盘块时，他首先在缓冲区缓存中搜索分配给磁盘块的缓冲区。如果缓冲区中存在并且包含有效数据，那么它只需要从缓冲区中读取数据，而无需再次从磁盘中读取数据块。如果该缓冲区不存在，他会为磁盘块分配一个缓冲区，将数据从磁盘读入到缓冲区，然后从缓冲区读取数据。
当进程写入磁盘块时，他首先会获取一个分配给该块的缓冲区。然后将数据写入缓冲区，将缓冲区标记为脏，以延迟写入，并将起释放到缓冲区缓存中，并将其释放到缓冲区缓存中。
在read_file/write_file中，假设他从内存中的一个专用缓冲区进行读写。假设BUFFER是缓冲区的结构类型，而且getblk(dev,blk)从缓冲区缓存中飞配一个指定给（dev，blk）的缓冲区。定义一个bread函数，他会返回一个包含有效数据的缓冲区：

 BUFFER *bread(dev,blk) // return a buffer containing valid data
    {
    BUFFER *bp =» getblk(dev,blk)} // get a buffer for (dev,blk) if (bp data valid)
    return bp;
    bp->opcode = READ;	// issue READ operation
    start_lo(bp):	// ntart I/O on device
    wait for I/O completion;
    }

从缓冲区读取数据后，进程通过brelse(hp)格缓冲区释放回缓冲区缓存。同理，定义一个 write_block(dev, blk, data)函数：

	write_block(devf blk, data)
    BUFFER *bp = bread(dev,blk);	// read in the disk block first
    write data to bp;
    (synchronous write)? bwrite(bp) : dwrite(bp);
    bwrite(BUFFER *bp)( bp->opcode = WRITE； start_io(bp); 
    wait for I/O completion; 
    brelse(bp); // release bp
    dwrite(BUFFER *bp)( mark bp dirty for delay_write；
    brelse(bp); // release bp

2.Unix I/O缓冲区管理算法

I/O缓冲区：内核中的一系列NBUF缓冲区用作缓冲区缓存。每个缓冲区用一个结构体表示。

typdef struct buf{
   struct buf *next_free;	//freelist pointer
   struct buf *next_dev；	//dev_list pointer
   int dev,blk；	//assigned disk block；
   int opcode；	//READ|WRITE
   int dirty;	//buffer data modified
   int async;	//ASYNC write flag
   int valid;	//buffer data valid
   int busy;	//buffer is in use
   int wanted；		some process needs this buffer
   struct, semaphore lock=l ；	//buffer locking semaphore； value=L
   struct semaphore iodone=0；	//for process to wait for I/O completion；
   char buf[BLKSIZE];	//block data area
   } BUFFER;

设备表：每个块设备用一个设备表结构表示。
缓冲区初始化：当系统启动时，所有I/O缓冲区都在空闲列表中，所有设备列表和T/O队列均为空。
缓冲区列表：当缓冲区分配给(dev,blk)时，它会被插入设备表的dev_list中。如果缓冲区当前正在使用，则会将其标记为BUSY(繁忙)并从空闲列表中删除。
Unix getblk/brelse算法：

Unix算法的缺点：
- 效率低下：该算法依赖于重试循环，例如，释放缓冲区可能会唤醒两组进程：需要释放的缓冲区的进程，以及只需要空闲缓冲区的进程。由于只有一个进程可以获取释放的缓冲区，所以，其他所有被唤醒的进程必须重新进入休眠状态。从休眠状态唤醒后，每个被唤醒的进程必须从头开始重新执行算法，因为所需的缓冲区可能已经存在。这会导致过多的进程切换。
- 缓存效果不可预知：在Unix算法中，每个释放的缓冲区都可被获取'如果缓冲区由需要空闲缓冲区的进程获取，那么将会重新分配缓冲区，即使有些进程仍然需要当前的缓冲区。
- 可能会出现饥饿：Unix算法基于“自由经济”原则，即每个进程都有尝试的机会，但不能保证成功，因此，可能会出现进程饥饿
- 该算法使用只适用丁单处理器系统的休眠/唤醒操作

3.新的I/O缓冲区管理算法

使用PV来实现进程同步，而不是休眠/唤醒。信号量的优点：

计数信号量可用来表示可用资源数量；
多进程等待一个资源时，信号量上的V操作只会释放一个等待进程，该进程不必重试，因为它保证拥有资源.

4.PV算法

BUFFER *getb1k(dev,blk)：
    while(1){
    (1). P(free);
    //get a free buffer first 
    if (bp in dev_1ist){
    (2). if (bp not BUSY){
    remove bp from freelist;P(bp);
    // lock bp but does not wait
    (3).return bp;
    // bp in cache but BUSY V(free);
    // give up the free buffer
    (4).P(bp);
    // wait in bp queue
    return bp;v
    // bp not in cache,try to create a bp=(dev,blk)
    (5).bp = frist buffer taken out of freelist;P(bp);
    // lock bp,no wait
    (6).if(bp dirty){
    awzite(bp);
    // write bp out ASYNC,no wait
    continue;
    // continue from (1)
    (7).reassign bp to(dev,blk);1/ mark bp data invalid,not dir return bp;-
    // end of while(1)；
    brelse(BUFFER *bp)，
    {
    (8).iF (bp queue has waiter)( V(bp); return; ]
    (9).if(bp dirty && free queue has waiter){ awrite(bp);zeturn;}(10).enter bp into(tail of) freelist;V(bp);V(free);

证明PV算法的正确性:
（1）缓冲区唯一性：在 getblk（）中，如果有空闲缓冲区，则进程不会在（1）处等待，而是会搜索 dev list。如果所需的缓冲区已经存在，则进程不会重新创建同一个缓冲区。如果所需的缓冲区不存在。则进程会使用个空闲缓冲区来创建所需的缓冲区。而这个空闲缓冲区保证是存在的。如果没有空闲缓冲区，则需要同一个缓冲区的几个进程可能在（1）处阻塞。

（2）无重试循环：进程重新执行while（1）循环的唯一位置是在（6）处，但这不是重试，因为进程正在不断地执行。

（3）无不必要唤醒：在 getblk（中，进程可以在（1）处等待空闲缓冲区也可以在（4）处等待所需的缓冲区。在任意一种情况下，在有缓冲区之前，都不会唤醒进程重新运行。。

（4）缓存效果：在 Unix算法中，每个释放的缓冲区都可被获取。而在新的算法中，始终保留含等待程序的缓冲区以供重用。只有缓冲区不含等待程序时，才会被释放为空闲。这样可以提高缓冲区的缓存效果。

（5）无死锁和饥饿：在 getblk（）中，信号量锁定顺序始终是单向的，即 P（free），然后是P（bp），但决不会反过来，因此不会发生死锁。

5.模拟系统的改进

Unix信号最初设计用于以下用途

模拟系统可以扩展为支持多个磁盘控制器，而不是单独一个磁盘控制器，这样可通过一个数据信号来缓解I/O堵塞。
可用非均匀分布生成输人命令，以改善实际系统中模型文件操作。例如，可以生成更多的读命令而不是写命令，以及一些设备上有更多的I/O需求等。

posted on 2021-11-21 17:11 20191225张文颖阅读(29) 评论(0) 编辑收藏举报

第十二章学习笔记

第十二章学习笔记

第十二章 块设备I/O和缓冲区管理

1.块设备I//O缓冲区

2.Unix I/O缓冲区管理算法

3.新的I/O缓冲区管理算法

4.PV算法

5.模拟系统的改进

第十二章块设备I/O和缓冲区管理