MIT 6.S081 2021: Lab Lock

Memory allocator

xv6是使用linked list来管理空余内存块，我们先看一下kalloc.c究竟是怎么工作的：

首先是2个结构体，匿名结构体kmem就是我们访问空余内存的凭据了，kmem里面有一个自旋锁和一个链表头部指针。struct run显然就是链表结构，里面唯一的成员就是指向下一个空余物理页面的指针。kinit做的操作是初始化自旋锁，然后把从内核尾部地址到PHYSTOP的物理内存全部kfree()一遍。

kfree()的作用是：传给它一个指针，它释放该指针指向的一页内存pa。释放方式是：先使用memset把pa里面的内容全部置为1，然后把pa插入freelist的头部。kalloc()的作用是：分配freelist直接指向的页。分配方式是：直接返回freelist的值，然后让freelist指向下一个空闲的页。这就是kalloc.c管理空闲页的过程。在系统boot的时候，CPU0会调用kinit()分配所有内存，得到一个串接起内存中所有可以页的链表。

现在我们要优化这一过程。当多个CPU都需要分配内存时，为了防止race condition，它们在申请新页表的时候都要获取kmem中的自旋锁lock，任何时候只能有一个CPU申请内存。然而自旋锁执行的是busy waiting，非常耗费CPU资源，所以可以为每个CPU设置一个专属的free list，这样多个CPU之间就不需要争夺一个自旋锁了。

为每个CPU设计一个struct memnode，结构成员仿照之前的kmem，有一个自旋锁和一个链表头。初始化一个struct memnode类型的数组cpu_mem，CPU可以按照自己的hart id在cpu_mem里找到自己的free list。

struct memnode{
  struct spinlock lock;
  struct run *freelist;
};

//初始化一个struct memnode类型的数组
struct memnode cpu_mem[NCPU];

现在修改kinit()：

void
kinit()
{
  //这里应当多次调用，初始化每个CPU的锁
  //TODO
  //char name[20];
  for(int i=0;i<NCPU;i++)
  {
    //snprintf(name,15,"kmem");
    initlock(&cpu_mem[i].lock, "kmem");
    //memset(name,0,20);
  }
  //initlock(&kmem.lock, "kmem");
  freerange(end, (void*)PHYSTOP);
}

初始化所有锁，按照提示，锁的名称就用kmem。取别的名字的话auto grade程序可能识别不了。

然后修改kfree()。理所当然的，使用cpuid()获取CPU的hart id，获取现有CPU专属的锁，然后把空页插入此CPU的freelist头部。

void
kfree(void *pa)
{
  struct run *r;
  push_off();//记得关中断
  int this_cpu = cpuid();
  pop_off();
  //printf("cpu %d free %p\n",this_cpu,pa);
  if(((uint64)pa % PGSIZE) != 0 || (char*)pa < end || (uint64)pa >= PHYSTOP)
    panic("kfree");

  // Fill with junk to catch dangling refs.
  memset(pa, 1, PGSIZE);

  r = (struct run*)pa;

  acquire(&cpu_mem[this_cpu].lock);
  r->next = cpu_mem[this_cpu].freelist;
  cpu_mem[this_cpu].freelist = r;
  release(&cpu_mem[this_cpu].lock);
}

似乎按照同样的道理，kalloc()也直接仿照上面kfree()，获取现有CPU的锁，然后把freelist指向下一个空页。直接这么写，系统boot的时候就会触发panic。

这里需要注意，在只有CPU0调用了kinit()，因此在初始时，CPU0的freelist拥有所有空闲内存，其他CPU的freelist都是空的！提示已经告诉我们，如果某一个CPU的free list空了，它应该从其他CPU”偷“一个空闲页。所谓”偷“的过程是：CPU1使用CPU0的freelist来kalloc()一个页，CPU1会修改CPU0的freelist，然后把得到的指针传给CPU1上正在运行的线程。稍后，该线程使用kfree()释放了这页内存，kfree()把这页内存加入到CPU1的freelist。

为kalloc()设计偷页的功能：

void *
kalloc(void)
{
  struct run *r;
  push_off();//记得关中断
  int this_cpu = cpuid();
  pop_off();
  
  acquire(&cpu_mem[this_cpu].lock);
  r = cpu_mem[this_cpu].freelist;
  if(r)
  {
    cpu_mem[this_cpu].freelist = r->next;
    release(&cpu_mem[this_cpu].lock);
  }
  else//尝试从其他的CPU的freeList里取得
  {
    int j;
    int free_cpu;//哪个CPU有空的free list
    for(j=0;j<NCPU;j++)
    {
      free_cpu=(this_cpu+j)%NCPU;
      if(cpu_mem[free_cpu].freelist!=0)//如果freelist是有值的
        break;
    }
    release(&cpu_mem[this_cpu].lock);//释放了现在cpu的锁

    acquire(&cpu_mem[free_cpu].lock);//获取cpu j的锁
    r = cpu_mem[free_cpu].freelist;
    if(r)
      cpu_mem[free_cpu].freelist = r->next;

    release(&cpu_mem[free_cpu].lock);//释放cpu j的锁

  }
  
  //printf("cpu %d kalloc %p\n",this_cpu,r);
  if(r)
    memset((char*)r, 5, PGSIZE); // fill with junk
  return (void*)r;
}

如果自己的freelist已经空了，那么从右侧开始循环搜索所有CPU，如果发现谁的freelist不为空，就及时释放现在CPU的锁。获取偷窃目标的锁，把偷窃目标的freelist指向下一页，然后返回偷到的空页指针r。

Buffer cache

xv6文件系统里有一个buffer cache layer，它的用途是：

(1) synchronize access to disk blocks to ensure that only one copy of a block is in memory and that only one kernel thread at a time uses that copy;
(2) cache popular blocks so that they don’t need to be re-read from the slow disk.

很明显就像CPU里面的cache一样，要利用局部性原理做低速存储器的缓冲。这个比kalloc要复杂，我们来看一下它做了什么：

bcache就是整个buffer cache了，里面有一个自旋锁lock和一个双向链表。链表头部是head，其他节点都存储在buf数组里。（这里可没有stdlib.h和malloc，必须使用静态链表）每个buf块里有它对应的dev和block，每个block只能有一个对应的buf块。每个buf块里都有一个用来读写的睡眠锁。

首先调用binit初始化链表和锁。

看一下稍后要修改的bget函数：

这个bget函数先获取了访问链表的自旋锁bcache.lock，然后遍历链表，根据传入参数寻找buf块，如果找到了对应的块就释放自旋锁，调用睡眠锁准备读写。

如果没找到，就从后往前遍历链表，找到一块refcnt为0的块（refcnt为0意味着未被使用），初始化它，然后获取睡眠锁来读写。

brelse()函数的主要功能就是释放的buf块移动到链表的头部。这样可以实现LRU。链表中越往后的buf块就是使用的越少的块。

和上面kalloc一样，多个进程访问bcache都需要获取bcache.lock这个自旋锁。按照提示，可以使用一个hash表来代替buf链表来减少冲突。我们可以把blockno映射到这个hash表的bucket中。

struct bucket{
  struct spinlock lock;
  struct buf bufarr[BUCKETSZ];//每一个bucket 存储的buf
};

struct bucket bhash[NBUCKETS];

声明一个hash表bhash，有NBUCKETS个bucket，每个bucket有一个自旋锁和一组buf节点。如果需要访问hash表，首先根据blockno计算出它在表中的位置，然后在bufarr里面搜索即可。

这里用的散列函数比较简单，直接取模：

int hashkey(uint key)
{
  return key%NBUCKETS;
}

为buf添加几项：

struct buf {
  int valid;   // has data been read from disk?
  int disk;    // does disk "own" buf?
  uint dev;
  uint blockno;
  struct sleeplock lock;
  uint refcnt;
  struct buf *prev; // LRU cache list
  struct buf *next;
  uchar data[BSIZE];
  uint timestamp;   //时间戳
  int bucket;//属于哪个bucket
};

初始化hash表。

void binit(void)
{
  //初始化每个锁的名称
  uint init_stamp=ticks;
  for(int i=0;i<NBUCKETS;i++)
  {
    //snprintf(name,18,"bcache",i);
    initlock(&bhash[i].lock,"bcache");
    for(int j=0;j<BUCKETSZ;j++)//初始化时间戳
    {
      bhash[i].bufarr[j].timestamp=init_stamp;
      bhash[i].bufarr[j].bucket=i;//记录它属于哪个bucket
    }
  }
}

实验要求使用系统时间戳来实现LRU，所以获取调用binit()时的ticks作为初始时间戳，然后进行初始化。

然后修改bget，首先根据blockno映射到相应的bucket，获取该bucket的自旋锁，然后遍历这个bucket里面的bufarr，找到之后要更新时间戳，释放自旋锁调用睡眠锁。如果没有找到，就在所有refcnt为0的项里面搜索时间戳最小的，作为替换对象：

static struct buf*  bget(uint dev, uint blockno)
{
  int key=hashkey(blockno);
  acquire(&bhash[key].lock);//hash到对应的bucket,需要获取bucket上面的锁
  struct buf* b;
  for(b=&bhash[key].bufarr[0]; b<&bhash[key].bufarr[0]+BUCKETSZ; b++)
  {
    if(b->dev == dev && b->blockno == blockno)//如果找到该节点
    {
      b->refcnt++;  //增加引用数
      b->timestamp=ticks;//更新时间戳
      release(&bhash[key].lock);//释放bucket锁。其他进程可以访问bucket了
      acquiresleep(&b->lock);//获取该节点的睡眠锁，准备读写
      return b;
    }
  }

  //没有找到：找时间戳最小的未使用项
  uint minstamp=~0;
  struct buf* min_b=0;
  for(b=&bhash[key].bufarr[0] ; b<&bhash[key].bufarr[0]+BUCKETSZ; b++)
  {
    
    if(b->timestamp<minstamp && b->refcnt==0)
    {
      minstamp=b->timestamp;
      min_b=b;
    }
  }
  if(min_b!=0)
  {
    min_b->dev = dev;
    min_b->blockno = blockno;
    min_b->valid = 0;
    min_b->refcnt = 1;
    min_b->timestamp=ticks; //记得更新时间戳
    release(&bhash[key].lock);//释放bucket锁。其他进程可以访问bucket了
    acquiresleep(&min_b->lock);//获取该节点的睡眠锁，准备读写
    return min_b;
  }
  panic("bget: no buffers");
}

这时brelse就很简单了，首先务必要释放之前在bget()调用的睡眠锁，只需要减少refcnt数目就可以了。LRU功能已经由时间戳实现，所以可以直接删掉后面的链表操作：

void
brelse(struct buf *b)
{
  if(!holdingsleep(&b->lock))
    panic("brelse");

  releasesleep(&b->lock);

  acquire(&bhash[b->bucket].lock); //获取它所在bucket的自旋锁
  b->refcnt--;
  
  release(&bhash[b->bucket].lock);
}

顺便再修改一下最后两个函数，因为之前它们直接获取了bcache.lock：

void
bpin(struct buf *b) {
  acquire(&bhash[b->bucket].lock);
  b->refcnt++;
  release(&bhash[b->bucket].lock);
}

void
bunpin(struct buf *b) {
  acquire(&bhash[b->bucket].lock);
  b->refcnt--;
  release(&bhash[b->bucket].lock);
}

posted @ 2021-11-19 22:47 LunaCancer 阅读(1684) 评论(8) 收藏举报

刷新页面返回顶部

LunaCancer

MIT 6.S081 2021: Lab Lock

Buffer cache

公告