linux 写时拷贝技术(copy-on-write,COW)

Linux程序中,创建进程使用的是fork()函数,它会产生一个和父进程基本完全相同的子进程,这里先记住有相同的物理内存,区别仅仅在于pid、ppid和某些统计量。子进程后面基本都会执行exec系统调用,它会引起子进程另起内存拷贝一份,如果创建子进程都需要拷贝内存的话,辛苦拷贝的又完全放弃了,出于效率考虑,Linux引入了写时复制技术,也就是只有进程空间的各段内容要发生变化时,才会将父进程的内容复制一份给子进程。

在fork之后exec之前两个进程用的是相同的物理空间(内存区),子进程的代码段、数据段、堆栈都是指向父进程的物理空间,也就是说,两者的虚拟空间不同,但其对应的物理空间是同一个。当父子进程中有更改相应段的行为发生时,再为子进程相应的段分配物理空间,如果不是因为exec,内核会给子进程的数据段、堆栈段分配相应的物理空间(至此两者有各自的进程空间,互不影响),而代码段继续共享父进程的物理空间(两者的代码完全相同)。而如果是因为exec,由于两者执行的代码不同,子进程的代码段也会分配单独的物理空间,那么拷贝就不需要做了。

拿个网上通用的例子说明一下它们的不同。

现在有一个父进程P1,它用fork()创建了子进程P2,

传统内核

1、复制P1的代码段,数据段,堆,栈这四个部分,注意是其内容相同。(虚拟空间)

2、为这四个部分分配物理块,其中除了代码段没有分配实际的物理空间而是指向的P1的代码段的物理空间,其余的数据段和堆栈段都分配有实际的物理空间(箭头表示拷贝),如下图所示:

 

写时复制

内核只为新生成的子进程创建虚拟空间结构,它们复制于父进程的虚拟空间结构,但是不为它们分配内存,而是共享父进程的物理内存,当父子进程有更改相应段的行为发生时,再为子进程相应段分配物理内存。

 

用vfork创建子进程

使用这个接口分配连虚拟空间结构都不创建了,直接共享父进程的虚拟空间,顺其自然的也共享了父进程物理内存

 综上,写时拷贝是一种可以推迟甚至免除拷贝数据的技术,资源的复制只有需要写入时才进行,此前以只读的方式共享。调用exec时就可以免除拷贝了,因为拷贝毫无意义。

 

posted @ 2023-05-03 15:46  流水灯  阅读(99)  评论(0编辑  收藏  举报