Buffer 和 cache

要问Cache和Buffer的区别,首先要问另一个问题:为何会存在Cache和Buffer?

无论缓存还是缓冲,其实本质上解决的都是读写速度不匹配的问题,从这个角度,他们非常相似。

知乎上关于Cache 和 Buffer 都是缓存,主要区别是什么? - 知乎 (zhihu.com)的回答有上百个,把一个问题拨开了凿穿了分析,看过了许多资料之后,发现博主们从多方面进行了回答,认为有必要对其中比较精辟的回答进行一次整理和汇总,希望对大家也有用

cache 缓存

cache是为解决重复多次读取硬盘数据提供解决方案

cache字面意思理解缓存,在台湾翻译为快取,快取更加形象的表明了cache的作用,快速读取。我们通常把经常访问的数据保存cache中,读取时则不需要再次从硬盘读取,从硬盘上读取数据比较慢,按照原文的意思是从内存读数据和从硬盘读取数据的速度就好比火箭之于蒸汽机的差别。cache可以设置超时时间,超时后内存空间被回收,否则可以一直访问,被清理后的cache数据可以从源数据(硬盘)重新读取,实际数据不丢失。

Buffer 缓冲

背景知识一:我们现在的计算机、手机都是冯诺依曼架构,CPU只能操作内存中的数据,无法直接操作硬盘上的数据。

背景知识二:硬盘上的数据,最小读写单位是扇区(Sector)。老式硬盘上一个扇区是512字节,现代硬盘上一个扇区是4K字节。计算机不能以单个字节为单位访问硬盘上的数据。现在很常见的固态硬盘,物理上最小读写单位是页(Page),但大部分固态硬盘通过主控芯片模拟传统硬盘的扇区来进行读写。现代硬盘常用的LBA(Logical Block Addressing,逻辑块寻址)寻址方式,是把硬盘上的扇区分配从0~N-1的编号(N为硬盘上所有可用扇区数量)。

介绍完背景,假设某个应用现在需要读取一个大小为15K字节的文件A。操作系统和文件系统会把文件路径转换为具体的LBA地址,可能最终转换为读取硬盘上从B扇区开始的4个扇区(按照每个扇区4KB计算)。然而,前面我们说了,CPU并不能直接访问硬盘,因此需要先把这四个扇区的数据,传输到内存中。存放这四个扇区数据的内存,就是Buffer。忽略CPU内部的Cache机制,CPU现在可以对这一段内存以字节为单位进行操作,在所有操作完成后,Buffer所占用的内存会被回收。

buffer的其他应用场景:在写入文档的时候,我们以字符为单位输入,数据并没有保存至硬盘设备,而是暂存至buffer缓冲区,等到缓冲区满或者flush,使用保存按钮的时候,缓冲区的数据才会被写入硬盘,buffer的存在也为了减少硬盘的IO 读写次数,因为每次从内存写入硬盘设备速度也很慢,进而同时也提高了速度。

cache和buffer的联系:从以上介绍读取文件的过程中发现,把数据从硬盘上的扇区传输到内存的过程中,需要把扇区的数据暂存到buffer,将buffer flush写入cache 缓存之后,我们 就可以快取这些数据了。

总结:

涉及到IO设备读写的场景中,Cache的一部分本身就是Buffer的一种。如果说某些场合Buffer可以提升IO设备的读写性能,只不过是因为Buffer本身是Cache系统的一部分,性能提升来自于Cache机制。Buffer不是缓存,国内常用的翻译是缓冲区

其次,大部分场景中,Buffer是特指内存中临时存放的IO设备数据——包括读取和写入;而Cache的用处很多——很多IO设备(例如硬盘、RAID卡)上都有Cache,CPU内部也有Cache,浏览器也有Cache。

posted @ 2021-12-15 11:19  jiayouliucui  阅读(231)  评论(0编辑  收藏  举报