[Linux] 理解CPU缓存的伪共享问题

CPU是有高速缓存的 , 三级缓存分别是 L1 ,   L2   ,   L3

L1缓存最贴近CPU , 所以速度也最快

数据在缓存中是一行一行存储的 , L1缓存一般的一行缓存64字节

 

一行能缓存64个字节  , 因为一个变量可能没有64字节大小 , 所以可能会缓存好几个变量

缓存需要保证一致性, 也就是当变量修改的时候 , 缓存必须得失效 , 重新在内存中读取变量加载到缓存里

 

当一行里有好几个变量的时候 , 其中一个变量修改了 , 这一行的数据都得失效 

并且同一时间只允许一个线程操作缓存行 ,

当并发比较高修改比较频繁时候 , 缓存的性能就下降了很多 , 这就是伪共享问题

 

一般解决这个问题是用的内存对齐填充来解决 , 也就是我一个变量占满这一行64字节 , 当然这样也比较浪费缓存

我们常说的局部性原理也与CPU缓存有关 ,

当我们使用数组的时候 , 内存地址是连续的 , 这样就很有可能放在一行里 , 每次CPU从缓存里读一行就能读到相邻的变量 , 速度会很快

posted @   唯一客服系统开发笔记  阅读(138)  评论(0编辑  收藏  举报
编辑推荐:
· 开发者必知的日志记录最佳实践
· SQL Server 2025 AI相关能力初探
· Linux系列:如何用 C#调用 C方法造成内存泄露
· AI与.NET技术实操系列(二):开始使用ML.NET
· 记一次.NET内存居高不下排查解决与启示
阅读排行:
· 阿里最新开源QwQ-32B,效果媲美deepseek-r1满血版,部署成本又又又降低了!
· 开源Multi-agent AI智能体框架aevatar.ai,欢迎大家贡献代码
· Manus重磅发布:全球首款通用AI代理技术深度解析与实战指南
· 被坑几百块钱后,我竟然真的恢复了删除的微信聊天记录!
· AI技术革命,工作效率10个最佳AI工具
历史上的今天:
2016-05-11 [javaSE] 集合框架(HashSet)
2016-05-11 [HTML5] Canvas绘制简单形状
点击右上角即可分享
微信分享提示
1
chat with us