gpu 内存模型

gpu 内存模型

每个gpu有很多Multyproccessor,每个processor结构如下

 

 1)私有本地内存

2)共享内存,速度很快,可以被块中的所有线程访问,生命周期与块一致

__share__调用

void __syncthreads()使块中的线程同步,相当与一个障碍点,所有程序运行到障碍点再开始下一步

共享内存被分为了很多相同大小的内存块banks,要注意bank访问冲突

3)全局内存,访问速度最慢

通过cache访问,访问是对齐的

4)常量内存和纹理内存,使用偏少

寄存器,速度最快,变量影响寄存器。越少越好

5)缓存

 

posted @   开锁球  阅读(129)  评论(0编辑  收藏  举报
相关博文:
阅读排行:
· DeepSeek 开源周回顾「GitHub 热点速览」
· 物流快递公司核心技术能力-地址解析分单基础技术分享
· .NET 10首个预览版发布:重大改进与新特性概览!
· AI与.NET技术实操系列(二):开始使用ML.NET
· 单线程的Redis速度为什么快?
点击右上角即可分享
微信分享提示