随笔分类 - CUDA
摘要:第六章 CUDA内存处理 6.1 高速缓存 G80 与 GT200 系列没有与CPU中高速缓存等价的存储器。在Fermi架构的GPU实现中,第一次引入了不基于程序员托管的数据缓存这个概念。这个架构的GPU中每个SM有一个一级缓存,这个一级缓存既是基于程序员托管的又是基于硬件托管的。在所有的SM之间有
阅读全文
摘要:第五章 写完本篇,做一个小总结,写在前面(限于笔者水平有限,仅提出自己的思考,以供参考): 推荐理解的逻辑是:硬件 --> 软件 --> 编程 --> 解决实际问题 GPU从硬件上,有若干个SM,每个SM有若干个SP,SP是实际运行GPU线程的硬件,一个线程对应一个SP。由SM的数量和每个SM拥有S
阅读全文