随笔分类 - CUDA

CUDA 内存处理

摘要：第六章 CUDA内存处理 6.1 高速缓存 G80 与 GT200 系列没有与CPU中高速缓存等价的存储器。在Fermi架构的GPU实现中，第一次引入了不基于程序员托管的数据缓存这个概念。这个架构的GPU中每个SM有一个一级缓存，这个一级缓存既是基于程序员托管的又是基于硬件托管的。在所有的SM之间有阅读全文

posted @ 2023-05-09 10:28 人生逆旅，我亦行人阅读(144) 评论(0) 推荐(0) 编辑

线程网格、线程块以及线程

摘要：第五章写完本篇，做一个小总结，写在前面（限于笔者水平有限，仅提出自己的思考，以供参考）：推荐理解的逻辑是：硬件 --> 软件 --> 编程 --> 解决实际问题 GPU从硬件上，有若干个SM，每个SM有若干个SP，SP是实际运行GPU线程的硬件，一个线程对应一个SP。由SM的数量和每个SM拥有S 阅读全文

posted @ 2023-05-08 17:55 人生逆旅，我亦行人阅读(896) 评论(1) 推荐(0) 编辑