2017年4月12日

优达学城-并行编程-Unit2 通信模块、同步机制、原子操作

摘要: (一). Parallel communication Patterns 在上一章CUDA系列学习(二)CUDA memory & variables中我们介绍了memory和variable的不同类型,本章中根据不同的memory映射方式,我们将task分为以下几种类型:Map, Gather, 阅读全文

posted @ 2017-04-12 16:03 羊丽素 阅读(665) 评论(0) 推荐(0) 编辑

优达学城-并行编程-Unit2 硬件内存

摘要: GPU负责给SM分配wrap,SM以并行方式运行程序 在一个SM上跑的所有线程可能合作解决一个子问题(错的,不一定的) 一个单Kernel程序在多个wrap上运行,包含X线程块和Y线程块,可以确定x y先后跑的顺序或是在哪个SM上跑吗? 答:伐晓得(这是cuda的小秘密= =||) GPU的优越性: 阅读全文

posted @ 2017-04-12 15:33 羊丽素 阅读(426) 评论(0) 推荐(0) 编辑

(转载)关于cuda grid block thread的问题

摘要: 前面扯了很多,不過大多都是在講 CUDA 在軟體層面的東西;接下來,雖然 Heresy 自己也不熟,不過還是來研究一下硬體的部分吧~畢竟要最佳化的時候,好像還是要大概知道一下相關的東西的。這部分主要參考資料是: [Hotball's Hive]GPU 的硬體架構 Programming Massiv 阅读全文

posted @ 2017-04-12 14:51 羊丽素 阅读(1415) 评论(0) 推荐(0) 编辑

导航