摘要: 在CUDA基本概念介绍有简单介绍CUDA memory。这里详细介绍:每一个线程拥有自己的私有存储器,每一个线程块拥有一块共享存储器(Shared memory);最后,grid中所有的线程都可以访问同一块全局存储器(global memory)。除此之外,还有两种可以被所有线程访问的只读存储器:常... 阅读全文
posted @ 2015-01-19 23:14 Magnum Programm Life 阅读(6317) 评论(1) 推荐(1) 编辑
摘要: 在HOST端我们会分配block的dimension, grid的dimension。但是对应到实际的硬件是如何执行这些硬件的呢?如下图:lanuch kernel 执行一个grid。一个Grid有8个block,可以有两个硬件执行单元,一个执行一个block,需要执行4次,或者像右边有4个执行单元... 阅读全文
posted @ 2015-01-19 16:01 Magnum Programm Life 阅读(2464) 评论(1) 推荐(1) 编辑