摘要: chapter5里重要的例子是dot,来解释一个block内多个thread的共享内存和同步。__shared__共享内存:“对于在GPU上启动的每个线程块,cuda c编译器都将创建该变量的一个副本。线程块中的每个线程都共享这块内存,并和其他线程块无关,这使一个线程块中多个线程能够在计算上进行通信... 阅读全文
posted @ 2014-06-20 17:30 dust_fly 阅读(1996) 评论(0) 推荐(0) 编辑