摘要: 和许多多线程并行问题一样,CUDA也存在互斥访问的问题,即当一个线程改变变量X,而另外一个线程在读取变量X的值,执行原子操作类似于有一个自旋锁,只有等X的变量在改变完成之后,才能执行读操作,这样可以保证每一次读取的都是最新的值.在kernel 程序中,做统计累加,都需要使用原子操作:atomicAd... 阅读全文
posted @ 2015-02-10 11:59 Magnum Programm Life 阅读(24593) 评论(1) 推荐(0) 编辑
摘要: 1. Prefix Sum前缀求和由一个二元操作符和一个输入向量组成,虽然名字叫求和,但操作符不一定是加法。先解释一下,以加法为例:第一行是输入,第二行是对应的输出。可以看到,Output[1] = Input[0] + Input[1],而Output[length - 1]就是整个输入向量元素之... 阅读全文
posted @ 2015-02-10 11:58 Magnum Programm Life 阅读(5644) 评论(3) 推荐(1) 编辑