摘要: Reduction并行分析:每个线程是基于一个树状的访问模型,从上至下,上一层读取数据相加得到下一层的数据.不停的迭代,直到访问完所有的数据.利用这么多的线程块(thread block)我们需要做的事情如下:1. 处理非常大的数组2. 让GPU的每个处理器保持忙碌3. 每个thread block... 阅读全文
posted @ 2015-02-08 09:33 Magnum Programm Life 阅读(6798) 评论(0) 推荐(1) 编辑