OpenCL 学习step by step (11) 数组求和(reduction)
摘要:
本篇教程中,我们学习一下如何用opencl有效实现数组求和,也就是通常所说的reduction问题。 在程序中,我们设置workgroup size为256,kernel的输入、输出缓冲参数都用uint4的格式,这样我们原始求和的数组大小为256*4的倍数,数据类型为uint。我们设定每个workgroup处理处理512个uint4,即2048个uint 为了简便... 阅读全文
posted @ 2012-11-24 12:12 迈克老狼2012 阅读(6177) 评论(9) 推荐(0) 编辑