摘要: 本文给出一个规约算法求数组的和的例子。本例子求128000个整数的和。其实我想用浮点数做例子的但是我的电脑用atomic_float类型编译会报错。运算过程是每个工作组先把数据加载到局部内存中,工作组的大小是128,然后再求和,把结果累积到全局变量中。实际运行对比发现GPU的效率不如CPU直接求和。 阅读全文
posted @ 2024-02-13 20:56 兜尼完 阅读(84) 评论(0) 推荐(0) 编辑