摘要: CUDA编程实战书中的乘方和解决办法:对一个数组执行某种计算,然后产生一个更小的结果数组。由一个线程在共享内存上进行迭代并计算出总和值。而如果用并行,所花时间就与数组长度的对数成正比。代码的思想是,每个线程将cache[]中的两个值加和,然后结果保存回cache[]。由于每个线程都将两个值合并为一个... 阅读全文
posted @ 2015-12-29 10:38 [6G]蓝色の云风 阅读(340) 评论(0) 推荐(0) 编辑