摘要: 由上一节可知,在main函数中,cuda程序的并行能力是在add<<<N,1>>>( dev_a, dev_b, dev_c )函数中体现的,这里面设置的是由N个block的构成的计算网络即grid,每一个block里面有1个thread存在。那么这种选取有什么用意呢,如何针对自己的计算问题设置计算 阅读全文
posted @ 2017-05-26 17:29 乱麻 阅读(7952) 评论(0) 推荐(0) 编辑