摘要: 问题:对于使用GPU计算时,都想知道kernel函数运行所耗费的时间,使用CUDA内置的API可以方便准确的获得kernel运行时间。 在CPU上,可以使用clock()函数和GetTickCount()函数计时。 对于CUDA核函数计时使用clock()或GetTickCount()函数结果不准确 阅读全文
posted @ 2019-08-27 15:58 小小一步 阅读(2343) 评论(0) 推荐(1) 编辑