摘要:
 阅读全文
随笔分类 - GPU编程与并行计算
CPU Hardwar
2017-08-11 09:28 by ☆Ronny丶, 368 阅读, 收藏, 编辑
摘要:
GPU负责把线程块分配到各个SM上处理。 CUDA对申请的线程块何时运行,以及在哪个SM上运行是没有保证的。这恰好是GPU的优势,这种方式带来了灵活性,不需程序根据SM的数量去配置程序。 但是一个block内的线程执行好像是按顺序启动的,一个block内的所有线程都是在同一个SM上的。 下面程序的打 阅读全文
Rgb2Gray
2017-08-11 08:34 by ☆Ronny丶, 1115 阅读, 收藏, 编辑
摘要:
GPU上运行的函数又称为Kernel,用 修饰 调用Kernel函数时,用 block_shape与thread shape都是一个三维的结构dim(x,y,z), 其中x为横向,y为纵向。变化最快的维度为x,其他为y,最后为z。所以维度为(i,j,k)的thread或block的Index实际上是 阅读全文