代码改变世界

随笔分类 -  GPU编程与并行计算

GPU Memory Hierarchy

2017-08-11 09:47 by ☆Ronny丶, 387 阅读, 收藏, 编辑
摘要: ![](http://images2017.cnblogs.com/blog/378920/201708/378920-20170811094552120-1252022082.png) 阅读全文

CPU Hardwar

2017-08-11 09:28 by ☆Ronny丶, 368 阅读, 收藏, 编辑
摘要: GPU负责把线程块分配到各个SM上处理。 CUDA对申请的线程块何时运行,以及在哪个SM上运行是没有保证的。这恰好是GPU的优势,这种方式带来了灵活性,不需程序根据SM的数量去配置程序。 但是一个block内的线程执行好像是按顺序启动的,一个block内的所有线程都是在同一个SM上的。 下面程序的打 阅读全文

Rgb2Gray

2017-08-11 08:34 by ☆Ronny丶, 1115 阅读, 收藏, 编辑
摘要: GPU上运行的函数又称为Kernel,用 修饰 调用Kernel函数时,用 block_shape与thread shape都是一个三维的结构dim(x,y,z), 其中x为横向,y为纵向。变化最快的维度为x,其他为y,最后为z。所以维度为(i,j,k)的thread或block的Index实际上是 阅读全文
点击右上角即可分享
微信分享提示