爨爨爨好

  博客园  :: 首页  :: 新随笔  :: 联系 :: 订阅 订阅  :: 管理

2017年10月12日

摘要: ▶ 计算矩阵矩阵乘法 Am×n Bn×p == Cm×p 过程。 ▶ 原始矩阵乘法,一个线程计算结果矩阵中的一个元素。 1 #include <stdio.h> 2 #include <stdlib.h> 3 #include <malloc.h> 4 #include <time.h> 5 #in 阅读全文
posted @ 2017-10-12 23:39 爨爨爨好 阅读(410) 评论(0) 推荐(0) 编辑

摘要: ▶ P46。SPMD (Single-Program Multiple-Data) 单程序多数据,CUDA使用的并行编程风格。并行处理单元在数据的多个部分执行相同程序,但这些处理单元不用同时执行限购通的指令;SIMD (Single-Instruction Multiple-Data) 单指令多数据 阅读全文
posted @ 2017-10-12 11:18 爨爨爨好 阅读(617) 评论(3) 推荐(0) 编辑

摘要: ▶ 直接的矩阵加法,没有优化 ▶输出结果,对于超大型矩阵的加法计算,左下图为一维跳转,右下图为二维跳转。矩阵较大时初始化矩阵费时较多。超大矩阵的计算上GPU相对CPU产生了一定的优势,一维跳转比二维跳转稍快,因为省去了复杂的下标映射。 ▶ 对于较小的矩阵,GPU没有发挥出优势, 因为内存拷贝等方面耗 阅读全文
posted @ 2017-10-12 10:03 爨爨爨好 阅读(486) 评论(0) 推荐(0) 编辑