摘要: 前言 单精度矩阵乘法(SGEMM)几乎是每一位学习 CUDA 的同学绕不开的案例,这个经典的计算密集型案例可以很好地展示 GPU 编程中常用的优化技巧。本文将详细介绍 CUDA SGEMM 的优化手段,适合认真阅读过《CUDA C++Programming Guide》,具备一定 CUDA 编程基础 阅读全文
posted @ 2023-11-18 14:47 CV技术指南(公众号) 阅读(451) 评论(0) 推荐(0) 编辑