Loading

合集-cuda优化

摘要:在CUDA程序中, 访存优化个人认为是最重要的优化项. 往往kernel会卡在数据传输而不是计算上, 为了最大限度利用GPU的计算能力, 我们需要根据GPU硬件架构对kernel访存进行合理的编写. 阅读全文
posted @ 2024-06-17 15:31 SunStriKE 阅读(2445) 评论(0) 推荐(1)
摘要:介绍CUDA的基本概念和架构,帮助读者建立对CUDA的初步认识,包括硬件架构/CUDA基础等内容 阅读全文
posted @ 2024-06-06 19:49 SunStriKE 阅读(873) 评论(0) 推荐(0)
摘要:对triton中的基本语法和cuda进行对照学习 阅读全文
posted @ 2025-02-21 21:04 SunStriKE 阅读(708) 评论(0) 推荐(0)