摘要: 【C/C++】Johny's Software Lab Welcome to Johny’s Software Lab, a blog for all interested in fast software written in C and C++. 【综合】FindHao 科研工作者的自白 【GP 阅读全文
posted @ 2022-07-19 15:39 专注于GPU的程序员 阅读(59) 评论(0) 推荐(0) 编辑
摘要: Roofline 模型 Roof-line Model 解决的,是“计算量为A且访存量为B的模型在算力为C且带宽为D的计算平台所能达到的理论性能上限E是多少”这个问题。 参考资料 Roofline Model与深度学习模型的性能分析 NVIDIA - Nsight Compute - Rooflin 阅读全文
posted @ 2022-07-19 15:14 专注于GPU的程序员 阅读(80) 评论(0) 推荐(0) 编辑