摘要:
【C/C++】Johny's Software Lab Welcome to Johny’s Software Lab, a blog for all interested in fast software written in C and C++. 【综合】FindHao 科研工作者的自白 【GP 阅读全文
摘要:
Roofline 模型 Roof-line Model 解决的,是“计算量为A且访存量为B的模型在算力为C且带宽为D的计算平台所能达到的理论性能上限E是多少”这个问题。 参考资料 Roofline Model与深度学习模型的性能分析 NVIDIA - Nsight Compute - Rooflin 阅读全文