用Nsight Compute测试remote端的CUDA性能(windows测linux)
网上没找到简易的教程,记录一下。挺好用的。
(1)点击connect
(2)输入必要信息
(3)选择测试内容
具体的含义和nvprof的metrics一样,other选项卡里面可以配置特定的metrics,见 https://s0docs0nvidia0com.icopy.site/cuda/profiler-users-guide/index.html#metrics-reference
(4)点击connect测试
有内存使用情况、资源情况的图表等,还有添加baseline对比、评价等功能
注意事项:需要使用ROOT连接remote,remote需要root可以ssh
参考文档:
https://devblogs.nvidia.com/using-nsight-compute-to-inspect-your-kernels/