摘要: 性能分析工具pyTorch Profiling CANN Profiling 看task duration 调优手段1:使用亲和的数据类型 用AMP训练 AICore不支持torch.long.Tensor类型,会自动切换AICPU,影响训练。 调优手段2:优化调度耗时(融合tensor) 融合算子 阅读全文
posted @ 2024-07-24 15:32 ITJAMESKING 阅读(21) 评论(0) 推荐(0) 编辑
摘要: 迁移的基本流程 第一步:算子满足度分析 方法一 在pytorch profiler在GPU上提取算子 方法二 使用CANN分析迁移工具 第二步: 配置相关硬件环境,在pytorch的基础上安装pytorch adapt; 模型迁移-手工迁移(单Device代码迁移) 导入NPU相关库(pyTORCH 阅读全文
posted @ 2024-07-24 10:09 ITJAMESKING 阅读(9) 评论(0) 推荐(0) 编辑