摘要: TVM图级优化按照优化范围,可分为局部优化和全局优化 局部优化是TVM图级优化的重点,其中算子融合是AI编译器必不可少的优化方法。 算子融合核心思想就是将多个算子合并成一个内核,因而无需将中间结果写回全局内存,减少了中间变量的分配,也减少了片上缓存和片外存储之间的数据传输。 那算子融合也是有条件的, 阅读全文
posted @ 2023-03-27 00:13 牛犁heart 阅读(242) 评论(0) 推荐(0) 编辑