摘要: 支持的TVM硬件后端概述 下图显示了 TVM 目前支持的硬件后端: 在本教程中,将选择 cuda 和 llvm 作为目标后端。首先,让导入 Relay 和 TVM。 import numpy as np from tvm import relay from tvm.relay import test 阅读全文
posted @ 2022-07-22 23:55 牛犁heart 阅读(619) 评论(0) 推荐(0) 编辑
摘要: TensorIR是一种用于深度学习的特定领域语言,主要有两个目的。 在各种硬件后端进行程序变换和优化的实现 用于自动张量化程序优化的抽象 import tvm from tvm.script.parser import ir_module from tvm.ir.module import IRMo 阅读全文
posted @ 2022-07-22 21:36 牛犁heart 阅读(409) 评论(0) 推荐(0) 编辑
摘要: 与基于模板的AutoTVM不同(会依赖手动模板定义搜索空间),自动调度器不需要任何模板。用户只需要编写计算声明,而不需要任何调度命令或模板。自动调度器可以自动生产一个大的搜索空间,并在空间中找到一个好的调度。 本节以矩阵乘法为例 导入依赖包 import os import numpy as np 阅读全文
posted @ 2022-07-22 20:45 牛犁heart 阅读(149) 评论(0) 推荐(0) 编辑