摘要: TVM代码流程分析 TVM - 代码生成流程 本节主要介绍TVM的代码生成流程,即调用relay.build或tvm.build之后发生了什么,将深入到TVM的源代码进行剖析。(这里采用的依然是TVM v0.6) 首先区分两个build的区别:tvm.build主要针对单一算子(参照Tensor E 阅读全文
posted @ 2021-11-13 18:00 吴建明wujianming 阅读(689) 评论(1) 推荐(0) 编辑
摘要: TVM实现hardware backend官方的矩阵相加的示例如下:2个矩阵相加的实现for (int i = 0; i < n; ++i) { C[i] = A[i] + B[i];}怎么优化? 可以并行相加,如下for (int bx = 0; bx < ceil(n / 64); ++bx) 阅读全文
posted @ 2021-11-13 06:10 吴建明wujianming 阅读(643) 评论(0) 推荐(0) 编辑