摘要:
TVM代码流程分析 TVM - 代码生成流程 本节主要介绍TVM的代码生成流程,即调用relay.build或tvm.build之后发生了什么,将深入到TVM的源代码进行剖析。(这里采用的依然是TVM v0.6) 首先区分两个build的区别:tvm.build主要针对单一算子(参照Tensor E 阅读全文
摘要:
TVM实现hardware backend官方的矩阵相加的示例如下:2个矩阵相加的实现for (int i = 0; i < n; ++i) { C[i] = A[i] + B[i];}怎么优化? 可以并行相加,如下for (int bx = 0; bx < ceil(n / 64); ++bx) 阅读全文