摘要: 在Cuda上部署量化模型 介绍TVM自动量化。自动量化是TVM中的一种量化方式。将在ImageNet上导入一个GluonCV预先训练的模型到Relay,量化Relay模型,然后执行推理。 import tvm from tvm import te from tvm import relay impo 阅读全文
posted @ 2021-11-02 05:16 吴建明wujianming 阅读(146) 评论(0) 推荐(0) 编辑