摘要: 探索 TVM 进行量化方法 Relay框架 如上图所示,有两种不同的并行工作正在进行中 自动整数量化 - 采用 FP32 框架图,在 Relay 中自动转换为 Int8。 接受预量化整数模型 - 这种方法接受预量化模型,引入称为 QNN 的Relay方言,生成 Int8 Relay图。 关于 Rel 阅读全文
posted @ 2021-10-03 06:18 吴建明wujianming 阅读(666) 评论(0) 推荐(0) 编辑