摘要: 原理 为什么要使用INT8推理:更高的吞吐量/处理的fps提高以及更低的内存占用(8-bit vs 32-bit) 将FP32模型转换成INT8模型存在的挑战:更低的动态范围和精度 Consider that 32-bit floating-point can represent roughly 4 阅读全文
posted @ 2021-11-11 22:29 渐渐的笔记本 阅读(3435) 评论(0) 推荐(0) 编辑