摘要: 常见神经网络模型所用的 Tensor 数据类型 一般是 float32 类型, 而工业界出于对特定场景的需求(极少的计算资源,极致的推理速度),需要把模型的权重和或激活值转换为位数更少的数值类型(比 int8, float16) —— 整个过程被称为量化(Quantization)。 阅读全文
posted @ 2023-04-25 17:49 MegEngine 阅读(76) 评论(0) 推荐(0) 编辑