2023 年 4月 25 日随笔档案 - MegEngine

摘要：常见神经网络模型所用的 Tensor 数据类型一般是 float32 类型，而工业界出于对特定场景的需求（极少的计算资源，极致的推理速度），需要把模型的权重和或激活值转换为位数更少的数值类型（比 int8, float16） —— 整个过程被称为量化（Quantization）。阅读全文

posted @ 2023-04-25 17:49 MegEngine 阅读(76) 评论(0) 推荐(0) 编辑