摘要: 量化 量化就是将神经网络的浮点算法转换为定点。 量化有若干相似的术语。低精度(Low precision)可能是最通用的概念。常规精度一般使用 FP32(32位浮点,单精度)存储模型权重;低精度则表示 FP16(半精度浮点),INT8(8位的定点整数)等等数值格式。不过目前低精度往往指代 INT8。 量化 阅读全文
posted @ 2022-01-11 11:28 心如__止水 阅读(366) 评论(0) 推荐(0) 编辑