摘要: 量化技术 量化的概念 一般是高精度浮点数表示的网络权值以及激活值用低精度(例如8比特定点)来近似表示 达到模型轻量化,加速深度学习模型推理,目前8比特推理已经比较成熟 使用低精度的模型推理的优点: ①模型存储主要是每个层的权值,量化后模型占用空间小,32比特可以缩减至8比特 并且激活值用8比特后,减 阅读全文
posted @ 2020-07-20 22:29 you-wh 阅读(6959) 评论(0) 推荐(1) 编辑
Fork me on GitHub