2022 年 10月 25 日随笔档案 - 凌逆战

2022年10月25日

摘要：在深度学习中，量化指的是使用更少的bit来存储原本以浮点数存储的tensor，以及使用更少的bit来完成原本以浮点数完成的计算。这么做的好处主要有如下几点：更少的模型体积，接近4倍的减少；可以更快的计算，由于更少的内存访问和更快的int8计算，可以快2~4倍。一个量化后的模型，其部分或者全部的阅读全文

posted @ 2022-10-25 20:41 凌逆战阅读(8368) 评论(2) 推荐(2) 编辑

公告