paper170:CVPR2020网络量化和压缩 Adaptive loss-aware quantization for multi-bi networks
要点简介
1、概括性介绍
1)无论是图像压缩/视频压缩,还是其他典型的任务,因为参数的全量化精度开销很大,所以部署问题就变得很关键。
2)神经网络量化本身就是为了追求压缩比和性能之间的平衡,量化分为均匀量化、非均匀量化和细粒度量化等,而细粒度量化是指卷积网络的某一层对其参数权重分组,分组后在进行非均匀量化。从而给微量化提供了更多的选择,从而提高了性能。
3)本文就是结合训练和量化的策略,在训练过程中通过优化的方式逐步的降低比特位,但是,非凸量化算法找到最优值。