5、模型量化

1、”PTQ Post Training Quantization 是训练后量化,也叫做离线量化,根据量化零点 xzero_pointxzero_point 是否为 0,训练后量化分为对称量化和非对称量化;根据数据通道顺序 NHWC(TensorFlow) 这一维度区分,训练后量化又分为逐层量化和逐通道量化。目前 nvidia 的 TensorRT 框架中使用了逐层量化的方法,每一层采用同一个阈值来进行量化。逐通道量化就是对每一层每个通道都有各自的阈值,对精度可以有一个很好的提升。

参考资料

一文搞懂模型量化基础-云社区-华为云 (huaweicloud.com)

posted @ 2023-12-05 20:25  多一些不为什么的坚持  阅读(59)  评论(0编辑  收藏  举报