模型量化简介

参考文献:https://cloud.tencent.com/developer/article/2027600

模型量化分为权重量化、激活值量化。将浮点数以定点数的形式表达,达到减少参量、加速运算和减少占用内存的目的。但实际上,只能确定可以减少参量,能不能加速运算要看具体的量化方法和网络结构。

量化:Q=clamp(ROUND(R/S+Z))

反量化:R=(Q-Z)*S

一些疑问:

为什么不在一开始就采取定点数的方式进行训练呢?主要是容易发生欠拟合,定点数参与训练容易发生梯度消失。

模型量化对分类任务的影响有限,对预测框、点的影响较大。这是因为精度损失累加造成的影响,而分类任务的正类只需要输出一个相对大的值,预测任务则要输出一个准确的值。

 激活值量化要比权重量化的影响大一些。

posted @   澳大利亚树袋熊  阅读(115)  评论(0编辑  收藏  举报
编辑推荐:
· 基于Microsoft.Extensions.AI核心库实现RAG应用
· Linux系列:如何用heaptrack跟踪.NET程序的非托管内存泄露
· 开发者必知的日志记录最佳实践
· SQL Server 2025 AI相关能力初探
· Linux系列:如何用 C#调用 C方法造成内存泄露
阅读排行:
· 终于写完轮子一部分:tcp代理 了,记录一下
· 震惊!C++程序真的从main开始吗?99%的程序员都答错了
· 别再用vector<bool>了!Google高级工程师:这可能是STL最大的设计失误
· 单元测试从入门到精通
· 【硬核科普】Trae如何「偷看」你的代码?零基础破解AI编程运行原理
点击右上角即可分享
微信分享提示