模型量化简介
参考文献:https://cloud.tencent.com/developer/article/2027600
模型量化分为权重量化、激活值量化。将浮点数以定点数的形式表达,达到减少参量、加速运算和减少占用内存的目的。但实际上,只能确定可以减少参量,能不能加速运算要看具体的量化方法和网络结构。
量化:Q=clamp(ROUND(R/S+Z))
反量化:R=(Q-Z)*S
一些疑问:
为什么不在一开始就采取定点数的方式进行训练呢?主要是容易发生欠拟合,定点数参与训练容易发生梯度消失。
模型量化对分类任务的影响有限,对预测框、点的影响较大。这是因为精度损失累加造成的影响,而分类任务的正类只需要输出一个相对大的值,预测任务则要输出一个准确的值。
激活值量化要比权重量化的影响大一些。
【推荐】国内首个AI IDE,深度理解中文开发场景,立即下载体验Trae
【推荐】编程新体验,更懂你的AI,立即体验豆包MarsCode编程助手
【推荐】抖音旗下AI助手豆包,你的智能百科全书,全免费不限次数
【推荐】轻量又高性能的 SSH 工具 IShell:AI 加持,快人一步
· 基于Microsoft.Extensions.AI核心库实现RAG应用
· Linux系列:如何用heaptrack跟踪.NET程序的非托管内存泄露
· 开发者必知的日志记录最佳实践
· SQL Server 2025 AI相关能力初探
· Linux系列:如何用 C#调用 C方法造成内存泄露
· 终于写完轮子一部分:tcp代理 了,记录一下
· 震惊!C++程序真的从main开始吗?99%的程序员都答错了
· 别再用vector<bool>了!Google高级工程师:这可能是STL最大的设计失误
· 单元测试从入门到精通
· 【硬核科普】Trae如何「偷看」你的代码?零基础破解AI编程运行原理