Chmiel B., Banner R., Hoffer E., Yaacov H. B. and Soundry D. Accurate neural training with 4-bit matrix multiplications at standard formats. ICLR, 2023.
概
本文希望实现 4-bit 的模型训练和推理. 提出了一种 logarithmic unbiased quantization (LUQ).
Logarithmic Unbiased Quantization
-
作者认为, 无偏量化在反向传播中尤为重要因为这保证在期望上和普通的优化策略的一致性. 又梯度整体呈现对数形状, 如何在这些条件下进行量化催生了本文 LUQ.
-
Stochastic underflow: 首先, 对梯度进行一个随机'裁剪':
Tα(x)=⎧⎪
⎪
⎪⎨⎪
⎪
⎪⎩x,if |x|≥α,sign(x)⋅αwith a probability |x|α,if |x|<α,0with a probability 1−|x|α,if |x|<α.
这里取 α=max(|x|/22b−1).
-
Logarithmic SR: 对数量化是选择 bins:
{α,2α,…,22b−1α},
然后按照如下的方式进行 stochastic rounding. 对于 2n−1α<x<2nα:
Qα(x)=⎧⎨⎩2n−1αwith a probability 2nα−x2nα−2n−1α,2nαwith a probability 1−2nα−x2nα−2n−1α.
作者为了进一步优化这个稍显复杂的 rounding, 提出了 RDNP. 可惜这部分我没咋看懂, (2n+2n−1)/2=3/4⋅2n−1?.
代码
[代码在 supplementary material 中]
【推荐】国内首个AI IDE,深度理解中文开发场景,立即下载体验Trae
【推荐】编程新体验,更懂你的AI,立即体验豆包MarsCode编程助手
【推荐】抖音旗下AI助手豆包,你的智能百科全书,全免费不限次数
【推荐】轻量又高性能的 SSH 工具 IShell:AI 加持,快人一步
· Manus重磅发布:全球首款通用AI代理技术深度解析与实战指南
· 被坑几百块钱后,我竟然真的恢复了删除的微信聊天记录!
· 没有Manus邀请码?试试免邀请码的MGX或者开源的OpenManus吧
· 园子的第一款AI主题卫衣上架——"HELLO! HOW CAN I ASSIST YOU TODAY
· 【自荐】一款简洁、开源的在线白板工具 Drawnix
2023-12-24 Graph Condensation for Graph Neural Networks