Accurate Neural Training with 4-bit Matrix Multiplications at Standard Formats

Chmiel B., Banner R., Hoffer E., Yaacov H. B. and Soundry D. Accurate neural training with 4-bit matrix multiplications at standard formats. ICLR, 2023.

本文希望实现 4-bit 的模型训练和推理. 提出了一种 logarithmic unbiased quantization (LUQ).

Logarithmic Unbiased Quantization

  • 作者认为, 无偏量化在反向传播中尤为重要因为这保证在期望上和普通的优化策略的一致性. 又梯度整体呈现对数形状, 如何在这些条件下进行量化催生了本文 LUQ.

  • Stochastic underflow: 首先, 对梯度进行一个随机'裁剪':

    Tα(x)={x,if |x|α,sign(x)αwith a probability |x|α,if |x|<α,0with a probability 1|x|α,if |x|<α.

    这里取 α=max(|x|/22b1).

  • Logarithmic SR: 对数量化是选择 bins:

    {α,2α,,22b1α},

    然后按照如下的方式进行 stochastic rounding. 对于 2n1α<x<2nα:

    Qα(x)={2n1αwith a probability 2nαx2nα2n1α,2nαwith a probability 12nαx2nα2n1α.

    作者为了进一步优化这个稍显复杂的 rounding, 提出了 RDNP. 可惜这部分我没咋看懂, (2n+2n1)/2=3/42n1?.

代码

[代码在 supplementary material 中]

posted @   馒头and花卷  阅读(10)  评论(0编辑  收藏  举报
相关博文:
阅读排行:
· Manus重磅发布:全球首款通用AI代理技术深度解析与实战指南
· 被坑几百块钱后,我竟然真的恢复了删除的微信聊天记录!
· 没有Manus邀请码?试试免邀请码的MGX或者开源的OpenManus吧
· 园子的第一款AI主题卫衣上架——"HELLO! HOW CAN I ASSIST YOU TODAY
· 【自荐】一款简洁、开源的在线白板工具 Drawnix
历史上的今天:
2023-12-24 Graph Condensation for Graph Neural Networks
点击右上角即可分享
微信分享提示