Memory-Efficient Adaptive Optimization
Anil R., Gupta V., Koren T., Singer Y. Memory-efficient adaptive optimization. NeurIPS, 2019.
概
本文提出了一种 memory-efficient 的优化器: SM3.
符号说明
- , optimization rounds;
- , paramter vector;
- , convex loss function;
- , 梯度;
- , optimal paramter.
SM3
-
自适应的优化器 (AdaGrad) 形式如下:
然后每一步按照如下的规则更新:
-
的存在意味着我们需要 的额外存储. 作者提出的 SM3 将这个额外的存储消耗降低为 .
-
首先, 通过某种方式确定 个非空子集:
-
然后按照如下的方式更新:
-
可以注意到, 的存在相当于指定 的参数共享一个自适应的学习率. 特别的, 由于 不一定是互斥的, 所以每一次我们从中挑选一个最好的. 作者证明了这个方法的收敛性.
-
进一步的, 作者提出了一个更加的稳定的版本, 具有更好一点的 bound:
区间的划分
- 现在的问题是, 如何确定 , 作者给出的建议是, 对一个 的权重, 可以分别按行共享和按列共享, 从而需要 个缓存.
【推荐】国内首个AI IDE,深度理解中文开发场景,立即下载体验Trae
【推荐】编程新体验,更懂你的AI,立即体验豆包MarsCode编程助手
【推荐】抖音旗下AI助手豆包,你的智能百科全书,全免费不限次数
【推荐】轻量又高性能的 SSH 工具 IShell:AI 加持,快人一步
· Manus重磅发布:全球首款通用AI代理技术深度解析与实战指南
· 被坑几百块钱后,我竟然真的恢复了删除的微信聊天记录!
· 没有Manus邀请码?试试免邀请码的MGX或者开源的OpenManus吧
· 园子的第一款AI主题卫衣上架——"HELLO! HOW CAN I ASSIST YOU TODAY
· 【自荐】一款简洁、开源的在线白板工具 Drawnix
2021-09-10 Adversarial Detection methods
2020-09-10 Defending Adversarial Attacks by Correcting logits