对拜占庭攻击鲁棒的异分布数据分布学习的梯度更新方法RSA
主体内容
这篇文章主要是在说,当在distributed leanring
存在Byzantine attack
,即可以向中央服务器发送任何内容导致最终结果出现bias
,以及各个client
之间不满足同分布的假设下该如何进行学习。
文章的formula
如下:
作者把中央服务器的参数和每个客户的参数分隔开,最后通过
作者证明了当
作者这样设计的算法有下面这样的优势:
- 同样面对
Byzantine attack
,相比于计算geometric mean
之类的aggregation method
这样的更新方式更为简便 - 算法设计时考虑了异分布的情况,更贴合实际
client
和server
的参数不一定相同,client
可以保留personal
的参数
定理证明
Proposition 1
这个命题是在说,一个p-norm
的subgradient
集合等于另一个集合。
集合相等的证明需要证明两个集合中的元素都相同,或者证明两个集合相互包含。
作者首先根据subgradient
的定义证明了凡是属于
在证明p-norm
在
Theroem 1
定理一是在说,当formula
得到的结果是一样的。
自己的想法:客户的目标函数都是
convex
的,加总得到的中央服务器的目标函数也是convex
的,那么一定存在使得中央服务器最优的参数,然后中央服务器 广播出去,每个 client
得到。在我之前的理解下,如果 client
的数据是异分布的,那么他们有不同的行为习惯,那么应该得到不同的最后参数。例如,一个客户喜欢自行车上班,另一个客户喜欢公交车上班,那么在给两人推荐的路线就应该是不同的。但是按照上面的分析,每个 client
得到的最终参数是相同的。我在想异分布和个性化到底存在什么联系?
这个证明特别有意思,
首先作者证明了formula
中的式子进行代换,
然后就得到了formula
的解。
其实这个定理不很直接易得的,第二个formula
是第一个formula
的slack版本,那么第一个都得到了那么第二个也是最优的。
Theorem 2
定理二涉及的就是最终收敛性的证明。终于到达最后的收敛性证明了,其实收敛性证明也是有规范可循的。
因为作者这里的client
和server
都需要证明一下啊但是基本上大同小异。
先来看regular work的update rule,其中convex
,strongly-convex
,bounded variance of gradient
等假设来进行。
首先来看
得到这样之后,虽然跟
其中最后一个不等式用到了Proposition 1,即次梯度
再对
然后可以再利用[2]中p66中的定理,可以得到
其中第二个不等式通过了对学习率
现在转向server
端的参数更新,证明方式大同小异,
同样将更新规则带入整理得到四项,对于第二项和第三项,与regular worker
不同,要将Byzantine
的client
去除掉,再利用同样的缩放技巧。对于第四项,则直接利用AM-GM inequality
可以得到
server
的式子缩放整理可以得到
无论是client
还是server
最后的式子中都有一个
最终得到的结果就是下面这个样子
作者在这里讨论了学习率telescopic cancellation
就可以得到,如果是随着步数变化的学习率的话(一般是
文章最后说的
总结和心得
- 作者这样
formula
给个性化的参数提供了另一种思路,但是个性化和全局最优的 到底存在什么联系还需要进一步探究。 - 收敛性证明的格式基本如上所示,常用到
AM-GM
,holder-inequality
, ,在证明中会用到学习率 的条件来消除某些不好处理的项。如果学习率是变动的那么则要使用归纳法。
【推荐】国内首个AI IDE,深度理解中文开发场景,立即下载体验Trae
【推荐】编程新体验,更懂你的AI,立即体验豆包MarsCode编程助手
【推荐】抖音旗下AI助手豆包,你的智能百科全书,全免费不限次数
【推荐】轻量又高性能的 SSH 工具 IShell:AI 加持,快人一步
· AI与.NET技术实操系列(二):开始使用ML.NET
· 记一次.NET内存居高不下排查解决与启示
· 探究高空视频全景AR技术的实现原理
· 理解Rust引用及其生命周期标识(上)
· 浏览器原生「磁吸」效果!Anchor Positioning 锚点定位神器解析
· DeepSeek 开源周回顾「GitHub 热点速览」
· 物流快递公司核心技术能力-地址解析分单基础技术分享
· .NET 10首个预览版发布:重大改进与新特性概览!
· AI与.NET技术实操系列(二):开始使用ML.NET
· .NET10 - 预览版1新功能体验(一)