联邦学习FedAvg记录
Notation
符号 | 含义 |
---|---|
总目标函数 | |
待优化参数 | |
第 |
|
第 |
|
每个local update的次数 | |
总迭代次数,即通讯次数为 |
|
函数 |
|
函数 |
|
最优函数值 | |
单独对第 |
|
最优参数 | |
client |
假设
- 函数
为 ,对于所有的 - 函数
为 ,对于所有的 - client
每次计算的随机梯度的方差是 有界的 - 所有计算的随机梯度的范数是
有界的
全参与下的收敛性证明
引入两个变量,
定义
由于
个人理解:
要证明收敛性需要证明,参数是收敛的,由于参数
是根据梯度下降求出来的,所以需要证明, 即当前迭代的参数和最优点的
的距离是小于上一次迭代参数与最优参数的距离,而且 函数是可以递推的。也就是说,当前迭代的参数和最优点的 的距离的上界是逐渐减小的。
文章没有选择
而是选择了 ,因为 是对应所有client的,在部分参与的场景下, 是偏差的。
上面之所以拆分出
对于
根据
因为二范数为凸函数再结合
对于
根据可惜施瓦茨不等式和矩阵不等式得到
根据
因此
拿出后面的
第三个等号将
综上所述,
最后一个不等式取得的原因是
因此
加上梯度方差有限假设,即
因此最终,令
【推荐】国内首个AI IDE,深度理解中文开发场景,立即下载体验Trae
【推荐】编程新体验,更懂你的AI,立即体验豆包MarsCode编程助手
【推荐】抖音旗下AI助手豆包,你的智能百科全书,全免费不限次数
【推荐】轻量又高性能的 SSH 工具 IShell:AI 加持,快人一步
· AI与.NET技术实操系列(二):开始使用ML.NET
· 记一次.NET内存居高不下排查解决与启示
· 探究高空视频全景AR技术的实现原理
· 理解Rust引用及其生命周期标识(上)
· 浏览器原生「磁吸」效果!Anchor Positioning 锚点定位神器解析
· DeepSeek 开源周回顾「GitHub 热点速览」
· 物流快递公司核心技术能力-地址解析分单基础技术分享
· .NET 10首个预览版发布:重大改进与新特性概览!
· AI与.NET技术实操系列(二):开始使用ML.NET
· .NET10 - 预览版1新功能体验(一)