【五期李伟平】CCF-A(TMC'22)Enabling Long-Term Cooperation in Cross-Silo Federated Learning: A Repeated Game Perspective
针对重复执行跨筒仓联邦学习过程中如何保持客户积极参与(增加训练时使用的数据量、减少搭便车行为),本文提出合作的、子博弈完美纳什均衡(SPNE)的无限重复博弈。本文模型将无限时间划分为一个个时隙,一个时隙进行一次子博弈,时隙的具体划分有更具体的场景决定(例如银行的一个月或医院的一周)。客户端的成本包括1模型精度损失2计算3通信4服务端服务费。本文首先提出一个单阶段的博弈,分析博弈均衡;随后基于单阶段博弈计算重复博弈,得到重复博弈条件下单阶段博弈的均衡;最后通过添加一种惩罚机制,实现子博弈完美均衡的重复博弈。Zhang, Ning , Q. Ma , and X. Chen . "Enabling Long-Term Cooperation in Cross-Silo Federated Learning: A Repeated Game Perspective." (2022).
从论文写作上,方案从单阶段博弈到重复博弈再到子博弈完美,层层推进,思路明确。
默认客户端诚实上报自己的各种信息,没有考虑错误报告的情况。假定各客户端持有数据量相同,且该数据量参数在推导过程中比较重要。
2023年12月27日