联邦学习(Federated Learning)
联邦学习的思想概括为:一种无需交换数据(只交换训练中间参数或结果)的分布式机器学习技术,在保护数据隐私的同时实现数据共享,解决数据孤岛问题。
本文仅介绍基本概念,详细请查看文末参考资料。
基本概念
联邦学习(Federated Learning)是一种分布式机器学习技术,其核心思想是通过在多个拥有本地数据的数据源之间进行分布式模型训练,在不需要交换本地个体或样本数据的前提下,仅通过 交换模型参数或中间结果
的方式,构建基于虚拟融合数据下的全局模型,从而实现数据隐私保护和数据共享计算的平衡,即“数据可用不可见”、“数据不动模型动”的应用新范式。
分类
联邦学习可依据数据集的特点分为 三类
:
PS:通常,数据矩阵的横向的一行表示一条训练样本,而纵向的一列表示一个数据特征(标签)
- 横向联邦学习(Horizontal Federated Learning)
横向联邦学习一般用于特征重叠较多但样本重叠较少的数据集 - 纵向联邦学习(Vertical Federated Learning)
纵向联邦学习与之相反,一般用于样本重叠较多但特征重叠较少的数据集 - 联邦迁移学习(Federated Transfer Learning)
联邦迁移学习适用于两者都重叠较少的数据集