MEC, Blockchain, reputation based crowdsourcing FL 笔记
参考文献
Mobile Edge Computing, Blockchain and Reputation based Crowdsourcing Federated Learning: A Secure, Decentralized and Privacy-preserving System
什么是Reputation based crowdsourcing
- 是一种激励机制
- 一开始,所有的顾客有相同的reputation
- 如果上传模型成功,则该用户获得奖励,reputation会增加。
- 如果用户被发现上传恶意模型,则reputation会减少。
- 用户的reputation影响着其参与crowdsourcing的机会。
- 在此篇论文中,信用信息由区块链存储。
什么是IPFS
- 区块链是一个有很多个block的链。每个block存了上一个block的hash,交易信息,时间戳。
- IPFS是一个peer-to-peer 分布式文件系统。让分布式的计算设备可以连接到相对应的文件上。
- 论文中,用IPFS实现链下存储,在区块链中不存实际文件,而是存数据位置的hashes。这个hash值可以用于定位文件的具体位置。
主要过程
- 阶段1:用户用手机和MEC server训练模型
- 阶段2: 制造商挑选用户和组织成为矿工,计算模型。并指任一个用户作为leader,将模型上传到区块链上。
框架
制造商
- 考虑为制造商造一个Crowdsourcing FL 的机器学习模型来更好的预测消费行为且促进家电产品
- 设定一个激励机制:
- 当用户为任务做出贡献,则会被奖励coins,而且这些coins可以用于换取服务等。
- reputation based crowdsourcing 机制。
- 放一个初始化模型到区块链中。否则,制造商需要将模型发送给每个人,且存储在第三方云中。初始模型的参数是随机选取的,如果有足够的人参加这个任务,最终是可以训练出一个令人满意的模型的。
消费者
- 消费者从区块链上下载最初的模型。
- 消费者从手机中提取特征。
- 由于不同的家庭电器的计算能力和存储能力有很大的差异,因此很难让所有IoT设备都训练模型。所以论文中使用的是先用一个手机提取出其他设备的数据。
- 然后开始用数据训练模型。MEC server由第三方提供,如果提供原数据,可能会存在潜在的安全问题。
- 手机训练:先在手机上用原始数据训练,然后获得特征。再对特征加差分隐私噪声。
- MEC server训练:手机将加了差分隐私噪音的特征和标签送到送到MEC server上,MEC server帮忙训练全连接层。训练完将损失传回手机,用于更新模型。
- 消费者将模型传到区块链上。
区块链
-
由于区块的大小限制,论文中用IPFS作为链下存储。
-
矿工的工作:
- 核实上传的模型。查看上传文件的签名是否有效,如果有效则放入交易池,否则拒绝。
- 更新模型:矿工要负责计算上传模型的参数平均,以获得FL 模型。