隐私计算框架

本文统计当前较为火热隐私计算框架:

image

PySyft

PySyft 是开源社区 OpenMined 开源的隐私计算框架, 主要针对实现基于隐私计算的深度学习。 PySyft 将联 邦学习、多方安全计算以及差分隐私、远程执行等技术 结合在一个编程模型中并集成到不同的深度学习框架 中, 如 PyTorch、 Keras 或 TensorFlow;

PySyft是一个灵活、易用的库,能够对深度学习模型进行私有和安全计算,用于安全和隐私深度学习的Python库,它在主流深度学习框架(例如PyTorch和TensorFlow)中使用联邦学习,差分隐私和加密计算(例如多方计算(MPC)和同态加密(HE))将隐私数据与模型训练分离。能够应用到移动终端机器学习、人工智能、数据中心、消费电子、内存安全等场景。

地址

A library for answering questions using data you cannot see

openmined开源社区

FederatedScope

阿里巴巴达摩院发布新型联邦学习框架FederatedScope,该框架支持大规模、高效率的联邦学习异步训练,能兼容不同设备运行环境,且提供丰富功能模块,大幅降低了隐私保护计算技术开发与部署难度。该框架现已面向全球开发者开源。

该框架使用事件驱动的编程范式来构建联邦学习,即将联邦学习看成是参与方之间收发消息的过程,通过定义消息类型以及处理消息的行为来描述联邦学习过程。通过这一方式,FederatedScope实现了支持在丰富应用场景中进行大规模、高效率的联邦学习异步训练。
image

同时,达摩院团队对FederatedScope训练模块进行抽象,使其不依赖特定的深度学习后端,能兼容PyTorch、Tensorflow等不同设备运行环境,大幅降低了联邦学习在科研与实际应用中的开发难度和成本。

为进一步适应不同应用场景,FederatedScope还集成了多种功能模块,包括自动调参、隐私保护、性能监控、端模型个性化等。FederatedScope支持开发者通过配置文件便捷地调用集成模块,方便快速入门;也允许通过注册的方式添加新的算法实现并调用,支持定制化及深度开发。

地址

An easy-to-use federated learning platform

隐语

蚂蚁推出了隐私计算框架——隐语,这是蚂蚁集团经过多年独立自主研发和业务应用打磨而构建的一套统一框架,旨在解决数据价值的安全流动这一行业难题。

该框架有两个层次,上面一层是编译器,通过新的编译器技术,我们可以将整个执行图自动编译成密态计算图,并对其进行一系列的优化。下面一次是分布在不同参与方的 PPU(Privacy Preserving Unit),每一个 PPU 提供可信可证可度量的基础计算能力。由编译器生成的密态计算图会被分发到 PPU 上进行计算,最终产出用户需要的计算结果。

蚂蚁集团的隐私计算技术架构——隐语,具有以下几个特点:

可扩展性,支持当前主流的机器学习的框架,上层可对接包括 TensorFlow、Pytorch、JAX 在内的多种主流机器学习框架,以及 SQL 前端;下层可以链接包括 SS、HE、GC 在内的多种安全协议。

隐私保护能力:支持包括可信安全、可度量安全和可证安全在内的多种隐私计算能力。

计算效率:目前隐私计算最大的问题在于性能瓶颈,蚂蚁集团对框架做了多方面的优化,包括 Platform + PPU 的双层设计可以提供分层优化能力,可以提供业界顶尖的计算性能和计算规模。

Delta

因问科技开发,开箱即用的区块链隐私计算框架。

可以联合分散在各处的数据,进行统计计算以及机器学习,数据全程不会离开本地,实现了数据的可用不可见,可应用于金融、医疗、政府、知识产权等领域,实现联合风控、联合科研、政企数据连接等需求,充分发挥数据的价值。
Delta通过封装整合联邦学习、安全多方计算、差分隐私等最新的隐私计算技术,降低了开发门槛,使用者无需了解隐私计算技术,也可快速实现计算需求。 用户可以快速地部署Delta节点,搭建隐私计算网络,联合多方数据,完成隐私计算。
Delta保证了计算结果的可信性,在用户无法获取原始数据的前提下,通过集成的区块链和零知识证明技术验证计算结果的正确性。

Delta包含了搭建一个完整的区块链隐私计算网络的全部组件,每个组件都可以使用Docker镜像快速部署。开发者可以根据需要选择需要的组件快速完成网络的搭建。
Delta对隐私计算底层技术进行了彻底的封装,编写隐私计算任务无需对底层的原理有任何了解。Delta中的隐私计算任务使用Python语言开发,支持流行的机器学习框架PyTorch。开发者只需编写传统的PyTorch训练任务,Delta可自动完成训练任务的隐私计算化,并且在网络中完成任务的执行。

地址

Delta开发文档

Out-of-the-Box Blockchain-powered Verifiable PPC Framework

CryptGPU

论文:CryptGPU: Fast Privacy-Preserving Machine Learning on the GPU
目前大多数基于安全多方计算(MPC)的隐私保护机器学习方案都是运行在CPU上的,但是在明文机器学习领域GPU已经成为一项不可缺少的硬件设备。GPU强大的算力能够大大加快机器学习模型,尤其是神经网络的计算速度。为了让MPC的隐私保护机器学习方案也能够充分利用GPU的计算性能、加快基于MPC的隐私保护机器学习训练和预测效率,本文提出了CryptGPU。

本文的主要贡献在于将基于MPC的密码学协议迁移到GPU上,实现了大幅度的性能优化。然而,将MPC技术从CPU迁移到GPU会遇到一系列的挑战。虽然NVIDIA的CUDA平台能够支持一般性的计算,但是将面向CPU的代码直接运行在GPU上并不能直接带来预期的性能提升。为了实现高效的基于GPU的MPC技术,设计者必须要处理CPU和GPU之间的架构差异

SGX

Intel推出SGX (software guard extensions)可信执行环境隐私计算技术。

SGX是一组用于增强应用程序代码和数据安全性的指令,开发者使用SGX技术可以把应用程序的安全操作封装在一个被称之为Enclave的容器内,保障用户关键代码和数据的机密性和完整性。SGX最关键的优势在于将应用程序以外的软件栈如OS和BIOS都排除在了Trusted Computing Base (TCB)以外,一旦软件和数据位于Encalve中,即便是操作系统和VMM (Hypervisor)也无法影响Enclave里面的代码和数据,Enclave的安全边界只包含CPU和它本身。能够广泛应用到人工智能、数据中心、消费电子、通讯网络、物联网、智能汽车、内存安全等场景。

Asylo

Google在2018年发布了保密计算开源框架Asylo,支持在可行执行环境(TEE)中开发高安全性的云端和容器应用。2019年陆续开发了TFF (TensorFlow Federated),用于联邦机器学习和多源数据联合计算的开源框架。

TFF提供了一个灵活的、开放的框架,TFF提供了两个不同层次的API,即联邦学习(FL) API和联邦核心(FC) API。通过FL API,用户可以对现有的TensorFlow模型进行FL或评估,而无需研究FL算法的细节。但是,目前发布的最新版本的TFF只支持横向FL,没有底层的隐私技术(如HE、MPC和DP)来保护数据安全。因此,TFF只适合实验测试和模拟,无法在真实环境中部署。而且,TFF只支持单机模拟多机训练模型,而不能支持集群部署。

Rosetta

Rosetta是一个基于TensorFlow的隐私保护框架。它集成了主流的隐私保护计算技术,包括密码学、联邦学习和可信执行环境。Rosetta旨在为人工智能提供保护隐私的解决方案,而不需要密码、联合学习和可信执行环境方面的专业知识。Rosetta重用TensorFlow的API,并允许将传统的TensorFlow代码转换为隐私保护方式,只需进行最小的更改。

地址

A Privacy-Preserving Framework Based on TensorFlow

参考

1、阿里开源最新隐私保护计算框架FederatedScope
2、隐私计算发展综述-闫树
3、面向开放智能,蚂蚁集团揭秘隐私计算框架
4、CryptGPU:基于GPU加速的快速隐私保护机器学习框架
5、隐私计算,“以数易数”新规则缔造千亿蓝海
6、Rosetta框架初探
7、Rosetta 面向隐私AI的TensorFlow深度定制化实践
8、隐私计算系统架构设计的思考与实践

posted @ 2022-05-17 20:16  PamShao  阅读(3362)  评论(0编辑  收藏  举报