Keras 3.0正式发布:可用于TensorFlow、JAX和PyTorch
前言 Keras 3.0正式发布:可用于TensorFlow、JAX和PyTorch
本文转载自机器之心
仅用于学术分享,若侵权请联系删除
欢迎关注公众号CV技术指南,专注于计算机视觉的技术总结、最新技术跟踪、经典论文解读、CV招聘信息。
【CV技术指南】CV全栈指导班、基础入门班、论文指导班 全面上线!!
「大新闻:我们刚刚发布了 Keras 3.0 版本!」Keras 之父 François Chollet 在 X 上激动的表示。「现在你可以在 JAX、TensorFlow 以及 PyTorch 框架上运行 Keras……」
对于这一更新,Keras 官方表示,这一版本足足花了他们 5 个月的时间进行公测才完成。Keras 3.0 是对 Keras 的完全重写,你可以在 JAX、TensorFlow 或 PyTorch 之上运行 Keras 工作流,新版本还具有全新的大模型训练和部署功能。你可以选择最适合自己的框架,也可以根据当前的目标从一种框架切换到另一种框架都没有问题。
Keras 地址:https://keras.io/keras_3/
被 250 多万开发者使用的 Keras,迎来 3.0 版本
Keras API 可用于 JAX、TensorFlow 和 PyTorch。现有的仅使用内置层的 tf.keras 模型可以在 JAX 和 PyTorch 中运行!
Keras 3 可与任何 JAX、TensorFlow 和 PyTorch 工作流无缝协作。Keras 3 不仅适用于以 Keras 为中心的工作流,比如定义 Keras 模型、优化器、损失和度量,它还旨在与 JAX、TensorFlow 和 PyTorch 低级后端本地工作流无缝集成,在训练 Keras 模型时,你可以选择使用 JAX 训练、TensorFlow 训练、PyTorch 训练,也可以将其作为 JAX 或 PyTorch 模型的一部分,上述操作都没有问题。Keras 3 在 JAX 和 PyTorch 中提供了与 tf.keras 在 TensorFlow 中相同程度的低级实现灵活性。
预训练模型。你现在可以在 Keras 3 中使用各种预训练模型。现在已经有 40 个 Keras 应用模型可在后端中使用,此外,KerasCV 和 KerasNLP 中存在的大量预训练模型(例如 BERT、T5、YOLOv8、Whisper 、SAM 等)也适用于所有后端。
Keras 3 高度向后兼容 Keras 2:Keras 3 现在实现了 Keras 2 的公共 API 接口。大多数用户无需更改任何代码即可在 Keras 3 上运行 Keras 脚本。如果你还不习惯使用 Keras 3,可以选择忽略新版本的更新,继续将 Keras 2 与 TensorFlow 结合使用。
Keras 3 支持所有后端的跨框架数据 pipeline。多框架机器学习也意味着多框架数据加载和预处理。Keras 3 模型可以使用各种数据 pipeline 进行训练,无论你使用的是 JAX、PyTorch 还是 TensorFlow 后端:
- tf.data.Dataset pipelines。
- torch.utils.data.DataLoader 对象。
- NumPy 数组和 Pandas 数据帧。
- Keras 的 keras.utils.PyDataset 对象。
一个新的分布式 API,可用于大规模数据并行和模型并行。目前这一更新仅适用于 JAX 后端,TensorFlow 和 PyTorch 支持即将推出。
至于为何要推出这一更改,Keras 团队表示,近年来,随着模型规模变得越来越大,他们希望为多设备模型分片(sharding)问题提供 Keras 解决方案。该团队设计的 API 使模型定义、训练逻辑和分片配置完全独立,这意味着模型可以像在单个设备上运行一样, 然后,你可以在训练模型时将分片配置添加到任意模型中。
数据并行(在多个设备上相同地复制小模型)只需两行即可处理:
接下来是模型并行。该 API 允许你通过正则表达式配置每个变量和每个输出张量的布局。这使得为整个变量类别快速指定相同的布局变得容易。
最后,Keras 团队还收集了很多大家关心的问题,并予以解答,感兴趣的读者可以前去 Keras 官方网站,了解更多内容。
欢迎关注公众号CV技术指南,专注于计算机视觉的技术总结、最新技术跟踪、经典论文解读、CV招聘信息。
【技术文档】《从零搭建pytorch模型教程》122页PDF下载
QQ交流群:470899183。群内有大佬负责解答大家的日常学习、科研、代码问题。
其它文章
LSKA注意力 | 重新思考和设计大卷积核注意力,性能优于ConvNeXt、SWin、RepLKNet以及VAN
CVPR 2023 | TinyMIM:微软亚洲研究院用知识蒸馏改进小型ViT
ICCV2023|涨点神器!目标检测蒸馏学习新方法,浙大、海康威视等提出
ICCV 2023 Oral | 突破性图像融合与分割研究:全时多模态基准与多交互特征学习
HDRUNet | 深圳先进院董超团队提出带降噪与反量化功能的单帧HDR重建算法
南科大提出ORCTrack | 解决DeepSORT等跟踪方法的遮挡问题,即插即用真的很香
1800亿参数,世界顶级开源大模型Falcon官宣!碾压LLaMA 2,性能直逼GPT-4
SAM-Med2D:打破自然图像与医学图像的领域鸿沟,医疗版 SAM 开源了!
GhostSR|针对图像超分的特征冗余,华为诺亚&北大联合提出GhostSR
Meta推出像素级动作追踪模型,简易版在线可玩 | GitHub 1.4K星
CSUNet | 完美缝合Transformer和CNN,性能达到UNet家族的巅峰!