[SageMaker] Preparing FSx Input for SageMaker

Preparing FSx Input for SageMaker

  1. Download and prepare your training dataset on S3.
  2. Follow the steps listed here to create a FSx linked with your S3 bucket with training data - https://docs.aws.amazon.com/fsx/latest/LustreGuide/create-fs-linked-data-repo.html. Make sure to add an endpoint to your VPC allowing S3 access.
  3. Follow the steps listed here to configure your SageMaker training job to use FSx https://aws.amazon.com/blogs/machine-learning/speed-up-training-on-amazon-sagemaker-using-amazon-efs-or-amazon-fsx-for-lustre-file-systems/

把分布式训练的这部分内容,独立出来学习。

 

FSx for Lustre 与 Amazon S3 无缝集成,使您能够轻松地将长期数据集与高性能文件系统链接起来以运行计算密集型工作负载。

您可以自动将数据从 S3 复制到 FSx for Lustre,运行工作负载,然后将结果写回到 S3。有了点s3的缓存的意思~

 

/* implement */

 

 

 

posted @   郝壹贰叁  阅读(69)  评论(0编辑  收藏  举报
编辑推荐:
· AI与.NET技术实操系列:向量存储与相似性搜索在 .NET 中的实现
· 基于Microsoft.Extensions.AI核心库实现RAG应用
· Linux系列:如何用heaptrack跟踪.NET程序的非托管内存泄露
· 开发者必知的日志记录最佳实践
· SQL Server 2025 AI相关能力初探
阅读排行:
· 震惊!C++程序真的从main开始吗?99%的程序员都答错了
· 【硬核科普】Trae如何「偷看」你的代码?零基础破解AI编程运行原理
· 单元测试从入门到精通
· 上周热点回顾(3.3-3.9)
· winform 绘制太阳,地球,月球 运作规律
点击右上角即可分享
微信分享提示