摘要: 目录: 简介 理解Gradient Checkpointing的基本概念 为什么我们需要存储中间结果? Gradient Checkpointing到底是怎么工作的呢? 实验部分 结论 完整内容见微信公众号文章:https://mp.weixin.qq.com/s/IwcfUP_j6JYFXH_xh 阅读全文
posted @ 2022-03-27 06:52 createMoMo 阅读(1594) 评论(0) 推荐(0) 编辑