通俗理解Gradient Checkpoint机制(附代码)

目录:

  • 简介

    • 理解Gradient Checkpointing的基本概念

    • 为什么我们需要存储中间结果?

    • Gradient Checkpointing到底是怎么工作的呢?

  • 实验部分

  • 结论

 

完整内容见微信公众号文章:https://mp.weixin.qq.com/s/IwcfUP_j6JYFXH_xhnWWJQ

 

posted @ 2022-03-27 06:52  createMoMo  阅读(1320)  评论(0编辑  收藏  举报