Loading

摘要: 本文介绍一些避免transformers的OOM以及训练等流程太漫长的方法,主要参考了kaggle notebook [Optimization approaches for Transformers | Kaggle](https://www.kaggle.com/code/vad13irt/op 阅读全文
posted @ 2022-07-20 19:54 MapleTx 阅读(1867) 评论(0) 推荐(1) 编辑