摘要: 实现目标:原本需要15G显存的BERT-large模型训练,经过参数优化缩减到3.4G。 阅读全文
posted @ 2024-11-11 15:10 crazybuddha 阅读(1) 评论(0) 推荐(0) 编辑