会员
周边
众包
新闻
博问
闪存
赞助商
Chat2DB
所有博客
当前博客
我的博客
我的园子
账号设置
简洁模式
...
退出登录
注册
登录
Loading
戴墨镜的长颈鹿
博客园
首页
管理
2022年12月5日
多卡:关于trainer中线性层无法自动适配的小踩坑
摘要: transformer家的trainer适配了fp16、多卡...等,用起来很方便,但是之前我在实现模型的时候,发现在init里定义的线性层,在多卡上跑了以后,报错device不匹配,研究了许久,发现是trainer迁移的网络,不能被字典所包裹,最好直接定义为成员函数。例子如下: 在这里,self.
阅读全文
posted @ 2022-12-05 21:36 戴墨镜的长颈鹿
阅读(90)
评论(0)
推荐(0)
编辑
公告