三次训大模型的蓝屏

今天尝试用qlora训qwen2,由于有cpu offload 所以虽然显存炸了,但也能跑

而且更幸运的是,显卡占用一直高达100%

不过三次都快结束第一个epoch的时候蓝屏了。

posted @ 2024-08-03 00:17  风之炼金术士华华  阅读(8)  评论(0编辑  收藏  举报