摘要: 微调:好像是用新数据训练旧模型的管道。 微调的参数有: 图形大小:image_size 数据批次:batch_size 为减轻显卡压力,将数据批次再切分为2(n)倍,num_epochs 相对应的,权重更新频率也乘2(n)倍,grad_accumulation_steps 总感觉对模型影响不大捏? 阅读全文
posted @ 2023-10-25 18:23 windiest 阅读(102) 评论(0) 推荐(0) 编辑