Fork me on GitHub

Coding Poineer

Coding Poineer

Coding Poineer

Coding Poineer

Coding Poineer

Coding Poineer

Coding Poineer

Coding Poineer

Coding Poineer

Coding Poineer

Coding Poineer

摘要: 训练参数问题: val_size:验证集切分,以dpo为例(研究dpo的原因在于:dpo训练集更庞大,不好控制,验证集应该人工设置,那么模型在验证集上的效果才能反映用户的真实需求;使用val_size方式,eval与train同源,并不总是能很好的反映真实的需求) 运行流程:workflow.py- 阅读全文
posted @ 2024-08-28 11:07 365/24/60 阅读(85) 评论(0) 推荐(0) 编辑