2024 年 8月 28 日随笔档案 - 365/24/60

2024年8月28日

摘要：训练参数问题： val_size：验证集切分，以dpo为例（研究dpo的原因在于：dpo训练集更庞大，不好控制，验证集应该人工设置，那么模型在验证集上的效果才能反映用户的真实需求；使用val_size方式，eval与train同源，并不总是能很好的反映真实的需求）运行流程：workflow.py- 阅读全文

posted @ 2024-08-28 11:07 365/24/60 阅读(85) 评论(0) 推荐(0) 编辑

Coding Poineer

Coding Poineer

Coding Poineer

Coding Poineer

Coding Poineer

Coding Poineer

Coding Poineer

Coding Poineer

Coding Poineer

Coding Poineer

Coding Poineer

365/24/60