07 2024 档案

摘要:解密prompt系列34. RLHF之训练另辟蹊径:循序渐进 & 青出于蓝前几章我们讨论了RLHF的样本构建优化和训练策略优化,这一章我们讨论两种不同的RL训练方案,分别是基于过程训练,和使用弱Teacher来监督强Student 循序渐进:PRM & ORM 想要获得过程 阅读全文
posted @ 2024-07-23 07:30 风雨中的小七 阅读(486) 评论(0) 推荐(0) 编辑
摘要:解密Prompt系列33. LLM之图表理解任务-多模态篇这一章我们聚焦多模态图表数据。先讨论下单纯使用prompt的情况下,图片和文字模态哪种表格模型理解的效果更好更好,再说下和表格相关的图表理解任务的微调方案 阅读全文
posted @ 2024-07-06 10:21 风雨中的小七 阅读(665) 评论(0) 推荐(0) 编辑

点击右上角即可分享
微信分享提示