2024 年 4月 23 日随笔档案 - aehyok

2024年4月23日

通过ORPO技术微调 llama3大模型(Fine-tune Llama 3 with ORPO)

摘要： 1f45bd1e8577af66a05f5e3fadb0b29 通过ORPO对llama进行微调前言 ORPO是一种新颖的微调技术，它将传统的监督微调和偏好对齐阶段整合到一个过程中。这减少了训练所需的计算资源和时间。此外，经验结果表明，ORPO在各种模型大小和基准测试中都超过了其他对齐方法。在本阅读全文

posted @ 2024-04-23 08:00 aehyok 阅读(1958) 评论(0) 推荐(0) 编辑

aehyok

信自己没有什么不可以！个人网站地址：github.com/aehyok

公告

aehyok

信自己没有什么不可以！ 个人网站地址：github.com/aehyok

公告

信自己没有什么不可以！个人网站地址：github.com/aehyok