2023 年 3月 23 日随笔档案 - HuggingFace

2023年3月23日

摘要：我们很高兴正式发布 trl 与 peft 的集成，使任何人都可以更轻松地使用强化学习进行大型语言模型 (LLM) 微调！在这篇文章中，我们解释了为什么这是现有微调方法的有竞争力的替代方案。请注意， peft 是一种通用工具，可以应用于许多 ML 用例，但它对 RLHF 特别有趣，因为这种方法特别需阅读全文

posted @ 2023-03-23 10:15 HuggingFace 阅读(1227) 评论(1) 推荐(1) 编辑

公告

Hugging Face 官网

昵称： HuggingFace
园龄： 2年2个月
粉丝： 184
关注： 0

+加关注

2025年3月

日

一

二

三

四

五

六

Hugging Face 博客

The AI community building the future.

公告

搜索

常用链接

我的标签

随笔分类

随笔档案

阅读排行榜

评论排行榜

推荐排行榜

最新评论