会员
周边
新闻
博问
闪存
众包
赞助商
Chat2DB
所有博客
当前博客
我的博客
我的园子
账号设置
会员中心
简洁模式
...
退出登录
注册
登录
Hugging Face 博客
The AI community building the future.
博客园
首页
新随笔
联系
订阅
管理
当前标签:RLHF
将强化学习重新引入 RLHF
HuggingFace 2024-06-19 22:52
阅读:422
评论:0
推荐:1
使用 PPO 算法进行 RLHF 的 N 步实现细节
HuggingFace 2023-11-16 15:02
阅读:1306
评论:0
推荐:1
TRL 正式推出,来训练你的首个 RLHF 模型吧!
HuggingFace 2023-08-10 23:55
阅读:2271
评论:0
推荐:1
“StackLLaMA”: 用 RLHF 训练 LLaMA 的手把手教程
HuggingFace 2023-05-05 11:15
阅读:905
评论:0
推荐:0
在一张 24 GB 的消费级显卡上用 RLHF 微调 20B LLMs
HuggingFace 2023-03-23 10:15
阅读:1333
评论:1
推荐:1
公告