会员
周边
众包
新闻
博问
闪存
赞助商
Chat2DB
所有博客
当前博客
我的博客
我的园子
账号设置
会员中心
简洁模式
...
退出登录
注册
登录
Hugging Face 博客
The AI community building the future.
博客园
首页
新随笔
联系
订阅
管理
随笔 - 325
文章 - 3
评论 - 36
阅读 -
27万
2023年3月23日
在一张 24 GB 的消费级显卡上用 RLHF 微调 20B LLMs
摘要: 我们很高兴正式发布 trl 与 peft 的集成,使任何人都可以更轻松地使用强化学习进行大型语言模型 (LLM) 微调!在这篇文章中,我们解释了为什么这是现有微调方法的有竞争力的替代方案。 请注意, peft 是一种通用工具,可以应用于许多 ML 用例,但它对 RLHF 特别有趣,因为这种方法特别需
阅读全文
posted @ 2023-03-23 10:15 HuggingFace
阅读(1227)
评论(1)
推荐(1)
编辑
公告
Hugging Face 官网
昵称:
HuggingFace
园龄:
2年2个月
粉丝:
184
关注:
0
+加关注
<
2025年3月
>
日
一
二
三
四
五
六
23
24
25
26
27
28
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
1
2
3
4
5
搜索
常用链接
我的随笔
我的评论
我的参与
最新评论
我的标签
我的标签
人工智能
(112)
Hugging Face
(99)
Transformers
(36)
LLM
(25)
HuggingFace
(25)
Hugging News
(23)
stable diffusion
(9)
pytorch
(8)
HuggingNews
(8)
Diffusers
(8)
更多
随笔分类
Hugging Face 博客(184)
HuggingFace博客(5)
HuggingFace博客(2)
随笔档案
2025年3月(3)
2025年2月(5)
2025年1月(5)
2024年12月(9)
2024年11月(5)
2024年10月(9)
2024年9月(9)
2024年8月(9)
2024年7月(10)
2024年6月(10)
2024年5月(11)
2024年4月(11)
2024年3月(10)
2024年2月(11)
2024年1月(10)
2023年12月(11)
2023年11月(11)
2023年10月(10)
2023年9月(10)
2023年8月(20)
2023年7月(20)
2023年6月(17)
2023年5月(19)
2023年4月(19)
2023年3月(23)
2023年2月(17)
2023年1月(17)
2022年12月(4)
阅读排行榜
1. 使用 LoRA 进行 Stable Diffusion 的高效参数微调(11515)
2. Llama 3.1 - 405B、70B 和 8B 的多语言与长上下文能力解析(7138)
3. Hugging Face Transformers 萌新完全指南(6081)
4. StarCoder: 最先进的代码大模型(5640)
5. 使用 DeepSpeed 和 Accelerate 进行超快 BLOOM 模型推理(5315)
评论排行榜
1. Hugging Face Transformers 萌新完全指南(3)
2. 使用 SpeechT5 进行语音合成、识别和更多功能(3)
3. Hugging Face 2023 实习生招募计划(3)
4. Hugging Face 论文平台 Daily Papers 功能全解析(2)
5. 使用 LCM LoRA 4 步完成 SDXL 推理(2)
推荐排行榜
1. ChatGPT 设计游戏剧情 | 基于 AI 5 天创建一个农场游戏,完结篇!(5)
2. 现在 Llama 具备视觉能力并可以在你的设备上运行 - 欢迎使用 Llama 3.2(4)
3. 为视觉语言多模态模型进行偏好优化(4)
4. 个人编程助手: 训练你自己的编码助手(4)
5. Diffusers 一岁啦 !(4)
最新评论
1. Re:现在 Llama 具备视觉能力并可以在你的设备上运行 - 欢迎使用 Llama 3.2
话说有没有人微调这个模型来识别数学公式的呢
--布布1314
2. Re:使用 Transformers 为多语种语音识别任务微调 Whisper 模型
可以
--bchuiJNKHJII
3. Re:开源开发者指南:欧盟《人工智能法案》解读
有些国家的AI就是用于上面的这几类风险中的, 人脸识别,催缴的电话外呼,有的公司还为此申请了专利
--码农加一
4. Re:为数据集而生的 SQL 控制台
感谢分享
--潇洒人生梦
5. Re:Hugging Face 论文平台 Daily Papers 功能全解析
支持!!!
--南风丶丶
点击右上角即可分享