2024 年 7月 16 日随笔档案 - HuggingFace

2024年7月16日

摘要：

为视觉语言多模态模型进行偏好优化训练模型使得它能够理解并预测人类偏好是一项比较复杂的任务。诸如 SFT (Supervised finetuning) 的传统的方法一般都需要耗费较大成本，因为这些算法需要对数据打上特定的标签。而偏好优化 (Preference Optimization) 作为一种阅读全文

posted @ 2024-07-16 23:08 HuggingFace 阅读(858) 评论(0) 推荐(4) 编辑

公告

Hugging Face 官网

昵称： HuggingFace
园龄： 2年1个月
粉丝： 181
关注： 0

+加关注

<

2025年2月

>

日

一

二

三

四

五

六

26

27

28

29

30

31

1

2

3

4

5

6

7

8

9

10

11

12

13

14

15

16

17

18

19

20

21

22

23

24

25

26

27

28

1

2

3

4

5

6

7

8

Hugging Face 博客

The AI community building the future.

公告

搜索

常用链接

我的标签

随笔分类

随笔档案

阅读排行榜

评论排行榜

推荐排行榜

最新评论