07 2024 档案

解密prompt系列34. RLHF之训练另辟蹊径：循序渐进 & 青出于蓝

摘要：

解密prompt系列34. RLHF之训练另辟蹊径：循序渐进 & 青出于蓝

前几章我们讨论了RLHF的样本构建优化和训练策略优化，这一章我们讨论两种不同的RL训练方案，分别是基于过程训练，和使用弱Teacher来监督强Student 循序渐进：PRM & ORM 想要获得过程阅读全文

posted @ 2024-07-23 07:30 风雨中的小七阅读(486) 评论(0) 推荐(0) 编辑

解密Prompt系列33. LLM之图表理解任务-多模态篇

摘要：

解密Prompt系列33. LLM之图表理解任务-多模态篇

这一章我们聚焦多模态图表数据。先讨论下单纯使用prompt的情况下，图片和文字模态哪种表格模型理解的效果更好更好，再说下和表格相关的图表理解任务的微调方案阅读全文

posted @ 2024-07-06 10:21 风雨中的小七阅读(665) 评论(0) 推荐(0) 编辑

<

2025年2月

>

日

一

二

三

四

五

六

26

27

28

29

30

31

1

2

3

4

5

6

7

8

9

10

11

12

13

14

15

16

17

18

19

20

21

22

23

24

25

26

27

28

1

2

3

4

5

6

7

8

随笔档案 (114)

阅读排行榜

评论排行榜

推荐排行榜

最新评论

1. Re:解密Prompt系列37. RAG之前置决策何时联网的多种策略
@Tom123123123 恩恩同意，所以下一张就是多agent路由了，rag联网只是agent路由的一个简化场景...
--风雨中的小七
2. Re:解密Prompt系列37. RAG之前置决策何时联网的多种策略
将RAG作为Agent的一个Tool，由模型来决定Tool的调用，后续还可以加计算器等等很多插件，单RAG的应用场景很窄
--Tom123123123
3. Re:解密prompt系列35. 标准化Prompt进行时！ DSPy论文串烧和代码示例
@Tom123123123 我们是公司层申请的和个人申请不一样的...
--风雨中的小七
4. Re:解密prompt系列35. 标准化Prompt进行时！ DSPy论文串烧和代码示例
作者您好，Azure的GPT4是怎么申请的啊，能写个教程吗
--Tom123123123
5. Re:解密prompt系列35. 标准化Prompt进行时！ DSPy论文串烧和代码示例
@Hekk丶感谢反馈找到问题了已经修复~...
--风雨中的小七