03 2024 档案

解密prompt系列25. RLHF改良方案之样本标注：RLAIF & SALMON

摘要：

解密prompt系列25. RLHF改良方案之样本标注：RLAIF & SALMON

之前我们主要唠了RLHF训练相关的方案，这一章我们主要针对RLHF的样本构建阶段，引入机器标注来降低人工标注的成本。主要介绍两个方案：RLAIF,和IBM的SALMON 阅读全文

posted @ 2024-03-25 08:37 风雨中的小七阅读(281) 评论(0) 推荐(0) 编辑

解密prompt系列26. 人类思考vs模型思考：抽象和发散思维

摘要：

解密prompt系列26. 人类思考vs模型思考：抽象和发散思维

在Chain of Thought出来后，出现过许多的优化方案，这一章我们类比人类已有的思维方式，就抽象思维和发散思维这两个方向，聊聊step back和diversity prompt 阅读全文

posted @ 2024-03-10 14:37 风雨中的小七阅读(441) 评论(0) 推荐(0) 编辑

<

2025年2月

>

日

一

二

三

四

五

六

26

27

28

29

30

31

1

2

3

4

5

6

7

8

9

10

11

12

13

14

15

16

17

18

19

20

21

22

23

24

25

26

27

28

1

2

3

4

5

6

7

8

随笔档案 (114)

阅读排行榜

评论排行榜

推荐排行榜

最新评论

1. Re:解密Prompt系列37. RAG之前置决策何时联网的多种策略
@Tom123123123 恩恩同意，所以下一张就是多agent路由了，rag联网只是agent路由的一个简化场景...
--风雨中的小七
2. Re:解密Prompt系列37. RAG之前置决策何时联网的多种策略
将RAG作为Agent的一个Tool，由模型来决定Tool的调用，后续还可以加计算器等等很多插件，单RAG的应用场景很窄
--Tom123123123
3. Re:解密prompt系列35. 标准化Prompt进行时！ DSPy论文串烧和代码示例
@Tom123123123 我们是公司层申请的和个人申请不一样的...
--风雨中的小七
4. Re:解密prompt系列35. 标准化Prompt进行时！ DSPy论文串烧和代码示例
作者您好，Azure的GPT4是怎么申请的啊，能写个教程吗
--Tom123123123
5. Re:解密prompt系列35. 标准化Prompt进行时！ DSPy论文串烧和代码示例
@Hekk丶感谢反馈找到问题了已经修复~...
--风雨中的小七