人工智能|ReACT 推理提示
简介
使用大语言模型最困难的事情是让它们做你希望它们做的事情。在一篇知名的 ReACT 研究论文《SYNERGIZING REASONING AND ACTING IN LANGUAGE MODELS》中,作者提出了以下的观点:
在人类从事一项需要多个步骤的任务时,而步骤和步骤之间,或者说动作和动作之间,往往会有一个推理过程。
我们以开车为例,在开车之前,我们会检查汽车的邮箱或者电池情况,以便汽车后续不会因为没有油而导致无法使用。当然,这个“检查的动作”是我们下意识的心理状态。有时候并不会直接讲出来。而此篇论文的作者提出一个方法:
让 LLM 把心理状态说出来,然后再根据心理状态做相应的动作,来提高 LLM 答案的准确性。
在这句话中,我们可以发现两个关键词:
- 推理(Reasoning),如果给出推理过程,大模型给出的答案会更好。
- 行动(Acting), 在环境中采取行动,并观察结果,反复思考。(有点像调试代码的过程)
他们所做的基本上就是将思维方式从单纯的标准式的通过思维链的提示提升到现在能够有原因的追踪和行动。
实现原理
Reason + Action 结合之后:
- 通过推理增强大语言模型解决方案的输出能力。
- 执行完成之后将观察带回到语言模型中进行反馈,完善推理。
- 所以会获得多步骤的思维方式,不仅仅是一次。直到达成目标为止
应用场景
想象一下,如果大模型能够很好的完成ReAct,即推理+行动的过程。那么就代表大语言模型是无所不能的。当然目前的大模型还没有聪明到这个地步。但是仍然有一些非常好用的应用场景。比如现在很多企业的智能助理,医疗系统的智能助理等等,都是基于此设计原理。
实践应用
通过 LangChain 或者 ChatGPT 的官方 assistant 的 tools 都有利用到 ReaACT 的原理。在后续的课程中会有更深入的实战应用。比如打造企业专属人工智能助理。
相关资料
- ReAct 框架
总结
- 理解 ReAct 框架的基本概念。
- 理解 ReAct 框架的应用场景。
- 在后续的学习过程中,会结合 LangChain 与 assistant 完成 ReAct 相关的实战练习。
【推荐】编程新体验,更懂你的AI,立即体验豆包MarsCode编程助手
【推荐】凌霞软件回馈社区,博客园 & 1Panel & Halo 联合会员上线
【推荐】抖音旗下AI助手豆包,你的智能百科全书,全免费不限次数
【推荐】博客园社区专享云产品让利特惠,阿里云新客6.5折上折
【推荐】轻量又高性能的 SSH 工具 IShell:AI 加持,快人一步
· CSnakes vs Python.NET:高效嵌入与灵活互通的跨语言方案对比
· 【.NET】调用本地 Deepseek 模型
· Plotly.NET 一个为 .NET 打造的强大开源交互式图表库
· 上周热点回顾(2.17-2.23)
· DeepSeek “源神”启动!「GitHub 热点速览」
2023-07-25 软件测试|教你怎么向SQL中插入数据
2023-07-25 软件测试|超好用超简单的Python GUI库——tkinter(十三)
2023-07-25 软件测试|Appium的二次开发与Appium的运行原理
2023-07-25 软件测试|超好用超简单的Python GUI库——tkinter(十二)
2023-07-25 软件测试|超好用超简单的Python GUI库——tkinter(十一)
2023-07-25 软件测试|超好用超简单的Python GUI库——tkinter(十)
2023-07-25 软件测试|软件测试|超好用超简单的Python GUI库——tkinter(八)