2024-02-03-大模型微调实战-大模型的新玩法Agent -卢菁

摘要

2024-02-03 周六家阴

小记: 大模型微调开始，每天学习几课时；

课程内容

1. 为什么需要 AI Agent

大模型 + 插件 + 执行流程 = Agent

LLM 与 LangChain 等工具结合，释放了内容生成，编码和分析等方面的多种和可能性，目前在 ChatGPT插件中有代表性的插件就是 code interpreter.

2. LLM 的一些缺点

幻性: 捏造事实
结果并不总是真实
对时事的了解有限
很难应对复杂的运算
外部工具:
a. 谷歌搜索: 获取最新的资讯
b. Python REPL: 执行代码
c. Wolfram: 进行复杂计算
d. 外部 API：获取特定信息

3. Agent 核心部件-控制端

自然语言交互
知识
记忆力
推理与规划
迁移性与泛化性

4. Agent 感知端-大模型的耳朵和眼睛

5. Agent 行动端-手和脚

6. Agent 一般实现途径

关键词:

扬长避短策略，大模型不擅长的事情借助外部工具实现。
辅助记忆力: 外部知识库，辅助记忆完成特定任务；
外部工具辅助: 借助各种第三方服务进行整合

7. Agent 产品

Auto Agent
Baby Agent
Hugging GPT
LLAMIndex

8. Agent 架构

直接问
思维链
思维机制
TOT: 搜索，评估，回溯

TOT 核心: 分解有可能解决问题的方案；评估分解的步骤，选择最优的解决方案

9. Agent 实质

给大模型加外挂
思维链: 把复杂的问题进行拆解，不指望大模型一次回答出来。通过多次的调用从而解决复杂的问题；

10. Agent 一些反思

大模型是基础能力，类似电池；
agent 是最终交付给用户的产品；
agent 的缺点:
a. 过度依赖大模型的核心能力，大模型足够强才可以；
b. 链路过长，某一环节出错必然前功尽弃；
c. 多次调用模型，效率不高；
d. 迁移能力弱，换模型需要重新写提示词；
e. 能力强弱，取决于写提示词的水平；

心得: 大模型应用的场景存在一定限制，Agent 通过拆解复杂问题，将会更加深入挖掘和有效利用大模型的应用场景；

总结

心得: Agent 目前看确实像一个缝合怪，随着生态的逐渐完善，Agent 在产品中的应用将会变得愈来愈重要的，训练大模型可以标准化为一般流程，如何让组合Agent ,使其智能体更快的在生产生活落地这个才有意义和价值。

posted @ 2024-02-03 21:58 流雨声阅读(217) 评论(0) 编辑收藏举报

会员力量，点亮园子希望

刷新页面返回顶部