2024-02-03-大模型微调实战-大模型的新玩法Agent -卢菁
摘要
2024-02-03 周六 家 阴
小记: 大模型微调开始,每天学习几课时;
课程内容
1. 为什么需要 AI Agent
大模型 + 插件 + 执行流程 = Agent
LLM 与 LangChain 等工具结合,释放了内容生成,编码和分析等方面的多种和可能性,目前在 ChatGPT插件中有代表性的插件就是 code interpreter.
2. LLM 的一些缺点
- 幻性: 捏造事实
- 结果并不总是真实
- 对时事的了解有限
- 很难应对复杂的运算
- 外部工具:
a. 谷歌搜索: 获取最新的资讯
b. Python REPL: 执行代码
c. Wolfram: 进行复杂计算
d. 外部 API:获取特定信息
3. Agent 核心部件-控制端
- 自然语言交互
- 知识
- 记忆力
- 推理与规划
- 迁移性与泛化性
4. Agent 感知端-大模型的耳朵和眼睛
5. Agent 行动端-手和脚
6. Agent 一般实现途径
关键词:
- 扬长避短策略,大模型不擅长的事情借助外部工具实现。
- 辅助记忆力: 外部知识库,辅助记忆完成特定任务;
- 外部工具辅助: 借助各种第三方服务进行整合
7. Agent 产品
- Auto Agent
- Baby Agent
- Hugging GPT
- LLAMIndex
8. Agent 架构
- 直接问
- 思维链
- 思维机制
- TOT: 搜索,评估,回溯
TOT 核心: 分解有可能解决问题的方案;评估分解的步骤,选择最优的解决方案
9. Agent 实质
- 给大模型加外挂
- 思维链: 把复杂的问题进行拆解,不指望大模型一次回答出来。通过多次的调用从而解决复杂的问题;
10. Agent 一些反思
- 大模型是基础能力,类似电池;
- agent 是最终交付给用户的产品;
- agent 的缺点:
a. 过度依赖大模型的核心能力,大模型足够强才可以;
b. 链路过长,某一环节出错必然前功尽弃;
c. 多次调用模型,效率不高;
d. 迁移能力弱,换模型需要重新写提示词;
e. 能力强弱,取决于写提示词的水平;
心得: 大模型应用的场景存在一定限制,Agent 通过拆解复杂问题,将会更加深入挖掘和有效利用大模型的应用场景;
总结
心得: Agent 目前看确实像一个缝合怪,随着生态的逐渐完善,Agent 在产品中的应用将会变得愈来愈重要的,训练大模型可以标准化为一般流程,如何让组合Agent ,使其智能体更快的在生产生活落地这个才有意义和价值。
后会无期,未来可期!