2024-02-03-大模型微调实战-大模型的新玩法Agent -卢菁

摘要

2024-02-03 周六 家 阴

小记: 大模型微调开始,每天学习几课时;

课程内容

1. 为什么需要 AI Agent

大模型 + 插件 + 执行流程 = Agent

LLM 与 LangChain 等工具结合,释放了内容生成,编码和分析等方面的多种和可能性,目前在 ChatGPT插件中有代表性的插件就是 code interpreter.

2. LLM 的一些缺点

  • 幻性: 捏造事实
  • 结果并不总是真实
  • 对时事的了解有限
  • 很难应对复杂的运算
  • 外部工具:
    a. 谷歌搜索: 获取最新的资讯
    b. Python REPL: 执行代码
    c. Wolfram: 进行复杂计算
    d. 外部 API:获取特定信息

3. Agent 核心部件-控制端

  • 自然语言交互
  • 知识
  • 记忆力
  • 推理与规划
  • 迁移性与泛化性

4. Agent 感知端-大模型的耳朵和眼睛

5. Agent 行动端-手和脚

6. Agent 一般实现途径

关键词:

  • 扬长避短策略,大模型不擅长的事情借助外部工具实现。
  • 辅助记忆力: 外部知识库,辅助记忆完成特定任务;
  • 外部工具辅助: 借助各种第三方服务进行整合

7. Agent 产品

  • Auto Agent
  • Baby Agent
  • Hugging GPT
  • LLAMIndex

8. Agent 架构

  • 直接问
  • 思维链
  • 思维机制
  • TOT: 搜索,评估,回溯

TOT 核心: 分解有可能解决问题的方案;评估分解的步骤,选择最优的解决方案

9. Agent 实质

  • 给大模型加外挂
  • 思维链: 把复杂的问题进行拆解,不指望大模型一次回答出来。通过多次的调用从而解决复杂的问题;

10. Agent 一些反思

  • 大模型是基础能力,类似电池;
  • agent 是最终交付给用户的产品;
  • agent 的缺点:
    a. 过度依赖大模型的核心能力,大模型足够强才可以;
    b. 链路过长,某一环节出错必然前功尽弃;
    c. 多次调用模型,效率不高;
    d. 迁移能力弱,换模型需要重新写提示词;
    e. 能力强弱,取决于写提示词的水平;

心得: 大模型应用的场景存在一定限制,Agent 通过拆解复杂问题,将会更加深入挖掘和有效利用大模型的应用场景;

总结

心得: Agent 目前看确实像一个缝合怪,随着生态的逐渐完善,Agent 在产品中的应用将会变得愈来愈重要的,训练大模型可以标准化为一般流程,如何让组合Agent ,使其智能体更快的在生产生活落地这个才有意义和价值。

posted @ 2024-02-03 21:58  流雨声  阅读(217)  评论(0编辑  收藏  举报