基于大模型的人工智能应用开发

我们所向往的是一个不仅把人工智能生成内容视为工作的一部分，还将人工智能作为连接更加复杂任务的关键纽带的时代。

我们看到大模型应用开发过程中的两条轴线---垂直轴代表传入大模型的信息的复杂度，水平轴代表对大模型能力的要求。这两条轴线表明了模型优化需要考虑的两个方向---大模型需要知道的上下文信息和采取的行动。大模型知道的上下文越多，它基于特定应用场景做出的判断的能力越强；而对大模型的行动能力要求越高，就需要对大模型进行微调，或者通过Agent赋予大模型更多的智能。

Agent是人工智能应用开发中最为亮眼的部分，属于成熟度极低、潜在价值极高的领域，同时也位于上下文要求高、对模型行动力要求也搞得象限。Agent 需要大模型具有最强的推理能力，所以，至今为止也只有OpenAI公司的GPT-3.5/4 系列模型和Anthropic公司的Claude 3模型能够符合“Agent 大脑” 的要求。这些Agent能够进行自然语言对话、回答问题、生成文本内容、甚至编写和理解代码，最终成为自动化工具的核心组件。

posted @ 2024-06-02 15:59 张善友阅读(221) 评论(3) 编辑收藏举报

刷新页面返回顶部

自由、创新、研究、探索

.NET CloudNative Development/dotnet云原生应用开发

基于大模型的人工智能应用开发

公告