Fork me on GitHub

基于大模型的人工智能应用开发

我们所向往的是一个不仅把人工智能生成内容视为工作的一部分,还将人工智能作为连接更加复杂任务的关键纽带的时代。

image

我们看到大模型应用开发过程中的两条轴线---垂直轴代表传入大模型的信息的复杂度,水平轴代表对大模型能力的要求。这两条轴线表明了模型优化需要考虑的两个方向---大模型需要知道的上下文信息和采取的行动。大模型知道的上下文越多,它基于特定应用场景做出的判断的能力越强;而对大模型的行动能力要求越高,就需要对大模型进行微调,或者通过Agent赋予大模型更多的智能。

Agent是人工智能应用开发中最为亮眼的部分,属于成熟度极低、潜在价值极高的领域,同时也位于上下文要求高、对模型行动力要求也搞得象限。Agent 需要大模型具有最强的推理能力,所以,至今为止也只有OpenAI公司的GPT-3.5/4 系列模型和Anthropic公司的Claude 3模型能够符合“Agent 大脑” 的要求。这些Agent能够进行自然语言对话、回答问题、生成文本内容、甚至编写和理解代码,最终成为自动化工具的核心组件。

posted @ 2024-06-02 15:59  张善友  阅读(217)  评论(3编辑  收藏  举报