MCP协议

Posted on 2024-11-27 17:39 蝈蝈俊阅读(618) 评论(1) 编辑收藏举报

Model Context Protocol（MCP）是由Anthropic推出的开源协议，旨在实现大型语言模型（LLM）与外部数据源和工具的无缝集成。

https://modelcontextprotocol.io/

它的应用前景如何呢？

一、赋能与场景拓展

通过MCP，开发者可以标准化地连接LLM与所需的上下文信息，提升AI系统的能力和扩展应用范围。

1、LLM 能力提升

上下文感知能力增强

MCP 通过提供实时数据、领域知识或动态信息，使 LLM 能够更准确地理解和处理任务。

医疗场景中，通过 MCP 提供患者病史，模型可以更精准地生成诊断建议。

任务协作能力扩展

通过 MCP，LLM 可以与外部工具协作完成复杂任务，而不是单独处理所有内容。

编程助手场景，LLM 通过 MCP 调用代码执行引擎来运行和验证用户代码。

甚至可以调用其他LLM，共同协作完成任务。

医疗场景：

调用不同 LLM 处理影像分析、医学文献检索、和病历记录生成。

教育场景：

使用不同 LLM 设计课程内容、生成多语言学习材料、解答学生问题。

金融场景：

协作完成市场趋势分析、投资报告生成和多语言客户支持。

通过 MCP 实现的多 LLM 协作，能够将单一模型的局限性转化为系统的综合能力，真正做到 “1 + 1 > 2”。

2、LLM 应用范围扩展

垂直领域的覆盖

MCP 使开发者能够快速为 LLM 集成专业知识或工具，扩大其在垂直领域（如法律、教育、医疗）中的应用潜力。

医生在诊断患者病情时，需要参考电子病历（EMR）、实验室检测结果、影像数据（如 MRI）、以及最新的医学文献。

MCP 连接到医院的电子病历数据库，获取患者的病史、用药记录、过敏信息等。
集成实验室检测系统，提供患者的最新检查结果（例如血液化验结果）。
访问最新的医学文献数据库（例如 PubMed），以检索与患者症状相关的研究。

MCP 同时触发医学影像分析工具，对患者的 MRI 或 CT 扫描进行自动化解读，并将结果作为 LLM 的补充输入。

AI整合上述信息，反馈：

“患者可能患有 X 病，根据 A 症状、B 检测结果，以及相关文献 C（引用链接）。”

医生基于上述信息的进一步验证并修改诊断建议，形成最终的治疗方案。

通过 MCP 实现的多 LLM 协作，能够将单一模型的局限性转化为系统的综合能力，真正做到 “1 + 1 > 2”。

随着MCP在赋能与场景拓展方面的成功应用，也引发了一些关于协议潜在影响的讨论。接下来，我们将探讨MCP在实际应用中可能面临的垄断入口问题。

二、垄断入口问题

MCP并非单纯设计为大模型公司的垄断工具，而是一个开放的协议，其目标是提供标准化的方式，将LLM（如GPT、Claude等）与外部系统或数据源进行高效连接。

不过，在目前的技术生态中，LLM确实处于MCP工作流中的核心地位，这种架构可能会带来一些集中化的问题。

为什么LLM是MCP的入口？

MCP的核心任务是帮助LLM更高效地获取外部数据或信息，以增强其在特定任务中的表现。

因为上下文是通过模型提示或数据输入直接交付给LLM的，因此模型成为了入口和中心节点。

外部系统的作用更多是“提供支持”（如数据、操作能力等），而不是“替代LLM”。

是否会导致大模型公司独霸入口？

如果MCP的实际运用完全依赖于大模型（如Anthropic的Claude或OpenAI的GPT），那么MCP协议可能强化大模型公司的市场地位。

但MCP作为一个协议，并没有限制只能与某一特定模型配合，理论上它可以支持开源模型（如Llama 2）、自定义微型模型，甚至是专用领域模型。

如果开源模型继续进步，并且开发者更多地使用本地化部署或垂直领域优化模型，MCP的生态可能会从“模型中心化”逐渐走向“任务分布化”。

为了实现上述目标，MCP采用了灵活的客户端-服务器架构，确保协议的开放性和可扩展性。接下来，我们将详细介绍MCP的架构设计。

三、MCP架构

MCP 的核心遵循客户端-服务器架构，其中主机应用程序可以连接到多个服务器，充分体现了其开放性和可扩展性。：

Hosts（主机）想要通过 MCP 访问资源的程序，例如 Claude Desktop、IDE 或 AI 工具
Clients（客户端）在主机应用程序内部与服务器保持 1:1 连接，上图在 MCP Host程序内部。
Servers（服务器）轻量级程序，每个程序通过标准化模型上下文协议公开特定功能
Local Resources （本地资源）：MCP 服务器可以安全访问的计算机资源（数据库、文件、服务）
Remote Resources （远程资源）：MCP 服务器可以连接到的通过互联网（例如，通过 API）可用的资源
Protocol layer （协议层）MCP 是一种基于 JSON-RPC 2.0 的协议，旨在规范客户端和服务器之间的通信，支持模型、资源、工具等多种交互。具体的规范看： https://github.com/modelcontextprotocol/specification

整体而言，MCP 的架构设计为其开放性和可扩展性提供了坚实的基础，确保协议能够适应快速变化的技术环境和多样化的应用需求。

四、发展中的协议

在 https://modelcontextprotocol.io/clients

我们可以看到目前支持MCP协议的客户端情况

可以看出MCP协议还是一个初始状态，随着协议的不断完善和生态的持续扩展，MCP有望在推动AI技术普及和深化应用方面发挥更加重要的作用，助力构建更加智能和互联的未来。

总结

Model Context Protocol（MCP）作为Anthropic推出的开源协议，展示了在大型语言模型（LLM）与外部数据源及工具之间实现无缝集成的巨大潜力。首先，通过标准化的连接方式，MCP显著提升了LLM的上下文感知和任务协作能力，使其在医疗、教育、金融等多个垂直领域中发挥关键作用。这不仅克服了单一模型的局限性，还为开发者提供了更灵活和强大的工具，推动了AI系统能力的全面提升。

然而，随着MCP在技术生态中的广泛应用，LLM作为核心入口的地位也引发了对集中化问题的关注。尽管MCP本身是一个开放协议，支持多种模型的集成，但在实际应用中，依赖于大模型公司的现象可能会强化其市场主导地位。这一潜在问题需要在未来的发展中加以重视和解决。

展望未来，随着开源模型的持续发展和本地化部署的普及，MCP有望逐步实现任务分布化，促进生态系统的多元化和去中心化发展。这将有助于平衡市场力量，避免单一大模型公司的垄断，进一步释放MCP协议的潜力。

总体而言，MCP为LLM与外部系统的集成提供了一个高效、标准化的解决方案，不仅提升了AI系统的智能化水平，也为各行业的创新应用开辟了新的可能性。随着协议的不断完善和生态的持续扩展，MCP有望在推动AI技术普及和深化应用方面发挥更加重要的作用，助力构建更加智能和互联的未来。

刷新页面返回顶部

登录后才能查看或发表评论，立即登录或者逛逛博客园首页

相关博文：

· MCP 与 Function Call 区别

· 颠覆认知！Meta 发布全新“概念模型”，或将迎来“乐高式”进化

· 大模型Agent中的MCP协议

· 一文搞懂 MCP Servers

· 模型上下文协议MCP

阅读排行：
· 分享4款.NET开源、免费、实用的商城系统
· 全程不用写代码，我用AI程序员写了一个飞机大战
· MongoDB 8.0这个新功能碉堡了，比商业数据库还牛
· 白话解读 Dapr 1.15：你的「微服务管家」又秀新绝活了
· 记一次.NET内存居高不下排查解决与启示

历史上的今天：
2023-11-27 SSH 和 SFTP 连接问题检查
2013-11-27 Golang几个常用记录日志对比
2013-11-27 memcache、memcached、groupcache的区别
2013-11-27 Golang 使用FreeType-go进行字体
2013-11-27 Golang官方图片库

蝈蝈俊的技术心得

导航

公告

搜索

常用链接

我的标签

随笔分类

随笔档案

阅读排行榜

评论排行榜

推荐排行榜

最新评论