写点什么

“AI 原生”标准 MCP 突然爆红!引爆 LangChain 大佬“内战”:是颠覆 OpenAI 的技术突破,还是配不上当前关注的玩具?

  • 2025-03-12
    北京
  • 本文字数:4373 字

    阅读完需:约 14 分钟

大小:2.12M时长:12:20
“AI原生”标准MCP突然爆红!引爆LangChain大佬“内战”:是颠覆OpenAI的技术突破,还是配不上当前关注的玩具?

近期,MCP 热度极高。

 

“在 MCP 出现之前,开发者必须编写代码,并通过 API 将 AI 工具与外部系统连接,这意味着每个集成都需要预先编码。”AI 代理开发者 John Rush 说道,而“MCP 是一个标准协议。这意味着每个 AI 工具只需实现一次,然后就可以通过这个协议连接到数千个外部工具。”

 

开发者 Julian Harris 进一步补充道,MCP 提供了“一个将任何 API 转化为 LLM 工具插件的标准接口”,从而实现了“以超低摩擦的方式丰富 LLM 的上下文”。

 

然而,质疑声同样存在。有开发者将其类比为“为 AI 打造的 Zapier”,认为它不过是给 API 使用增加了额外步骤。

 

此外,部分人担忧,一些主流 LLM 服务商如 Grok 和 ChatGPT 等目前尚未支持该协议,且这些系统设计者极可能试图推行自有标准。不过,Anthropic 应用 AI 工程师 Mahesh Murag 曾表示,MCP 本身与 Anthropic 的 Claude 并无任何内在联系。

 

AI 领域瞬息万变。MCP 虽于去年发布,但近期突然爆火,也引发了人们对其“花期”能持续多久的讨论。LangChain 还在 x 上发起了一项投票:结合实际用例、与 OpenAI Plugin 的比较以及 MCP 自身的局限性,大家认为它到底是昙花一现、还是未来标准?

 

结果显示,有 40.8%的人认为 MCP 是未来标准,25.8%的人认为 MCP 只是昙花一现,剩下 33.4%的人选择观望。

 


如何打败一众标准,脱颖而出?

 

任何新协议的影响力,取决于其被采纳的程度。

 

被广泛接受的标准,如 Kubernetes、React 和 HTTP,通过将爆炸性的 MxN 问题转化为可管理的 M+N 生态系统解决方案来适应开发者们各种各样的需求。一旦达到临界规模,它们便将具有巨大的价值。

 

目前,MCP 已经积累了足够的临界规模和动能,因此它被视为 2023-2025 年“代理开放标准”之争的潜在赢家。有人预计,按照当前的速度,MCP 将在 7 月超越 OpenAPI:

 

许多“老派开发者”起初会对 MCP 的成功感到困惑,因为从技术层面来看,MCP 基本上具备与现有标准(如 OpenAPI、OData、GraphQL、SOAP 等)相同的功能。然而,如果将 MCP 简单地完全等同于 OpenAPI ,并认为它的成功只是一种潮流的循环,就过于武断。

 

MCP 可以视为是一种“AI 原生”标准,能够体现出每个 Agent 中独立复现的模式,相比那些未考虑这些特性而设计的不可知论标准,这种原生标准在使用和开发工具时会更加便捷和高效,这方面表现要超过 OpenAPI。

 

MCP 的出现相较第一波 LLM 框架较晚,它拥有足够的战略空间,避免从大模型互操作性这种“显而易见”的点切入,而是专注于以动态上下文访问为核心的那些还未解的棘手难题。因此,MCP 一定程度上优于 LangChain 等。

 

Murag 表示,MCP 并不会取代代理框架,而是通过提供可插拔的连接器和适配器来补充,并通过提供一致的工具交互方式,让开发者的工作变得更轻松。

 

“拥有很多支持者的开放标准”也意味着,该标准不能有任何致命缺陷。与其临时创造一个全新的标准,并冒着重蹈过去错误的风险,Anthropic 团队调整并采用了微软非常成功的语言服务器协议 (LSP)。

 

“对于期待以最优方案胜出的理想主义者来说,有个令人沮丧的现实:由大型实验室制定的标准,其成功概率天然碾压其他任何来源的标准。即便竞争者坐拥数万 GitHub Stars、有顶级风投数千万美元加持,这种不公平依然存在——如果创业公司会将我锁在其设立的标准中,那我肯定不会采纳;但若标准的支持者体量庞大,甚至不关心是否要刻意锁定用户,我则会欣然接受。”swyx 和 Alessio 在博客中写道。

 

真正的“开放标准”必须配备规范的文档,而在一些开发者眼里,MCP 的规范堪称典范,甚至令 OpenAI 的函数调用文档相形见绌——后者的技术说明尚未达到真正完备的标准规范要求。正因如此,MCP 不仅超越诸多开源框架,某种程度上甚至优于 OpenAI 的现有方案。

 

还有一个微妙的观点是——Anthropic 一直明确强调其支持的工具数量比 OpenAI 更多。我们实际上没有关于大规模工具数量的基准测试或消融实验,因此并不清楚不同公司之间的能力差异,但直观上,MCP 可以在一次调用中支持更多的工具,比没有 MCP 的工具数要多。



昙花一现还是未来标准?

 

昨天,围绕“MCP 是真正的技术突破,还是 AI 炒作浪潮下的又一朵浪花?”这一话题,LangChain CEO Harrison Chase 与 LangChain 创始工程师、LangGraph 负责人 Nuno Campos 展开了讨论。

 

其中,Harrison 更为看好 MCP,认为如果需要向无法控制的智能体中引入工具,MCP 就是最好的选择。而 Nuno 则认为,MCP 的潜力上限也就到 Zapier 这个程度了,它至少得变得更像 OpenAI 的自定义 GPT,才配得上大家如今对它的关注和期待。

 

下面是两人的详细讨论过程,这种辩证对话希望可以对读者朋友们有所启发。

 

Harrison:我认为 MCP 确有真材实料。起初我也对它持怀疑态度,但在看到它的价值之后,我的想法也开始转变。总结来讲:如果需要向无法控制的智能体中引入工具,MCP 就是最好的选择。

 

这里我举个例子。对于 Claude Desktop、Cursor、Windsurf 之类的产品,身为用户的我们显然无法控制其底层智能体。也就是说,这些智能体只能访问少数内置工具。

 

但如果我想让它使用默认情况下不具备的工具,该怎么实现?为了做到这一点,就需要存在某种协议,让这些智能体知晓要如何调用其他外部工具。

 

我相信这一点对于非开发者创建的智能体同样意义重大。从目前的趋势来看,人们希望有更多主题专家能够参与到智能体构建中来,充分发挥自己的技术专长。我觉得这类创作者既没有编辑智能体逻辑的意愿、也缺少这种技术能力——但他们仍然希望智能体可以对接某些工具。这时候 MCP 就可以发挥作用。

 

Nuno:我觉得你可能低估了智能体在访问外部工具时,所带来的定制化调整工作量。当然,假设说 Windsurf 附带的网络搜索工具太差,用户想用更好的工具来替代,那这事确实成立。但这只能算是种改善,还称不上真正的变革性用例。

 

所谓变革性用例,就是只需引入一款神奇的工具,就能让 Cursor 实现其创作者都未曾设想过的新功能——但这在实践层面基本还行不通。在我接触过的几乎所有生产智能体当中,都需要根据提供的工具定制系统消息甚至是大量架构组件。

 

Harrison:确实,这些智能体的可靠性也许还不够高……但至少具备了一定的实用性。工具的描述和指令当然非常重要,但我们也得承认:

 

  1. MCP 支持工具定义——好的 MCP server 往往拥有超越一般方案的高质量工具描述。

  2. MCP 能够支持提示词——用户可以向其中添加更多指令。

  3. 随着底层模型的改进,现成工具在调用智能体方面的表现会越来越好。

 

我们当然不会指望有人能仅凭 MCP 集成加工具调用智能体就打造出下一款 Cursor,但其中的价值是不容忽视的,比如催生出更多内部或者个人智能体。

 

Nuno:也有道理,但我们自己的工具调用基准测试表明,当前模型约有一半的概率无法调用正确工具——这还是已经针对工具集量身定制了架构和提示词的测试场景。如果把这样的成功比例照搬到个人智能体这边,那基本就相当于不可用。

 

没错,模型会变得越来越好,但用户的期望也会水涨船高。这里我想引用贝索斯的说法,“我最喜欢顾客的一点,就是他们永远不会满足。他们的期望永远都是动态的、不断上升的,这是人性的反映。”

 

所以要想实现种种预期,我觉得唯一的可能性就是掌握完整技术栈——包括用户界面、提示词、架构、工具等。否则的话……就只能碰运气了。

 

Harrison:模型肯定会变得越来越好,我对这一点很有信心。所以无论目前智能体的成功率如何,未来这项指标只会逐步提升。

 

我觉得公平的比较不该把用 MCP 构建的智能体直接拿去跟拥有完善工具的智能体正面 PK。MCP 真正的价值,在于如何建立起中长期连接和集成能力。

 

就比如说 Zapier,它的功能是把电子邮件接入 Google Sheets、Slack 等平台。我可以创建无数个工作流,但并不是每个工作流都能拥有完善的智能体。而使用 MCP,我可以创建自己的智能体版本。那你如何评价 Zapier 这个例子?

 

Nuno:在 LangChain,这两年我们构建了一套包含 500 种工具的库,但我很少看到这些工具被频繁用于生产。它们都是按相同的“协议”实现,能够与任意模型兼容且灵活互换。那 MCP 到底有什么特别?是它强制要求在本地终端上运行上百万个 server,还是只跟桌面应用程序兼容?在我看来这甚至反而是个缺点。老实讲,我觉得 MCP 的潜力上限也就到 Zapier 这个程度了。

 

Harrison:我觉得 LangChaing 工具和 MCP 工具之间的最大区别,在于 MCP 并非面向智能体开发者。也就是说,它的主要服务对象,是那些无法直接把工具引入智能体的用户。

 

具体来讲,比如我要编写一款智能体来完成某项任务,那我使用 MCP 的可能性就是零。但这也不是 MCP 的目标用例。MCP 的意义是把工具引入我们无法控制的智能体,同时也让非开发者能够将工具跟智能体对接起来(LangChain 工具则更多以开发者为中心)。要注意,非开发者的数量要远远多于专业开发者。

 

至于目前的 MCP 使用形式?没错,我承认还不够好,但它肯定会变得更好。我会设想 MCP 的未来形态,比如只需单击一下就能安装 MCP 应用程序(而不再需要在本地终端运行 server),而且能在 Web 应用程序上开放访问。我敢打赌,这肯定会成为 MCP 接下来的发展方向。

 

那你觉得 MCP 需要做哪些改变,才能让你对它的作用和意义有所改观?

 

Nuno:这个嘛,我觉得 MCP 至少得变得更像 OpenAI 的自定义 GPT,才配得上大家如今对它的关注和期待。但自定义 GPT 甚至也没有多受欢迎。从这个角度看,MCP 又比 GPT 多了什么吸引力?

 

Harrison:其实在我看来,MCP 更像是种 Plugin 插件,当然插件也一直没太成功🙂,我都不确定自己有没有用过 Plugin,所以有些说法可能不够准确。但我觉得:

 

  • MCP 生态系统已经远远大于插件生态系统。

  • 大模型会越来越好,在工具使用能力方面也会越来越强。

 

Nuno:好吧,我不确定你说的是否属实。但我花了 5 秒钟时间,就只搜到了 893 个 MCP server。你好像更多关注提到 MCP 的推文数量,却忽略了人们到底在用它构建出多少东西🙂 但回到你没回答的问题,我觉得如果 MCP 真想在 AI 发展史上留下足迹,那至少需要:

 

  • 降低复杂性。为什么工具协议还需要涉及提示词和大模型补全?

  • 降低实现门槛。为什么服务于工具的协议还需要双向通信?没错,我认真看了项目团队列出的所有理由,但不好意思,我觉得“需要从服务器接收日志”说服不了我。

  • 要能在服务器上使用。要达成上述目标,无状态协议是关键——我们使用大模型来构建,并不代表我们就能舍弃长久以来积累到的业务扩展经验。历史告诉我们,一旦被搬上服务器就必然引发许多其他意外,比如身份验证等难以用分布式方式解决的问题。

  • 弥补质量损失。如果放任用户把各种工具塞进自己并不了解的智能体,必然会带来质量损失。

 

Harrison:你说得没错,我可能太过关注 MCP 的“热度”,却忽略了它的实际应用曲线。但帖子里其实也有很多唱衰的声音,也算是对我观点的一种驳斥和补充。

 

相关链接:

https://blog.langchain.dev/mcp-fad-or-fixture/

https://www.latent.space/p/why-mcp-won

https://thenewstack.io/model-context-protocol-bridges-llms-to-the-apps-they-need/

2025-03-12 16:1111057

评论

发布
暂无评论

创建spring boot starter

曾彪彪

Java spring Boot Starter

TNFE-Weekly[第七十二周已更新]

莹姐🙈

小程序 大前端 周刊

什么是云服务器,ECS它能干什么?

德胜网络-阳

中国云计算的云栖“坐标”

脑极体

将DevOps视为哲学——实施DevOps的绝佳方式

禅道项目管理

DevOps 测试 开发 持续交付

大项目写代码写到晕头转向?敏捷多项目框架解君愁

Learun

敏捷开发 软件开发

LeetCode题解:1. 两数之和,Map+队列+双指针,JavaScript,详细注释

Lee Chen

大前端 LeetCode

一定要写点什么?!

区块链永续合约交易所搭建,永续合约系统开发

想学习数据结构和算法,推荐给你 10 本优质书单

沉默王二

数据结构 算法 书单推荐

实践案例丨基于Raft协议的分布式数据库系统应用

华为云开发者联盟

raft 华为云

图计算黑科技:打开中文词嵌入训练实践新模式

腾讯云大数据

大数据

看动画学算法之:排序-快速排序

程序那些事

排序 快速排序 数据结构和算法 看动画学算法

基于electron桌面级脚手架的设计

久违

设计 大前端 全栈

不想码代码,你还能做什么?(一)

研发管理Jojo

项目管理 技术管理 PMO

5分钟带你掌握Makefile分析

华为云开发者联盟

makefile 脚本

中途转行学Java,如何赛过科班生?你只需要做到这几点

小Q

Java 程序员 架构 技术 基础

java中实现List集合中对象元素按其属性的中文拼音排序

云辰

东方证券企业架构之技术架构转型实践

BoCloud博云

云计算 容器 微服务 PaaS 博云

使用Valgrind调试Linux C++程序

Simon

c++ gdb Valgrind memcheck 内存泄漏

同城双活与异地多活架构分析

vivo互联网技术

架构 高可用 架构设计 高可用系统的架构

碰撞率下降75%!Mobileye与所托瑞安宣布双方合作重大进展

最新动态

docker 安装consul

云辰

案例解析丨Spark Hive自定义函数应用

华为云开发者联盟

spark UDF

USDT承兑商支付系统搭建,区块链支付平台开发

Python中的with是测试常用到的资源打开利器

陈磊@Criss

【写作群星榜】9.1~9.13写作平台优秀作者 & 文章排名

InfoQ写作社区官方

写作平台 排行榜 文章

从linux源码看epoll

无毁的湖光

Linux TCP Linux Kenel

Docker映射详解,没问题了!

程序员的时光

Docker

记一次node项目重构改进

华为云开发者联盟

Java 项目 方案

程序员快乐器之JAVA代码生成工具

Philips

敏捷开发 程序设计 软件架构 开发工具

“AI原生”标准MCP突然爆红!引爆LangChain大佬“内战”:是颠覆OpenAI的技术突破,还是配不上当前关注的玩具?_AI&大模型_褚杏娟_InfoQ精选文章