MCP Gateway：构建下一代 AI Agent 的“中枢网关”｜QCon北京

从「AI For What」到「Value From AI」，100+可落地实践案例打通 AI 实战最后一公里！

4 月 16 日-4 月 18 日，QCon 全球软件开发大会将在北京举办。本届大会锚定 Agentic AI 时代的软件工程重塑，聚焦 Agentic AI、多智能体协作、算力优化、技术债治理、多模态和 AI 原生基础设施等前沿话题，邀请来自腾讯、阿里、百度、华为、蚂蚁、小米、网易等企业技术专家，带来百余项真实落地案例，系统性分享前沿洞察与实战干货，以技术共创探索 AI 落地新路径。

小米架构师张平已确认出席 “Agent Infra 架构设计” 专题，并发表题为《MCP Gateway：构建下一代 AI Agent 的“中枢网关”》的主题分享。面对 AI Agent 集成异构模型与工具的挑战，他们设计了 MCP Gateway，以弥合 MCP 协议与企业级生产需求间的鸿沟。本次分享张平将核心分享：

如何实现 MCP 到 RPC/HTTP 的无损协议转换，接口编排及参数裁剪，使 AI 工具能如微服务般被标准化调用；
如何注入全链路可观测性与服务治理能力（限流、熔断、认证），保障生产级可靠性；
如何引入语义检索，实现基于自然语言的智能工具路由与发现。

张平，拥有超过十年的中间件架构研发经验，近年来在小米专注于 AI 与云原生架构的融合创新。作为核心架构负责人，主导构建了高并发、高可用的 AI 服务网关，为大规模 AI 模型服务化提供了关键基础设施。同时，深度参与了新一代 Agent 服务框架的设计与研发，并长期负责 RPC、Service Mesh 等核心中间件体系的架构演进与稳定性保障。目前主要研究方向为云原生环境下的大规模 AI 系统架构、智能体（Agent）服务化及下一代服务治理技术，致力于通过前沿架构推动业务效能与智能化水平的持续提升。他在本次会议的详细演讲内容如下：

演讲提纲
1. 引言：AI Agent 时代的架构新挑战
趋势与痛点：AI Agent 应用爆发，但工具/模型集成混乱、缺乏治理、难以观测
MC P 协议的机遇与局限：标准化了交互，但未解决生产化问题
我们的实践：MCP Gateway——连接 AI 智能与工程稳定的“中枢网关”
2. 核心设计一：协议融合——从 MCP 会话到 RPC 服务
架构转换：详解如何将 MCP 的会话式、流式协议，转换为异步、标准的 RPC/HTTP 请求
价值：让任何 MCP 工具无缝接入现有微服务治理体系
3. 核心设计二：注入生产级能力——可观测与治理
可观测性三支柱
Metrics：调用量、延时、错误率的实时监控
Tracing：完整的分布式调用链，精准定位跨模型/工具的性能瓶颈
Logging：结构化的请求与诊断日志
服务治理四要素
流控与容错：限流、熔断、负载均衡策略
安全：统一的认证与鉴权接入
4. 核心设计三：智能进化——语义检索与路由
超越名称匹配：为何需要基于语义的工具发现？
技术实现：利用嵌入模型为工具功能生成向量，通过向量数据库进行自然语言查询
演示场景：用户描述“分析这张图表”，网关自动路由至最匹配的“图表解读”工具
5. 典型应用场景案例
本部分聚焦 AI Coding 这个高价值 Agent 领域，展示 MCP Gateway 如何解决实际问题。
场景：AI Coding Agent
痛点：传统 AI 编码助手（如 Cursor）依赖固定工具集，难以接入企业内部的需求库、代码库、构建流水线、部署平台和私有代码知识库。
MCP Gateway 解法：
工具统一接入：将内部需求平台 API、GitLab API、CICD 平台、接口平台、治理平台、观测平台等全部封装为 MCP 工具，通过网关暴露给 Coding Agent
安全与治理：网关对 Agent 的所有代码仓库访问、服务器部署操作施加严格的权限控制（OAuth/OIDC 集成）和操作审计，避免越权
语义路由应用：当开发者提出“为这个功能添加监控”时，Agent 通过网关的语义检索，自动发现并组合调用“添加日志埋点”、“配置告警规则”、“生成监控仪表盘”等多个工具，完成端到端任务
6. 总结与展望
架构意义：让开发者聚焦 Agent 逻辑，平台保障稳定性与效率
未来展望：多网关协同、策略动态编排、更深入的意图理解
您认为，这样的技术在实践过程中有哪些痛点？
协议转换的保真度：MCP 的复杂流式、多轮会话语义在转换为静态 RPC 时，可能损失部分交互状态与实时性，需设计精细的状态机与补偿机制
语义检索的准确性：工具功能的向量化表示依赖描述文本质量，且自然语言查询存在歧义，如何实现高召回、高精度的匹配是持续挑战
治理策略的通用性：AI 调用具有长尾、突发的流量特征，传统微服务的限流熔断策略可能不适用，需探索适配 LLM 调用模式的动态治理策略
可观测的复杂性：单次 Agent 调用可能涉及数十次工具调用，生成海量跨度数据，对追踪聚合与根因分析带来巨大存储与计算压力
这些痛点要求在架构上平衡 AI 的灵活性与工程的标准性，持续迭代。
演讲亮点
从“单向协议适配器”到“双向治理内嵌”的架构深度
从“静态服务发现”到“动态语义路由”的能力跃升
听众收益
获得企业生产环境十万量级 tools 做到 AI Friendly 的实践性解法
获得对“AI 系统可观测性”深水区问题的实践性解法

除此之外，本次大会还策划了Agentic Engineering、多模态理解与生成的突破、记忆觉醒：智能体记忆系统的范式重塑与产业落地、具身智能与物理世界交互、Agent Infra 架构设计、AI 重塑数据生产与消费、AI 原生基础设施、AI 驱动的技术债治理、小模型与领域适配模型、大模型算力优化、Agent 可观测性与评估工程、AI for SRE等 20 多个专题论坛，届时将有来自不同行业、不同领域、不同企业的 100+资深专家在 QCon 北京站现场带来前沿技术洞察和一线实践经验。

更多详情可扫码或联系票务经理 18514549229 进行咨询。

创作场景

MCP Gateway：构建下一代 AI Agent 的“中枢网关”｜QCon 北京