Build 2026：Azure API Management 推出统一模型API并新增MCP内容安全能力

微软在 Build 2026 开发者大会上宣布，将全面增强 Azure API Management 的 AI 网关能力。本次主要新增能力如下：一是推出统一模型 API（Unified Model API），客户端仅需使用一种 API 格式，Azure API Management 即可自动将请求适配为各类后端服务商对应的格式；二是 AI 网关现已支持接入 Anthropic 和 Google Vertex AI 旗下模型；三是内容安全策略升级，防护范围拓展至 MCP 工具调用以及智能体间（A2A）通信，与原有大语言模型流量一并纳入保护。

APIM 团队撰文指出：

相较于为智能体单独搭建专属治理平台，Azure API Management 可帮助企业将成熟的 API 治理规则直接沿用至新兴的智能体生态体系中。

统一模型 API 现已进入公开预览阶段，解决了企业团队日益突出的运营痛点——随着团队越来越多地混合使用 OpenAI、Anthropic、Google 等提供商的模型（基于性能、成本、延迟或区域需求方面的考虑），每个提供商暴露的 API 格式各不相同。统一模型 API 让客户端可以统一采用一种格式（目前为 OpenAI Chat Completions），APIM 会透明地将请求转换为后端提供商的原生格式，无论是 Anthropic Messages API 还是其他模式。团队可以更换后端提供商、添加新模型或在不同提供商之间路由流量，都无需修改客户端代码。

这不仅仅是一个简单的功能适配层。将模型访问统一接入单一 API 接口后，无论由哪家服务商执行推理，所有治理策略、限流规则、内容安全检测与令牌用量统计都可统一生效。已经使用 APIM 进行传统 API 治理的组织可以将相同的模式延伸至 AI 工作负载，无需额外引入独立的治理体系。

内容安全能力向 MCP 与 A2A 场景延伸是本次架构层的 llm-content-safety 策略原本用于对照 Azure Content Safety 扫描 LLM 请求和响应内容，现在已同步覆盖 MCP 工具调用参数、MCP 响应文本以及 A2A 智能体交互载荷。同时，该策略包含两层独立安全防护：分类内容过滤，针对仇恨、自残、色情、暴力四类内容进行管控，支持设置风险等级阈值，范围为 0（最严格）至 7（最宽松）；独立的 shield-prompt 属性，用于识别对抗性提示词注入攻击。典型配置示例如下：

<llm-content-safety backend-id="content-safety-backend" shield-prompt="true" enforce-on-completions="true">    <categories output-type="EightSeverityLevels">        <category name="Hate" threshold="4" />        <category name="Violence" threshold="4" />    </categories></llm-content-safety>

复制代码

团队需要注意的一个实现细节，即该策略在流式响应中的行为有所不同。在非流式模式下，一旦检测到违规内容，系统会直接返回 403 状态码。在流式模式下，策略会在滑动窗口中缓冲事件，并直接停止向客户端转发后续事件，且不会返回错误信息。因此，使用流式补全能力的智能体需适配这种内容中断的情况，不能依赖错误码做判断。两个新增的属性 window-size 和 window-overlap-size 可用于调整超长内容的拆分规则，适配 Azure 内容安全服务 10000 字符的评估上限。

词元统计指标已进行了升级，适配多提供商的使用场景。APIM 现在会将推理词元、缓存词元和音频词元记录到 Application Insights，支持 OpenAI Chat Completions、OpenAI Responses 和 Anthropic Messages API 等格式，可监控 Microsoft Foundry、OpenAI、Amazon Bedrock、Google Vertex AI 等多加服务商。对于需要构建成本仪表盘和预算警报的 FinOps 团队来说，扩展后的指标能够反映当前模型的实际行为——推理和缓存消耗了大量早期指标未能捕捉的词元预算。

在资源发现方面，Azure API Center 数据平面 MCP 服务器已正式发布（GA）。它可作为企业统一的资源发现端点：智能体和开发者工具可以通过单个 MCP 连接访问已注册的 MCP 服务器、工具、API、智能体及各类 AI 资产。当团队在 API Center 注册新的 MCP 服务器时，所有已连接的智能体都能自动发现它，无需逐个客户端重新配置。

APIM 现在还支持将已有的 REST API 暴露为 MCP 服务器，这意味着早于智能体时代的企业 API 无需重构即可被智能体调用。结合本次在 Build 大会上正式发布的 Logic Apps MCP 服务器，微软正在构建两条并行路径，帮助企业对接智能体：一条通过 API 网关层（APIM），另一条通过集成平台层（Logic Apps）。

对于正在评估 AI 网关方案的团队来说，行业竞争态势具有重要参考意义。亚马逊云科技的 Bedrock Guardrails 用于内容过滤和模型访问控制，但暂无产品可对标 APIM 的多厂商统一模型 API，以及针对 MCP、A2A 的全维度内容安全能力。谷歌的 Apigee 已添加一些 AI 网关功能，但尚未达到 APIM 现在覆盖的协议广度。Cloudflare 的 AI Gateway 侧重成本管控与缓存能力，而非多协议治理。APIM 的核心思路是：API 网关（而非全新品类产品）才是承载 AI 工作负载的天然控制平面。

AI 网关能力在所有 APIM 层级中均可用。统一模型 API 处于公开预览阶段。针对 MCP、A2A 的内容安全功能、升级后的词元指标以及 API Center MCP 服务器已正式发布（GA）。AI Gateway 实验室提供 30 多个实操 Jupyter Notebook，包含分步说明和可部署的 Bicep 模板。

查看英文原文：https://www.infoq.com/news/2026/06/azure-apim-ai-gateway-build/

创作场景

Build 2026：Azure API Management 推出统一模型 API 并新增 MCP 内容安全能力