6 月 1 日,英特尔宣布数据中心产品线多项最新进展,推出全新英特尔至强 6+处理器,发布以太网 800 系列新成员:英特尔以太网 E835 控制器及网络适配器,并披露了 AI 加速器路线图更新,包括新一代数据中心 GPU Crescent Island 的更多信息。
英特尔至强 6+处理器晶圆(图片来源:英特尔公司)
这组产品更新背后,传达了英特尔对当下 AI 基础设施趋势的观察:多智能体时代,数据中心的瓶颈不再只是单点算力,而是系统级协同能力。CPU、网络、GPU、内存、I/O 和软件栈之间如何配合,正在成为智能体 AI 能否规模化落地的关键。
英特尔公司执行副总裁兼数据中心事业部总经理 Kevork Kechichian 表示,AI 的扩展之道不在于简单堆叠 GPU、CPU 和网络等部件,而在于系统协同运作。随着 AI 迈向智能体时代,编排、并发和数据流动成为新的限制因素,这也再次强化了 CPU 作为现代 AI 基础设施控制平面的核心地位。
他表示,通过至强 6+和以太网 E835,英特尔正在更紧密地耦合计算与网络,以减少现实世界智能体工作流中的瓶颈,并帮助其实现高效、安全的扩展。
CPU 重新回到 AI 基础设施中心
过去两年,AI 基础设施讨论的核心更多围绕 GPU 展开,尤其是在大模型训练和前沿模型推理场景中,GPU 被视为最关键的算力资源。但英特尔认为,随着 AI 应用进入智能体阶段,CPU 的重要性正在重新上升。
原因在于,智能体并不是简单的一次模型调用,它往往涉及多步骤任务、多智能体协作、子智能体派生、工具调用、沙箱启动与销毁、上下文管理、任务调度、跨系统数据访问和持续执行。在这一过程中,GPU 仍然承担推理、生成和优化任务,但 CPU 需要承担更复杂的编排、调度、执行、模拟和系统管理工作。
这也正在改变数据中心内部 CPU 与 GPU 的配比。英特尔数据中心芯片工程团队负责人 Tim Wilson 表示,过去,在大规模训练集群中,CPU 与 GPU 的比例可能是 1:8。但在智能体工作流中,CPU 承担的任务正在增加,比例可能逐步向 1:4、1:2 甚至 1:1 变化,部分强化学习或复杂智能体场景中,CPU 需求还可能进一步上升。
英特尔认为,这正是至强处理器的新机会。企业市场的大量业务负载、软件栈和现有基础设施已经构建在 x86 和至强平台之上。智能体要在企业环境中落地,往往不是推倒重来,而是在现有系统、数据库、应用服务、网络和云原生环境中进行扩展。因此,CPU 作为系统控制平面,仍将承担重要角色。
英特尔预计,到 2030 年,基础工作负载与 AI 工作负载的增长大致各占一半,现有数据中心架构仍将承载接近一半的工作负载。这意味着,AI 时代的数据中心不会只由加速器决定,x86 架构仍会在传统业务、推理和智能体 AI 工作负载中保持重要位置。
基于 Intel 18A,至强 6+面向高密度智能体工作负载
此次发布的至强 6+,是英特尔至强 6 家族的新成员,也是首款采用 Intel 18A 制程工艺打造的数据中心 CPU。英特尔将其定位为面向云原生、5G 核心网、智能体 AI 和网络密集型工作负载的高密度、高能效处理器。
英特尔至强产品总监 Kira Boyko 表示,现代 5G 核心网和云原生工作负载正在对基础设施提出更高要求,行业主要需求集中在三个方面:在更少机架空间内处理更多任务,提升每瓦性能以降低总体拥有成本,以及为关键业务部署提供更高可靠性。至强 6+正是围绕这三类需求设计。
在核心规格上,至强 6+最多提供 288 个能效核(E-core),支持最高 8000 MT/s 的 DDR5 内存,并配备最高 576MB 末级缓存(LLC),缓存容量较上一代产品提升超过 5 倍。该处理器还支持 12 通道 DDR5 内存、96 条 PCIe Gen 5 通道以及 CXL 能力,以提升高密度系统中的内存带宽和异构基础设施数据流动能力。
制程方面,至强 6+受益于 Intel 18A 中的 PowerVia 和 RibbonFET 等技术。其中,PowerVia 通过更短、更直接的供电路径降低功耗,RibbonFET 则有助于降低待机功耗并提升性能一致性。
英特尔还在至强 6+中引入了应用能效遥测技术(Intel AET)。这一技术可以让数据中心运营商在工作负载层级实时查看 CPU 核心功耗与运行状态,从而支持更精细化的资源调度、成本分摊和能效优化。对于电信、云服务和企业数据中心来说,这类工作负载级能耗可见性,正在成为降低 TCO 的重要手段。
安全方面,至强 6+通过英特尔 SGX 和 TDX 支持机密计算,并新增密码学算法加速能力。英特尔表示,这些能力不仅用于保护当前工作负载,也是在为企业和云环境中的可信计算构建基础。
在性能和能效之外,英特尔重点强调至强 6+带来的数据中心整合能力。
英特尔称,相比第二代至强处理器,至强 6+最高可实现 9:1 的服务器整合比例。也就是说,过去需要 9 台服务器承载的工作负载,现在可以由 1 台服务器完成。英特尔数据中心集团技术产品总监杨锦文进一步表示,至强 6+相比第二代至强,还可带来约 80%的空间节省和约 73%的能源节省。
这意味着,对于已经部署大量传统工作负载的数据中心客户来说,至强 6+不仅能提升既有负载运行效率,也可能通过压缩传统业务占用的机架空间、电力和散热资源,为 AI 集群释放更多基础设施容量。
至强 6+也已经在电信网络基础设施中进行测试。英特尔表示,爱立信已在实际运营商部署中测试至强 6+用于分组核心网。与上一代 E-core 相比,在相同核心数量下,性能提升约 30%,每瓦性能提升超过 60%,运行期间机架功耗降低 38%。随着 5G 流量尤其是上行流量持续增长,这类能效提升对运营商控制成本和能耗至关重要。
目前,至强 6+相关平台已经进入生态系统,包括华硕、戴尔科技、爱立信、技嘉、慧与、联想、超微等厂商提供或采用的服务器、网络和集成解决方案。
多 Agent 并发下,CPU 要处理更多调度与沙箱任务
围绕智能体 AI 场景,英特尔进一步解释了至强 6+的适配逻辑。
英特尔 SoC 架构专家曾义向 InfoQ 表示,在 Agent 任务中,会出现多个 Agent 和多个 Sub Agent 同时调用的情况。系统可能在短时间内频繁启动和销毁大量 Agent 或沙箱,这要求 CPU 具备更高并发密度和更强短期响应能力。至强 6+作为单 SoC 最高支持 288 核心的架构,能够以较好的 TCO 支撑这类高密度 Agent 需求。
杨锦文表示,在至强 6+ 288 核心场景下,按照常见云服务中 2 个核心配 4GB 内存、或 1 个核心配 2GB 内存的配置,轻松部署 400 至 500 个以上 Agent 是比较常规的操作。具体上限取决于客户配置、任务类型和服务等级协议(SLA)要求。
不过,Agent 并发不仅考验核心数量,也考验内存带宽和容量。曾义表示,当 Agent 数量增加后,每个 Agent 都需要对应的内存带宽和容量支持。如果只有带宽但容量不足,或者只有容量但带宽不足,都会形成瓶颈。英特尔希望通过 DDR 技术、更多内存通道和更高内存速率,在成本、容量和带宽之间取得平衡,从而最大化 Agent 部署密度。
此外,Agent 时代也会带来更强的跨设备调度需求。AI 系统可能频繁调用 CPU、GPU、NPU、DSP、FPGA 等不同计算单元,涉及低延迟任务分发、数据一致性管理和异构编排。曾义表示,这相当于对 CPU 核心算力、内存带宽与容量、I/O 能力进行全方位压力测试。好的系统架构不仅要看某个接口的峰值能力,更要看 CPU 占用率提升到较高水平时,系统能否在各环节合理分配带宽,并保持总体性能均衡。
网络从“高速传输”走向系统能效优化
除了至强 6+,英特尔此次还发布了以太网 800 系列新成员 E835 控制器及网络适配器。
随着 AI、云和分布式工作负载持续扩展,网络已经不只是传输通道,而是影响整体系统效率的关键因素。英特尔认为,网络不能再只满足于“足够快”,还必须主动支撑系统能效优化。
E835 聚焦性能、可靠性、灵活性和效率四个方向,面向现代数据中心、企业、边缘和 AI 环境提供网络连接能力。该产品支持最高 200GbE 以太网吞吐量,覆盖 10GbE 到 200GbE 数据速率,支持 2×25G、4×25G、2×100G、1×200G 等端口配置,并可通过英特尔以太网端口配置工具(EPCT)进行更多自定义。
在性能方面,E835 支持 RDMA,包括 RoCEv2 和 iWARP,以降低 CPU 占用率并提升效率;同时支持动态设备个性化(DDP),以简化数据包处理流程并提升应用性能。
在能效方面,英特尔表示,E835 的功耗约为主要竞争对手的一半。当以全双向 200G 线速运行时,E835 功耗比同类产品低 28%至 47%,满载工作负载下每瓦性能达到同类产品的 1.4 至 1.9 倍。这意味着客户可以在不突破既有功耗和散热预算的前提下,提高网络密度和性能。
在可靠性和可管理性方面,E835 支持硅芯片信任根、带签名 SPDM、设备和固件证明,并支持 NC-SI 1.2 等可管理性协议。英特尔称,E835 提供超过 10 年的产品生命周期和官方支持,有助于客户降低 TCO 并确保平台稳定性和供应连续性。
英特尔技术专家 Kevin Cai 表示,AI 发展对网卡带宽、延迟、安全和管理能力提出了新要求。英特尔主要聚焦 AI 网络前端部分,E835 相较同类产品在能效比上有明显提升,并通过广泛操作系统支持和长期互操作测试,为客户提供更灵活、高性价比的选择。目前已有不少客户开始 E835 适配工作,英特尔预计将很快与合作伙伴共同推向市场。
在边缘和电信场景中,E835 还可与至强 6 高精度时钟提取与分发能力结合,用于 5G 专网等应用。Kevin 表示,过去一些昂贵的纳秒级时钟提取设备,如今可以通过至强 6 加 E835,以更低成本实现约 10 纳秒精度的时钟提取,并维持 5G 专网时钟同步。
面向智能体 AI 推理的大显存 GPU
在 AI 加速器路线图方面,英特尔披露了新一代数据中心 GPU Crescent Island 的更多信息。
英特尔 AI 加速器负责人 Anil 表示,推理和智能体 AI 正在成为 AI 领域增长最快的细分市场之一。智能体工作负载通常是多步骤、多推理、多计算的,并对内存提出前所未有的压力。更重要的是,智能体 AI 会推动 Token 生成量呈指数级增长,相关工作负载可能带来 1000 倍 Token 消耗增长。
在这一背景下,客户需要以合适成本、大规模且高效地交付 Token。系统内部也会出现持续交互:GPU 负责推理、思考、代码生成和优化,CPU 负责组织、模拟、调度和执行。计算、网络、内存和软件都承受压力,因此基础设施设计必须重新平衡计算、内存、带宽、网络和 I/O。
Crescent Island 基于 Xe3P 架构,专为 AI 推理和智能体工作负载优化。英特尔称,该 GPU 采用 LPDDR 内存与高密度背面通道,最高支持 480GB 内存容量。由于 LPDDR 功耗较低,Crescent Island 可将热设计功耗控制在 350W,并采用风冷 PCIe 外形规格,适合现有风冷数据中心部署。
据悉,Crescent Island 面向长上下文模型、大容量内存、高效率、低功耗和优化 TCO 而设计。更高内存容量使其能够支持超长上下文,并可存储多个模型,实现更快模型切换。该 GPU 支持广泛 AI 数据类型,并支持原生 FP64,因此也具备面向部分 HPC 应用的潜力。
杨锦文表示,以国内先进大模型 DeepSeek-V4 为例,其标准版参数量为 1.6T。在 F8 量化精度下,仅需 4 张最高 480GB 内存的 Crescent Island GPU 即可支持模型部署。当然,如果希望获得更理想运行效果,还需要更多显存容量。至于具体 Token 生成速度,英特尔此次尚未披露,将在后续合适时间发布更多细节。
软件栈:上游优先,降低 AI 部署阻力
英特尔强调,硬件之外,软件生态是至强和 GPU 产品能否成功落地的关键。
Kevork Kechichian 表示,企业级部署规模庞大,用户并不一定是深谙硬件细节的专家,他们真正关心的是能否顺畅运行框架和模型,并获得业务成果。因此,英特尔需要为每一代新硬件提供 Day 0 即刻支持,确保开发者和客户可以无缝使用底层库和框架。
这些框架既包括 PyTorch、TensorFlow 等主流框架,也包括 vLLM、Llama、SGLang 等面向推理和智能体的 AI 基础层和框架。英特尔表示,其开放式可编程 AI 软件栈会采用“上游优先”策略,将对至强 CPU 和英特尔 GPU 平台的支持合并到上游,以降低部署阻力。
Anil 表示,英特尔围绕 Xe 软件栈构建了四项原则:开放、规模化性能、优秀用户体验和支持异构基础设施。基于这些原则,英特尔会支持行业标准框架,将 GPU 集成到现代部署环境中,并通过 oneAPI 等底层技术提供全栈 AI 软件能力。
英特尔还表示,Arc Pro B70 软件开发工具包展示了开发者所需的前向和后向兼容性。未来,开发者可以在 B70 上开发,并部署到 Crescent Island 上。
展望后续路线图,英特尔还提到了下一代产品 Diamond Rapids。
Kevork Kechichian 表示,英特尔正在从芯片级产品转向更深层次的机架级解决方案。他强调,在数据中心市场,“最终产品不是芯片,最终产品实际上是机架级别的”。英特尔需要进一步扩展到数据中心层面,面对成千上万个节点运行的场景,从系统、软件到节点行为进行端到端优化。
Diamond Rapids 将在核心数量、性能和通道数量方面继续提升,其中包括 16 通道版本,并提供大量 PCIe 通道以支撑数据传输,避免核心因数据不足而闲置。英特尔将持续关注核心与带宽、核心与内存通道之间的平衡,为客户寻找最佳配置点。
杨锦文补充称,18A 首先用于至强 6+的 E-core 产品,主流是 288 核心的 6900 系列。P-core 不会被替代,而是会随着产品线继续演进。2027 年,英特尔下一代产品 Diamond Rapids 将基于 18A P 版本发布。英特尔希望通过多元化产品组合,在性能和能效上为客户提供差异化选择。





