以终为始，场景定义算力“革命”_英特尔_吉他星系导航员



 写点什么



大小：1.94M时长：11:16

AI+ 时代对算力的需求，不再是一个芯片 + 算法的简单组合，而是一整套“硬件、算法、平台、服务”的解决方案。

从技术本质剖析，AI 模型的训练与推理均高度依赖强大的算力支撑。训练阶段，海量数据需快速处理分析以提取有效特征和模式，这要求算力具备卓越的计算速度与并行处理能力；推理阶段，算力则需实现实时或近实时响应，确保对输入数据的高效准确处理，满足实际应用场景需求。

然而，AI 在各行业的落地进程中，既取决于算力在特定场景下的性能表现，也受制于相应解决方案的实施成本。所以对于算力供应方来说，精准把握业务需求并实现最优性能并非易事。底层基础设施与上层业务之间天然存在隔阂。

因此大家都在思考：支撑 AI 发展的 AI Infra（人工智能基础设施），要怎样才能适应不同行业的需求，实现“自我进化”？作为提供算力的基础，CPU 和云计算产品一直在尝试创新，它们能否打破当前阻碍 AI 落地的算力限制，帮助 AI 更快地在各个行业发挥作用？这些问题亟待探索与验证。

更“接地气”的算力解决方案

首先让我们看看这场“自我进化”，应当包含哪些核心命题。大概是：高性能、高稳定性、更普惠的价格，以及在特定场景下有可验证、可量化的效果提升。

其中一大关键，在于更务实地评估 AI 业务的未来体量，以终为始，有魄力选择最优性价比的硬件方案。

因为 AI 技术要实现真正的大规模落地，核心要解决两个问题：一是降低使用门槛，二是降低部署和运营成本。

而具体到解法，英特尔 + 阿里云给出第九代企业级实例 ECS g9i 的答案。

相比第八代实例，ECS g9i 算力最高提升 20%，其中全核睿频达 3.6GHz； L3 缓存提升 50%，达到 504MB；内存频率达到 6400MT/s，与此同时，价格还降低了 5%。

全核睿频 3.6GHz，意思是处理器在多核高负载下仍能保持较高频率，这一方面与制程工艺有关，一方面与散热设计有关。

而 L3 缓存是与内存之间的高速存储层，容量越大，CPU 访问数据的延迟越低。

内存频率则是指内存的数据传输速率。当前市场实际是 DDR4 和 DDR5 并存的状态，一般来讲 DDR4 的最高频率为 3200 MT/s。按 JESD79-5 标准，DDR5 内存的频率则是从 4800MT/s 起跳，6400MT/s 属于高端配置，接近 DDR5 的极限。

以上数据意味着 ECS g9i 瞄准的是对业务效果有着高要求，但在 TCO 维度正在寻找更优解的场景和公司。通常来讲，这类业务对云实例在弹性、安全、稳定性方面的要求也比较高，任何疏忽都将带来非常直观的业务损失。

因此， ECS g9i 的升级，一部分也在于平台能力的提升。据阿里云技术专家介绍， ECS g9i 已全面支持弹性临时盘，标配 eRDMA，单盘吞吐最大 4GB，延时降低至 8us。通过英特尔^® TDX 机密计算功能，ECS g9i 实现了物理级的安全隔离；通过双单路架构设计，提升了整体服务的稳定性，缩小了爆炸半径。

ECS g9i 的底层，是阿里云 CIPU 体系，即 Cloud Infrastructure Processing Unit，云基础设施处理器。阿里云判断，传统云计算经历了大型机替代（第一阶段）和超大规模云计算服务（第二阶段），正进入以“硬件加速 + 资源虚拟化”为核心的第三阶段，所以需要 CIPU 向上对接飞天操作系统，完成上层资源调度、虚拟化管理和服务编排；向下负责底层硬件加速和资源管控，将计算、存储、网络资源以“0”损耗的方式交付给飞天。

在底层的硬件资源上，与 ECS g9i 成为“搭档”的是英特尔^® 至强^® 6 性能核处理器。选用部署广泛的 CPU，无疑降低了企业的门槛。且相比于前一代产品，至强^® 6 性能核处理器单插槽集成的物理核心数量翻了两倍，单核平均性能提升 1.2 倍，每瓦平均性能提升 1.6 倍，TCO 降低 30%。

除了芯片工艺本身，为了让 ECS g9i 能更好地服务 AI 推理场景，英特尔^® AMX 技术也起到了重要作用。

英特尔^® 引入了专用矩阵乘法指令（TMUL），通过硬件级优化大幅加速矩阵运算（如深度学习中的卷积操作）同时支持 INT8（低精度量化）、BF16 和 FP16（半精度浮点）三种数据格式，完美适配 2024-2025 AI 进入业务时的实际技术环境。

而这些创新的背后是英特尔的洞察，英特尔以往强调性能与算力，而未来将把重心转向可用性与工程集成能力，致力于降低用户的使用门槛。英特尔不局限于单纯销售芯片或设备，而是携手合作伙伴提供涵盖驱动、工具链、SDK 等在内的软件和服务，以缩短 AI 项目的上线周期。

英特尔与阿里的携手合作，将在阿里云平台上为用户提供更多高度优化、开箱即用的解决方案，让不同经验水平的用户，无论是资深从业者还是 AI 新手，都能从中受益。

AI Infra，正在为业务带来新增量

除了上述提到合作，英特尔还与阿里云的 PaaS、SaaS 等多种产品展开深度合作，使更多终端用户能够享受到合作带来的红利。

ECS g9i 与英特尔^® 至强^® 6 性能核处理器的组合，尤其在垂直场景的成绩相当不错，用于支撑 Web 类应用，性能提升 20%；支撑数据库业务时，性能提升 17%；支撑在线游戏业务时，性能提升 15%。当然，这样的性能表现，与 ECS g9i 对业务场景的理解和适配也密不可分。

以数据库业务为例。作为阿里云最广为人知的云原生数据库，PolarDB 衍生出了一个专门服务于 AI 场景的扩展版本，叫作“PolarDB for AI”，其核心在于通过 In-DB Model as an Operator 技术，将 AI 模型直接嵌入数据库内进行加速处理。

In-DB 就是 AI In DataBase。而 Model as an Operator ，就是说将模型封装为数据库原生操作符，像调用 SQL 函数一样，调用大模型。模型创建、模型评估、模型推理等功能，全部可以用 SQL 语句来完成。

对比传统数据库，这样的设计理念直接减少了数据移动，使数据库内嵌模型可以实时处理最新数据（如流数据），并保证事务一致性。同时进一步简化了开发流程，减少了运维开销。

但这也意味着，相比于传统云原生数据库，PolarDB for AI 需要更强大的算力支持。

比如，PolarDB for AI 的架构中集成了 DeepFM 推理推荐算法，用户可通过 SQL 查询直接调用 DeepFM 进行推理，服务于点击率预测（CTR）或推荐排序等场景。这一般对算力的要求更高，推荐效果也更好。

而 ECS g9i 从软硬件两方面，都对 DeepFM 算法进行了加速。包括做到算子融合，减少冗余访存；推进框架优化，使用更高效的推理引擎；针对大小并发场景，还可以用 AVX-512 和英特尔^® AMX 分别加速向量计算和矩阵计算。最终实现对比上一代产品每核推理性能提升约 1.26 倍 -2.53 倍。

在对抗 DeepFake 的风控场景，服务蚂蚁数字科技的 ZOLOZ Deeper 产品时， ECS g9i 与英特尔^® 至强^® 6 性能核处理器的组合，也拿出了很好的表现。

ZOLOZ Deeper 是为了应对 AI 换脸、深度伪造等技术带来的安全威胁而研发的，其核心目标是通过端云一体的全链路技术体系，确保生物特征数据的真实性和安全性，广泛应用于身份认证、金融风控等场景。

ZOLOZ Deeper 的技术体系分为前端安全检测和后端深度学习模型分析两大模块：前者用于检测摄像头状态，实时分析用户行为，做好生物特征采集；后者做微表情和肌肉纹理分析，完成攻防迭代优化。

在这样的技术体系下，ECS g9i 的性能表现和 AMX 加速技术变得非常重要。

首先，这种技术方案避免依赖价格高昂的 GPU 集群，而在英特尔^® AMX 的加持下，ECS g9i 能够高效处理小模型推理任务，TCO 大幅度降低。

同时，英特尔^® OpenVINO^™ 工具套件对 CPU 进一步进行优化，使其达到峰值效率，提升了视觉模型推理的性能，使端到端性能提升约 10%。

这便是英特尔持续优化创新，以软件重新定义硬件，满足软件需要的低精度的计算、高带宽的要求，让芯片上每一个单元都能发挥最大价值，极大降低部署和运营成本，提升整体效率。

可以说，ECS g9i 是 AI 应用落地大趋势影响下的技术产物，搭配英特尔^® 至强^® 6 性能核处理器，为行业提供了更“接地气”的算力解决方案，在垂直业务场景，实现了算力成本上的“以小博大”。

未来 AI 发展的关键词是简单、稳定、高效、便宜，不再是一个芯片 + 算法的简单组合，而是一整套“硬件、算法、平台、服务”的解决方案。AI 要真正普及，必须靠软硬一体、工程思维和生态协作来共同推动。

在 5 月 8 日的直播中，来自英特尔、阿里云、PolarDB、蚂蚁数字科技的几位专家，详细分享了算力引擎是如何加速 AI 应用落地进入“快车道”的，感兴趣的读者可以点击【链接】查看直播回放视频进一步了解。

AI+ 算力 + 场景的共生进化

今天的企业，面临的问题不再是“要不要用 AI”，而是“怎么用得更聪明”。

过去，AI 技术往往被当作一个独立的“黑匣子”，企业要么堆算力，要么被复杂的部署流程劝退。但如今，ECS g9i 在 PolarDB for AI 、ZOLOZ Deeper 等多个场景的应用效果，正在证明一件事：AI 的落地不是“非此即彼”的选择题，而是需要根据业务场景，把算力、模型、数据捏合成一套“组合拳”。

这场变革的真正难点，在于如何让技术与产业“长在一起”。比如，来自 PolarDB 、ZOLOZ Deeper 的应用场景，加上 ECS g9i 以及英特尔^®至强^® 6 性能核处理器，再配合英特尔^® OpenVINO™ 工具套件、英特尔^®AMX，才能发挥最大价值。

而这种生态上的协同，比以往出现的更加密集，也更加重要——它们共同解决了数据格式兼容、模型部署效率、业务场景适配等问题。需要相关企业长期扎根行业，丰富解决方案案例库。

好在，相关企业有充足的理由来完成这项长期投资。毕竟，谁能在自己的业务场景中，把算力调得“刚刚好”——既不浪费资源，也不拖后腿，谁就能在 AI 时代抢得先机。

技术进化不等人！抢先掌握 Intel 最新动态！

→ 点击「链接」，直达本期英特尔“云端进化论”课程，发现最新技术、产品与解决方案！

发布

暂无评论

创作场景

以终为始，场景定义算力“革命”

更“接地气”的算力解决方案

AI Infra，正在为业务带来新增量

AI+ 算力 + 场景的共生进化

评论

腾讯大数据基于 StarRocks 的向量检索探索

全球人形机器人行业2024年度汇总和行业前瞻报告

高效前端应用：基于 Vue3 的低代码开发实践

炸裂：SpringAI内置DeepSeek啦！

本地搭建DeepSeek和知识库

借助GPT-4开启游戏开发之旅

【YashanDB知识库】YashanDB 支持MySQL多表更新语句的解决方法

卓翼智能助力四川筠连山体滑坡夜间救援

简洁高效的多窗格文件管理器QSpace Pro for mac中文激活版

基于人工智能技术的图像处理软件Topaz Photo AI for mac激活版

Unity 专家分享2025年移动游戏行业七大趋势展望

项目管理资格证书对职业发展的7大影响

硬件信息监测软件iStat Menus for mac中文激活版

优秀的词典工具Eudic欧路词典 for Mac中文激活版

人工智能丨deepseek是什么？我们能用它来做什么？

全链路数据引擎：WhaleStudio驱动下的大数据调度与同步智能革新

《王者荣耀》鸿蒙版上线后首次全民竞技之约！无缝流转新体验

音频合成器插件Arturia Analog Lab Pro V for mac直装激活版

普通人怎样用好DeepSeek

DS缩写乱争：当小海豚撞上AI顶流，技术圈也逃不过“撞名”修罗场

【YashanDB知识库】MySQL和YashanDB 隐式转换不一致引起的报错

Vue.js 与低代码开发：如何实现快速应用构建

【YashanDB知识库】从PostgreSQL迁移到YashanDB如何进行数据行数比对

Go 1.24.0 重磅发布：新特性、新工具，开发者必看！

低代码开发平台与 Vue.js 的深度融合

BRASS管乐器演奏插件Arturia Augmented BRASS for mac激活版

OpenSearch LLM 智能问答版基于 Deepseek-R1 一分钟搭建 RAG 系统

DeepSeek正重构人形机器人和具身大模型赛道！

Klook获1亿美元融资，推动全球旅游体验行业持续增长

创作场景

以终为始，场景定义算力“革命”

更“接地气”的算力解决方案

AI Infra，正在为业务带来新增量

AI+ 算力 + 场景的共生进化

评论

推荐阅读

电子书

大厂实战PPT下载