写点什么

以终为始,场景定义算力“革命”

  • 2025-05-26
    北京
  • 本文字数:3814 字

    阅读完需:约 13 分钟

大小:1.94M时长:11:16
以终为始,场景定义算力“革命”

AI+ 时代对算力的需求,不再是一个芯片 + 算法的简单组合,而是一整套“硬件、算法、平台、服务”的解决方案。


从技术本质剖析,AI 模型的训练与推理均高度依赖强大的算力支撑。训练阶段,海量数据需快速处理分析以提取有效特征和模式,这要求算力具备卓越的计算速度与并行处理能力;推理阶段,算力则需实现实时或近实时响应,确保对输入数据的高效准确处理,满足实际应用场景需求。


然而,AI 在各行业的落地进程中,既取决于算力在特定场景下的性能表现,也受制于相应解决方案的实施成本。所以对于算力供应方来说,精准把握业务需求并实现最优性能并非易事。底层基础设施与上层业务之间天然存在隔阂。


因此大家都在思考:支撑 AI 发展的 AI Infra(人工智能基础设施 ),要怎样才能适应不同行业的需求,实现“自我进化”?作为提供算力的基础,CPU 和云计算产品一直在尝试创新,它们能否打破当前阻碍 AI 落地的算力限制,帮助 AI 更快地在各个行业发挥作用?这些问题亟待探索与验证。

更“接地气”的算力解决方案


首先让我们看看这场“自我进化”,应当包含哪些核心命题。大概是:高性能、高稳定性、更普惠的价格,以及在特定场景下有可验证、可量化的效果提升。


其中一大关键,在于更务实地评估 AI 业务的未来体量,以终为始,有魄力选择最优性价比的硬件方案。


因为 AI 技术要实现真正的大规模落地,核心要解决两个问题:一是降低使用门槛,二是降低部署和运营成本


而具体到解法,英特尔 + 阿里云给出第九代企业级实例 ECS g9i 的答案。


相比第八代实例,ECS g9i 算力最高提升 20%,其中全核睿频达 3.6GHz; L3 缓存提升 50%,达到 504MB;内存频率达到 6400MT/s,与此同时,价格还降低了 5%。



全核睿频 3.6GHz,意思是处理器在多核高负载下仍能保持较高频率,这一方面与制程工艺有关,一方面与散热设计有关。


而 L3 缓存是与内存之间的高速存储层,容量越大,CPU 访问数据的延迟越低。


内存频率则是指内存的数据传输速率。当前市场实际是 DDR4 和 DDR5 并存的状态,一般来讲 DDR4 的最高频率为 3200 MT/s。按 JESD79-5 标准,DDR5 内存的频率则是从 4800MT/s 起跳,6400MT/s 属于高端配置,接近 DDR5 的极限。


以上数据意味着 ECS g9i 瞄准的是对业务效果有着高要求,但在 TCO 维度正在寻找更优解的场景和公司。通常来讲,这类业务对云实例在弹性、安全、稳定性方面的要求也比较高,任何疏忽都将带来非常直观的业务损失。


因此, ECS g9i 的升级,一部分也在于平台能力的提升。据阿里云技术专家介绍, ECS g9i 已全面支持弹性临时盘,标配 eRDMA,单盘吞吐最大 4GB,延时降低至 8us。通过英特尔® TDX 机密计算功能,ECS g9i 实现了物理级的安全隔离;通过双单路架构设计,提升了整体服务的稳定性,缩小了爆炸半径。


ECS g9i 的底层,是阿里云 CIPU 体系,即 Cloud Infrastructure Processing Unit,云基础设施处理器。阿里云判断,传统云计算经历了大型机替代(第一阶段)和超大规模云计算服务(第二阶段),正进入以“硬件加速 + 资源虚拟化”为核心的第三阶段,所以需要 CIPU 向上对接飞天操作系统,完成上层资源调度、虚拟化管理和服务编排;向下负责底层硬件加速和资源管控,将计算、存储、网络资源以“0”损耗的方式交付给飞天。


在底层的硬件资源上,与 ECS g9i 成为“搭档”的是英特尔® 至强® 6 性能核处理器。选用部署广泛的 CPU,无疑降低了企业的门槛。且相比于前一代产品,至强® 6 性能核处理器单插槽集成的物理核心数量翻了两倍,单核平均性能提升 1.2 倍,每瓦平均性能提升 1.6 倍,TCO 降低 30%。


除了芯片工艺本身,为了让 ECS g9i 能更好地服务 AI 推理场景, 英特尔® AMX 技术也起到了重要作用。


英特尔® 引入了专用矩阵乘法指令(TMUL),通过硬件级优化大幅加速矩阵运算(如深度学习中的卷积操作)同时支持 INT8(低精度量化)、BF16 和 FP16(半精度浮点)三种数据格式,完美适配 2024-2025 AI 进入业务时的实际技术环境。


而这些创新的背后是英特尔的洞察,英特尔以往强调性能与算力,而未来将把重心转向可用性与工程集成能力,致力于降低用户的使用门槛。英特尔不局限于单纯销售芯片或设备,而是携手合作伙伴提供涵盖驱动、工具链、SDK 等在内的软件和服务,以缩短 AI 项目的上线周期。


英特尔与阿里的携手合作,将在阿里云平台上为用户提供更多高度优化、开箱即用的解决方案,让不同经验水平的用户,无论是资深从业者还是 AI 新手,都能从中受益。

AI Infra,正在为业务带来新增量


除了上述提到合作,英特尔还与阿里云的 PaaS、SaaS 等多种产品展开深度合作,使更多终端用户能够享受到合作带来的红利。


ECS g9i 与英特尔® 至强® 6 性能核处理器的组合,尤其在垂直场景的成绩相当不错,用于支撑 Web 类应用,性能提升 20%;支撑数据库业务时,性能提升 17%;支撑在线游戏业务时,性能提升 15%。当然,这样的性能表现,与 ECS g9i 对业务场景的理解和适配也密不可分。


以数据库业务为例。作为阿里云最广为人知的云原生数据库,PolarDB 衍生出了一个专门服务于 AI 场景的扩展版本,叫作“PolarDB for AI”,其核心在于通过 In-DB Model as an Operator 技术,将 AI 模型直接嵌入数据库内进行加速处理。


In-DB 就是 AI In DataBase。而 Model as an Operator ,就是说将模型封装为数据库原生操作符,像调用 SQL 函数一样,调用大模型。模型创建、模型评估、模型推理等功能,全部可以用 SQL 语句来完成。


对比传统数据库,这样的设计理念直接减少了数据移动,使数据库内嵌模型可以实时处理最新数据(如流数据),并保证事务一致性。同时进一步简化了开发流程,减少了运维开销。


但这也意味着,相比于传统云原生数据库,PolarDB for AI 需要更强大的算力支持。


比如,PolarDB for AI 的 架构中集成了 DeepFM 推理推荐算法,用户可通过 SQL 查询直接调用 DeepFM 进行推理,服务于点击率预测(CTR)或推荐排序等场景。这一般对算力的要求更高,推荐效果也更好。


而 ECS g9i 从软硬件两方面,都对 DeepFM 算法进行了加速。包括做到算子融合,减少冗余访存;推进框架优化,使用更高效的推理引擎;针对大小并发场景,还可以用 AVX-512 和英特尔® AMX 分别加速向量计算和矩阵计算。最终实现对比上一代产品每核推理性能提升约 1.26 倍 -2.53 倍。


在对抗 DeepFake 的风控场景,服务蚂蚁数字科技的 ZOLOZ Deeper 产品时, ECS g9i 与英特尔® 至强® 6 性能核处理器的组合,也拿出了很好的表现。


ZOLOZ Deeper 是为了应对 AI 换脸、深度伪造等技术带来的安全威胁而研发的,其核心目标是通过端云一体的全链路技术体系,确保生物特征数据的真实性和安全性,广泛应用于身份认证、金融风控等场景。


ZOLOZ Deeper 的技术体系分为前端安全检测和后端深度学习模型分析两大模块:前者用于检测摄像头状态,实时分析用户行为,做好生物特征采集;后者做微表情和肌肉纹理分析,完成攻防迭代优化。


在这样的技术体系下,ECS g9i 的性能表现和 AMX 加速技术变得非常重要。


首先,这种技术方案避免依赖价格高昂的 GPU 集群,而在英特尔® AMX 的加持下,ECS g9i 能够高效处理小模型推理任务,TCO 大幅度降低。


同时,英特尔® OpenVINO 工具套件对 CPU 进一步进行优化,使其达到峰值效率,提升了视觉模型推理的性能,使端到端性能提升约 10%。


这便是英特尔持续优化创新,以软件重新定义硬件,满足软件需要的低精度的计算、高带宽的要求,让芯片上每一个单元都能发挥最大价值,极大降低部署和运营成本,提升整体效率。


可以说,ECS g9i 是 AI 应用落地大趋势影响下的技术产物,搭配英特尔® 至强® 6 性能核处理器,为行业提供了更“接地气”的算力解决方案,在垂直业务场景,实现了算力成本上的“以小博大”。


未来 AI 发展的关键词是简单、稳定、高效、便宜,不再是一个芯片 + 算法的简单组合,而是一整套“硬件、算法、平台、服务”的解决方案。AI 要真正普及,必须靠软硬一体、工程思维和生态协作来共同推动。


在 5 月 8 日的直播中,来自英特尔、阿里云、PolarDB、蚂蚁数字科技的几位专家,详细分享了算力引擎是如何加速 AI 应用落地进入“快车道”的,感兴趣的读者可以点击【链接】查看直播回放视频进一步了解。

AI+ 算力 + 场景的共生进化


今天的企业,面临的问题不再是“要不要用 AI”,而是“怎么用得更聪明”。


过去,AI 技术往往被当作一个独立的“黑匣子”,企业要么堆算力,要么被复杂的部署流程劝退。但如今,ECS g9i 在 PolarDB for AI 、ZOLOZ Deeper 等多个场景的应用效果,正在证明一件事:AI 的落地不是“非此即彼”的选择题,而是需要根据业务场景,把算力、模型、数据捏合成一套“组合拳”。


这场变革的真正难点,在于如何让技术与产业“长在一起”。比如,来自 PolarDB 、ZOLOZ Deeper 的应用场景,加上 ECS g9i 以及英特尔®至强® 6 性能核处理器,再配合英特尔® OpenVINO™ 工具套件、英特尔®AMX,才能发挥最大价值。


而这种生态上的协同,比以往出现的更加密集,也更加重要——它们共同解决了数据格式兼容、模型部署效率、业务场景适配等问题。需要相关企业长期扎根行业,丰富解决方案案例库。


好在,相关企业有充足的理由来完成这项长期投资。毕竟,谁能在自己的业务场景中,把算力调得“刚刚好”——既不浪费资源,也不拖后腿,谁就能在 AI 时代抢得先机。


技术进化不等人!抢先掌握 Intel 最新动态!


→ 点击「链接」,直达本期英特尔“云端进化论”课程,发现最新技术、产品与解决方案!

2025-05-26 19:0211

评论

发布
暂无评论

2022 IoTDB Summit:IoTDB PMC 曹高飞《Apache IoTDB 秒级扩容能力与存算分离实践》

Apache IoTDB

数据库 IoTDB

JDK 环境配置

流火

Java centos jdk window

在深圳龙岗,看见空间智能化的潮水涌动

脑极体

全屋智能

Portraiture4中文免费ps滤镜磨皮插件

茶色酒

Portraiture3

爱不释手!阿里十几位大牛联玦整理—23年最全面试八股文合集

Java java面试 Java八股文 Java面试题 Java面试八股文

2.基于Label studio的训练数据标注指南:(智能文档)文档抽取任务、PDF、表格、图片抽取标注等

汀丶人工智能

自然语言处理 数据标注

会声会影2023中文最新版消息

茶色酒

会声会影2023

ChatGPT Turbo API 18元/100万个单词

kcodez

openai ChatGPT

新必应(New Bing)申请出错终极方案

kcodez

微软 ChatGPT New Bing

得物供应链复杂业务实时数仓建设之路

小小怪下士

Java 程序员 后端

手把手教你使用 Python 调用 ChatGPT-3.5-API

老表

Python GPT-3 ChatGPT

从理论到实践:MySQL性能优化和高可用架构,一次讲清

Java MySQL 数据库 面试 性能优化

开源如何推动云计算的发展与创新 | 雨林开源行

开源雨林

开源 kubenetes OpenStack

零基础如何学习Web 安全,如何让普通人快速入门网络安全?

网络安全学海

黑客 网络安全 信息安全 渗透测试 WEB安全

架构实战营模块1第3课 - 什么是面向复杂度架构设计

净意

人工智能+低代码,打通AI落地的最后“一公里”

明道云

一文彻底弄清楚分布式锁

Java 分布式锁

架构误区系列14:纯代码视角的复用

agnostic

复用

在文心一言出生地,百度悄悄燃烧AI小宇宙

白洞计划

百度 文心一言

FL Studio2023免费中文版数字音频工作站软件

茶色酒

FL Studio2023

图像的滤波与图像增强的Matlab实现

timerring

数字图像处理

字字珠玑!GitHub爆赞的网络协议手册,被华为大佬指定内部必学?

Java 计算机网络 网络协议

再有人问你什么是分库分表,直接把这篇文章发给他

Java 分库分表

【我在京东做研发】揭秘支撑京东万人规模技术人员协作的行云DevOps平台

京东科技开发者

Spring Boot 整合流程引擎 Flowable,so easy

Java Spring Boot 流程引擎 flowable

kafka是怎么做到基于磁盘却比内存还快的?

kafka 内存 磁盘

赞不绝口!仅靠阿里P9分享的 Redis 工作手册,拿到60W年薪Offer

Java 数据库 redis 缓存 面试

为什么 MyBatis 源码中,没有我那种 if···else

程序知音

ClickHouse 与 Amazon S3 结合?一起来探索其中奥秘

亚马逊云科技 (Amazon Web Services)

SpringBoot+ThreadPoolTaskExecutor 批量插入百万级数据实测

Java Spring Boot 多线程 ThreadPoolTaskExecutor

堪称神级!GitHub上标星157K的Java教程,全程干货,只讲重点

Java

以终为始,场景定义算力“革命”_英特尔_王一鹏_InfoQ精选文章