写点什么

以终为始,场景定义算力“革命”

  • 2025-05-26
    北京
  • 本文字数:3814 字

    阅读完需:约 13 分钟

大小:1.94M时长:11:16
以终为始,场景定义算力“革命”

AI+ 时代对算力的需求,不再是一个芯片 + 算法的简单组合,而是一整套“硬件、算法、平台、服务”的解决方案。


从技术本质剖析,AI 模型的训练与推理均高度依赖强大的算力支撑。训练阶段,海量数据需快速处理分析以提取有效特征和模式,这要求算力具备卓越的计算速度与并行处理能力;推理阶段,算力则需实现实时或近实时响应,确保对输入数据的高效准确处理,满足实际应用场景需求。


然而,AI 在各行业的落地进程中,既取决于算力在特定场景下的性能表现,也受制于相应解决方案的实施成本。所以对于算力供应方来说,精准把握业务需求并实现最优性能并非易事。底层基础设施与上层业务之间天然存在隔阂。


因此大家都在思考:支撑 AI 发展的 AI Infra(人工智能基础设施 ),要怎样才能适应不同行业的需求,实现“自我进化”?作为提供算力的基础,CPU 和云计算产品一直在尝试创新,它们能否打破当前阻碍 AI 落地的算力限制,帮助 AI 更快地在各个行业发挥作用?这些问题亟待探索与验证。

更“接地气”的算力解决方案


首先让我们看看这场“自我进化”,应当包含哪些核心命题。大概是:高性能、高稳定性、更普惠的价格,以及在特定场景下有可验证、可量化的效果提升。


其中一大关键,在于更务实地评估 AI 业务的未来体量,以终为始,有魄力选择最优性价比的硬件方案。


因为 AI 技术要实现真正的大规模落地,核心要解决两个问题:一是降低使用门槛,二是降低部署和运营成本


而具体到解法,英特尔 + 阿里云给出第九代企业级实例 ECS g9i 的答案。


相比第八代实例,ECS g9i 算力最高提升 20%,其中全核睿频达 3.6GHz; L3 缓存提升 50%,达到 504MB;内存频率达到 6400MT/s,与此同时,价格还降低了 5%。



全核睿频 3.6GHz,意思是处理器在多核高负载下仍能保持较高频率,这一方面与制程工艺有关,一方面与散热设计有关。


而 L3 缓存是与内存之间的高速存储层,容量越大,CPU 访问数据的延迟越低。


内存频率则是指内存的数据传输速率。当前市场实际是 DDR4 和 DDR5 并存的状态,一般来讲 DDR4 的最高频率为 3200 MT/s。按 JESD79-5 标准,DDR5 内存的频率则是从 4800MT/s 起跳,6400MT/s 属于高端配置,接近 DDR5 的极限。


以上数据意味着 ECS g9i 瞄准的是对业务效果有着高要求,但在 TCO 维度正在寻找更优解的场景和公司。通常来讲,这类业务对云实例在弹性、安全、稳定性方面的要求也比较高,任何疏忽都将带来非常直观的业务损失。


因此, ECS g9i 的升级,一部分也在于平台能力的提升。据阿里云技术专家介绍, ECS g9i 已全面支持弹性临时盘,标配 eRDMA,单盘吞吐最大 4GB,延时降低至 8us。通过英特尔® TDX 机密计算功能,ECS g9i 实现了物理级的安全隔离;通过双单路架构设计,提升了整体服务的稳定性,缩小了爆炸半径。


ECS g9i 的底层,是阿里云 CIPU 体系,即 Cloud Infrastructure Processing Unit,云基础设施处理器。阿里云判断,传统云计算经历了大型机替代(第一阶段)和超大规模云计算服务(第二阶段),正进入以“硬件加速 + 资源虚拟化”为核心的第三阶段,所以需要 CIPU 向上对接飞天操作系统,完成上层资源调度、虚拟化管理和服务编排;向下负责底层硬件加速和资源管控,将计算、存储、网络资源以“0”损耗的方式交付给飞天。


在底层的硬件资源上,与 ECS g9i 成为“搭档”的是英特尔® 至强® 6 性能核处理器。选用部署广泛的 CPU,无疑降低了企业的门槛。且相比于前一代产品,至强® 6 性能核处理器单插槽集成的物理核心数量翻了两倍,单核平均性能提升 1.2 倍,每瓦平均性能提升 1.6 倍,TCO 降低 30%。


除了芯片工艺本身,为了让 ECS g9i 能更好地服务 AI 推理场景, 英特尔® AMX 技术也起到了重要作用。


英特尔® 引入了专用矩阵乘法指令(TMUL),通过硬件级优化大幅加速矩阵运算(如深度学习中的卷积操作)同时支持 INT8(低精度量化)、BF16 和 FP16(半精度浮点)三种数据格式,完美适配 2024-2025 AI 进入业务时的实际技术环境。


而这些创新的背后是英特尔的洞察,英特尔以往强调性能与算力,而未来将把重心转向可用性与工程集成能力,致力于降低用户的使用门槛。英特尔不局限于单纯销售芯片或设备,而是携手合作伙伴提供涵盖驱动、工具链、SDK 等在内的软件和服务,以缩短 AI 项目的上线周期。


英特尔与阿里的携手合作,将在阿里云平台上为用户提供更多高度优化、开箱即用的解决方案,让不同经验水平的用户,无论是资深从业者还是 AI 新手,都能从中受益。

AI Infra,正在为业务带来新增量


除了上述提到合作,英特尔还与阿里云的 PaaS、SaaS 等多种产品展开深度合作,使更多终端用户能够享受到合作带来的红利。


ECS g9i 与英特尔® 至强® 6 性能核处理器的组合,尤其在垂直场景的成绩相当不错,用于支撑 Web 类应用,性能提升 20%;支撑数据库业务时,性能提升 17%;支撑在线游戏业务时,性能提升 15%。当然,这样的性能表现,与 ECS g9i 对业务场景的理解和适配也密不可分。


以数据库业务为例。作为阿里云最广为人知的云原生数据库,PolarDB 衍生出了一个专门服务于 AI 场景的扩展版本,叫作“PolarDB for AI”,其核心在于通过 In-DB Model as an Operator 技术,将 AI 模型直接嵌入数据库内进行加速处理。


In-DB 就是 AI In DataBase。而 Model as an Operator ,就是说将模型封装为数据库原生操作符,像调用 SQL 函数一样,调用大模型。模型创建、模型评估、模型推理等功能,全部可以用 SQL 语句来完成。


对比传统数据库,这样的设计理念直接减少了数据移动,使数据库内嵌模型可以实时处理最新数据(如流数据),并保证事务一致性。同时进一步简化了开发流程,减少了运维开销。


但这也意味着,相比于传统云原生数据库,PolarDB for AI 需要更强大的算力支持。


比如,PolarDB for AI 的 架构中集成了 DeepFM 推理推荐算法,用户可通过 SQL 查询直接调用 DeepFM 进行推理,服务于点击率预测(CTR)或推荐排序等场景。这一般对算力的要求更高,推荐效果也更好。


而 ECS g9i 从软硬件两方面,都对 DeepFM 算法进行了加速。包括做到算子融合,减少冗余访存;推进框架优化,使用更高效的推理引擎;针对大小并发场景,还可以用 AVX-512 和英特尔® AMX 分别加速向量计算和矩阵计算。最终实现对比上一代产品每核推理性能提升约 1.26 倍 -2.53 倍。


在对抗 DeepFake 的风控场景,服务蚂蚁数字科技的 ZOLOZ Deeper 产品时, ECS g9i 与英特尔® 至强® 6 性能核处理器的组合,也拿出了很好的表现。


ZOLOZ Deeper 是为了应对 AI 换脸、深度伪造等技术带来的安全威胁而研发的,其核心目标是通过端云一体的全链路技术体系,确保生物特征数据的真实性和安全性,广泛应用于身份认证、金融风控等场景。


ZOLOZ Deeper 的技术体系分为前端安全检测和后端深度学习模型分析两大模块:前者用于检测摄像头状态,实时分析用户行为,做好生物特征采集;后者做微表情和肌肉纹理分析,完成攻防迭代优化。


在这样的技术体系下,ECS g9i 的性能表现和 AMX 加速技术变得非常重要。


首先,这种技术方案避免依赖价格高昂的 GPU 集群,而在英特尔® AMX 的加持下,ECS g9i 能够高效处理小模型推理任务,TCO 大幅度降低。


同时,英特尔® OpenVINO 工具套件对 CPU 进一步进行优化,使其达到峰值效率,提升了视觉模型推理的性能,使端到端性能提升约 10%。


这便是英特尔持续优化创新,以软件重新定义硬件,满足软件需要的低精度的计算、高带宽的要求,让芯片上每一个单元都能发挥最大价值,极大降低部署和运营成本,提升整体效率。


可以说,ECS g9i 是 AI 应用落地大趋势影响下的技术产物,搭配英特尔® 至强® 6 性能核处理器,为行业提供了更“接地气”的算力解决方案,在垂直业务场景,实现了算力成本上的“以小博大”。


未来 AI 发展的关键词是简单、稳定、高效、便宜,不再是一个芯片 + 算法的简单组合,而是一整套“硬件、算法、平台、服务”的解决方案。AI 要真正普及,必须靠软硬一体、工程思维和生态协作来共同推动。


在 5 月 8 日的直播中,来自英特尔、阿里云、PolarDB、蚂蚁数字科技的几位专家,详细分享了算力引擎是如何加速 AI 应用落地进入“快车道”的,感兴趣的读者可以点击【链接】查看直播回放视频进一步了解。

AI+ 算力 + 场景的共生进化


今天的企业,面临的问题不再是“要不要用 AI”,而是“怎么用得更聪明”。


过去,AI 技术往往被当作一个独立的“黑匣子”,企业要么堆算力,要么被复杂的部署流程劝退。但如今,ECS g9i 在 PolarDB for AI 、ZOLOZ Deeper 等多个场景的应用效果,正在证明一件事:AI 的落地不是“非此即彼”的选择题,而是需要根据业务场景,把算力、模型、数据捏合成一套“组合拳”。


这场变革的真正难点,在于如何让技术与产业“长在一起”。比如,来自 PolarDB 、ZOLOZ Deeper 的应用场景,加上 ECS g9i 以及英特尔®至强® 6 性能核处理器,再配合英特尔® OpenVINO™ 工具套件、英特尔®AMX,才能发挥最大价值。


而这种生态上的协同,比以往出现的更加密集,也更加重要——它们共同解决了数据格式兼容、模型部署效率、业务场景适配等问题。需要相关企业长期扎根行业,丰富解决方案案例库。


好在,相关企业有充足的理由来完成这项长期投资。毕竟,谁能在自己的业务场景中,把算力调得“刚刚好”——既不浪费资源,也不拖后腿,谁就能在 AI 时代抢得先机。


技术进化不等人!抢先掌握 Intel 最新动态!


→ 点击「链接」,直达本期英特尔“云端进化论”课程,发现最新技术、产品与解决方案!

2025-05-26 19:024921

评论

发布
暂无评论

腾讯大数据基于 StarRocks 的向量检索探索

StarRocks

向量检索

全球人形机器人行业2024年度汇总和行业前瞻报告

机器人头条

科技 大模型 人形机器人 具身智能

高效前端应用:基于 Vue3 的低代码开发实践

秃头小帅oi

炸裂:SpringAI内置DeepSeek啦!

王磊

本地搭建DeepSeek和知识库

秃头小帅oi

借助GPT-4开启游戏开发之旅

xuyinyin

【YashanDB知识库】YashanDB 支持MySQL多表更新语句的解决方法

YashanDB

数据库 yashandb

卓翼智能助力四川筠连山体滑坡夜间救援

科技热闻

简洁高效的多窗格文件管理器QSpace Pro for mac中文激活版

小玖_苹果Mac软件

基于人工智能技术的图像处理软件Topaz Photo AI for mac激活版

小玖_苹果Mac软件

Unity 专家分享2025年移动游戏行业七大趋势展望

极客天地

项目管理资格证书对职业发展的7大影响

薛同学

硬件信息监测软件iStat Menus for mac中文激活版

小玖_苹果Mac软件

优秀的词典工具Eudic欧路词典 for Mac中文激活版

小玖_苹果Mac软件

人工智能丨deepseek是什么?我们能用它来做什么?

测试人

人工智能

全链路数据引擎:WhaleStudio驱动下的大数据调度与同步智能革新

白鲸开源

数据集成 数据源 数据调度 白鲸开源 WhaleStudio

《王者荣耀》鸿蒙版上线后首次全民竞技之约!无缝流转新体验

最新动态

音频合成器插件Arturia Analog Lab Pro V for mac直装激活版

小玖_苹果Mac软件

普通人怎样用好DeepSeek

易成研发中心

DeepSeek

DS缩写乱争:当小海豚撞上AI顶流,技术圈也逃不过“撞名”修罗场

白鲸开源

开源 Apache DolphinScheduler DeepSeek DeepSeek v3 DeepSeek-R1、

【YashanDB知识库】MySQL和YashanDB 隐式转换不一致引起的报错

YashanDB

数据库 yashandb

Vue.js 与低代码开发:如何实现快速应用构建

伤感汤姆布利柏

【YashanDB知识库】从PostgreSQL迁移到YashanDB如何进行数据行数比对

YashanDB

数据库 yashandb

Go 1.24.0 重磅发布:新特性、新工具,开发者必看!

陈明勇

Go go 1.24

低代码开发平台与 Vue.js 的深度融合

秃头小帅oi

BRASS管乐器演奏插件Arturia Augmented BRASS for mac激活版

小玖_苹果Mac软件

OpenSearch LLM 智能问答版基于 Deepseek-R1 一分钟搭建 RAG 系统

阿里云大数据AI技术

人工智能 阿里云 LLM OpenSearch DeepSeek

DeepSeek正重构人形机器人和具身大模型赛道!

机器人头条

科技 大模型 人形机器人 具身智能

Klook获1亿美元融资,推动全球旅游体验行业持续增长

财见

以终为始,场景定义算力“革命”_英特尔_吉他星系导航员_InfoQ精选文章