写点什么

焱融全闪 F9000X 性能再创新高,全面释放大规模 AI 计算效能

焱融科技

  • 2025-01-14
    北京
  • 本文字数:1862 字

    阅读完需:约 6 分钟

大小:979.53K时长:05:34
焱融全闪 F9000X 性能再创新高,全面释放大规模 AI 计算效能

新年伊始,焱融科技再次在存储性能领域取得突破。通过最新的实验室测试,焱融 AI 存储产品——焱融追光全闪存储一体机 F9000X,搭载 4 张 NVIDIA 400Gbps NDR InfiniBand 网卡,并结合自主研发的 Multi-Channel 多网卡聚合技术,实现了 1.6Tb/s 的网络带宽聚合。3 节点存储集群的测试结果显示,性能达到 480GBps 带宽和 750 万 IOPS,相较市场同类产品提升了 3 倍。


这一突破性方案不仅大幅提升了性能,还有效降低了企业的总拥有成本:每 GB/s 成本减少 75%,每 IOPS 成本降低 30%。焱融科技凭借业界顶级性能,为大规模 AI 计算提供了理想的存储解决方案,加速 AGI 时代的全面到来。



AI 技术发展催生存储性能升级


近年来,AI 技术特别是生成式 AI 迎来了飞速发展的黄金时期,不断刷新着能力边界。伴随而来的是不断提升的对数据处理速度和效率的要求,这也在引发一场新的存储技术革命,对存储性能的要求不断提高。


1. AI 模型复杂度不断提升,存储性能需求攀升


随着生成式 AI 技术的持续创新,基础大模型已迈入多模态时代,模型参数和计算复杂度均呈指数级增长。这种发展显著提升了对存储带宽、容量和计算性能的要求。此外,随着模型规模和训练精度的不断提升,Checkpoint 也变得更大,进一步加剧了对存储吞吐量的压力。如果存储性能无法匹配模型的复杂度,整个 AI 训练链条将因“存储瓶颈”而受阻,影响模型迭代的效率。


而在模型推理环节,更大的数据量、更庞大的模型,以及更长的上下文窗口能够显著提升人工智能的效能。然而,推理过程需要应对大量并发请求且对响应时间要求极高。同时,AI 模型频繁更新和快速部署的需求也在不断增加。这使得存储系统必须具备低延迟和高吞吐量,以满足不断增长的应用需求。


2. 算力资源紧缺,GPU 利用率提升需求迫切


AI 技术的发展推动了算力需求的急剧增长,GPU 等算力资源供需矛盾突出。随着模型参数和复杂度的提升,模型训练所需的 GPU 算力也随之增加,目前最高已扩展到万卡乃至十万卡规模的大型 AI 算力集群。但现有基础设施在算力资源的可用性和优化方面仍存在诸多挑战。频繁的 CheckPoint 数据写入和断点续训造成算力资源闲置,算力集群的利用率偏低,增加了训练时间和计算成本。


在这种情况下,若能够将 GPU 利用率提升,就相当于增加了额外算力,从而能在更短的时间内完成更多的计算任务,降低模型训练的时间成本和经济成本。而提升 GPU 利用率的关键之一便是存储性能的升级。通过提升数据加载效率、加快断点续训速度,显著减少训练过程中的等待时间,提升算力资源的使用效率。


焱融存储全面激发,大规模 AI 计算集群效能释放


作为国内专注于 AI 存储领域的领先存储解决方案提供商,焱融科技针对日益复杂的 AI 模型训练和推理需求,不断进行存储技术创新,持续带来存储性能突破,以满足不断提升的 AI 计算需求。此次,焱融科技推出的 4 张 NVIDIA 400Gbps NDR InfiniBand 网卡的存储方案,依托于焱融追光全闪存储一体机 F9000X,通过公司自主研发的 Multi-Channel 多网卡聚合技术,提供 1.6Tb/s 网络带宽接入能力,完美适配 PCIe 5.0 NVMe 闪存,大幅提升数据访问速度和处理效率,释放 AI 算力的全新潜能。


焱融全闪 F9000X 3 节点存储集群带宽性能对比


上图展示了焱融全闪分布式文件存储 F9000X 分别搭载 2 张和 4 张 NVIDIA 400Gbps NDR InfiniBand 网卡的 3 节点存储集群的实测性能。可以看到,采用 4 张 InfiniBand 400Gbps 网卡的焱融全闪 F9000X 存储方案,3 节点存储集群的带宽性能达到了 480GBps, 相较于 2 卡方案性能提升了近 80%,相比市场同类产品性能提升 3 倍;同时,其 IOPS 性能也达到了 750 万,保持业界领先水平。


在性能大幅提升的同时,用户的成本效益也得到了显著优化,年省算力成本达到千万级。每 GB/s 的成本降低了 75%,每 IOPS 的成本降低了 30%。这一成本优势意味着,企业在享受高性能存储带来的业务效率和竞争力提升的同时,还能够有效降低总体拥有成本,是大规模 AI 计算场景下的理想全闪存储解决方案。

先进的 AI 存储需要紧跟技术发展的步伐,满足日益增长的计算需求,提升用户体验。继在国际权威 AI 测评舞台 MLPerf Storage 中崭露头角后,焱融全闪 F9000X 再次实现性能飞跃。这不仅再次彰显了焱融科技在 AI 高性能存储领域的领先地位,也为行业树立了新的标杆,为不断迭代的大规模 AI 模型训练和推理等各类复杂计算任务提供强有力的支撑。


面向未来,焱融科技将继续深耕 AI 存储技术创新,持续提供领先的 AI 存储产品,为 AI 大模型、智算中心、自动驾驶、生信分析、金融量化等领域提供更强大的数据存储基座,推动这些领域的持续发展和创新。


2025-01-14 14:424771

评论

发布
暂无评论

OceanBase源码解读(二):SQL的一生

OceanBase 数据库

数据库 分布式数据库 oceanbase OceanBase 开源 OceanBase 社区版

🏆【分布式技术专题】【分布式技术专题】RocketMQ延迟消息实现原理和源码分析

码界西柚

RocketMQ 延时队列 8月日更 DelayedQueue

2021 年 iOS 应用程序开发七种最佳语言

iOSer

Java flutter ios objective-c swift

插上NIO翅膀,FunTester飞上天

FunTester

nio 性能测试 接口测试 测试框架 FunTester

python3学习笔记-20210817(变量名与字符串)

姬翔

GIT远程仓库

一个大红包

8月日更

基于springcloud springboot vue elementui商城源码毕设实战

清风

Vue Java 分布式 毕业设计

CODING DevOps 高级架构师王炜入选木兰开源社区首批导师

CODING DevOps

DevOps Nocalhost 木兰开源社区 开发者生态

还不了解 static ?年轻人,劝你耗子尾汁...

神策技术社区

数据分析 大前端 后端 埋点

python——利用tkinter制作可视化窗体1

YUKI0506

python——execl写入数据2

YUKI0506

DAPP去中心化交易所开发|DAPP与APP的区别

Geek_23f0c3

交易所开发 去中心化交易所系统开发 DAPP智能合约交易系统开发

2021 OceanBase 数据库大赛来袭!邀你改编世界,码出未来

OceanBase 数据库

数据库 oceanbase OceanBase 开源 OceanBase 社区版 OceanBase 数据库大赛

ipfs矿机公司实力排行如何?ipfs矿机排名如何?

ipfs矿机公司实力排行如何 ipfs矿机排名如何

云原生时代到来了么?

escray

学习 极客时间 如何落地业务建模 8月日更

神策分析 iOS SDK 全埋点解析之元素点击与页面浏览

神策技术社区

大前端 后端 数据 埋点

架构实战营模块五作业

maybe

数字人民币专利数激增, “区块链”领域大有可为

CECBC

当知识图谱遇上预训练语言模型

博文视点Broadview

为什么你的数据总是丢?

神策技术社区

数据分析 大前端 后端 埋点

OceanBase数据库源码解读之模块结构

OceanBase 数据库

数据库 分布式数据库 oceanbase OceanBase 开源 OceanBase 社区版

「最好」的敌人是「好」

非著名程序员

提升认知 认知提升 个人提升 8月日更

ipfs挖矿是怎样赚钱的?ipfs挖矿值得投资吗?

IPFS挖矿值得投资吗 IPFS挖矿是怎样赚钱的

java springboot微信小程序授权登录开发

清风

小程序 java小程序

浅析fil:fil未来价值到底在哪?

区块链 分布式存储 IPFS fil FIL价值

activiti整合在现有系统,业务绑定,流程在线设计@附源码

金陵老街

Activity之间跳转时,生命周期的变化

W🌥

android 8月日更

微服务架构师-docker私有镜像仓库的配置和使用

学神来啦

Linux 容器 微服务 运维 架构师

Go-基本元素

HelloBug

Go 语言

上游思维:在系统的关键处找一个支点

石云升

读书笔记 8月日更 上游思维

从0开始的TypeScriptの十:泛型

空城机

typescript 大前端 8月日更

焱融全闪 F9000X 性能再创新高,全面释放大规模 AI 计算效能_芯片&算力_InfoQ精选文章