写点什么

直击异构算力资源纳管困难,又一款智算操作系统重磅发布

  • 2024-04-19
    北京
  • 本文字数:1477 字

    阅读完需:约 5 分钟

大小:789.16K时长:04:29
直击异构算力资源纳管困难,又一款智算操作系统重磅发布

4 月 18 日,2024 九章云极 DataCanvas 智算操作系统新品发布会于北京召开,全新产品 DATACANVAS AIDC OS 智算操作系统(以下简称 AIDC OS)正式官宣。这款智算系统也成为了九章云极 DataCanvas 公司在“算法+算力”一体化 AI 服务战略旅程上全新的实践里程碑。

AIGC 时代,底层计算有多重要?

发布会上,九章云极 DataCanvas 公司董事长方磊深度剖析大模型影响下的计算世界的新方向和新机遇,揭示了当前底层计算变革的重要性和复杂性,并展望软件与硬件共同演进的相互影响和创新空间。他指出,软件定义算力的时代即将到来,AIDC OS 智算操作系统在这场变革中将起到关键作用。



 九章云极 DataCanvas 公司董事长方磊

 

当前,新一轮的底层计算变革正由大模型的崛起而引发。底层计算从来都是软件与硬件协同的结果,软件和硬件的紧密协作显得尤为重要,也各自迎来全新的机遇与挑战。

 

回顾计算世界的演变历程,一条共性的客观规律显而易见:硬件始终以满足最终计算需求为导向不断演进,而软件则以操作系统的形态作为桥梁,将硬件与应用无缝衔接。在这场变革中,随着硬件技术的不断发展和同质化趋势的加剧,软件的创新空间变得愈发广阔,其在变革中所扮演的角色也愈发重要。

 

在这一大背景下,AIFS 人工智能基础软件孕育出了巨大的发展机会,AIDC OS 智算系统也借着这股东风应运而生。

 

与传统服务于硬件的资源管理驱动不同,AIDC OS 智算系统以 AI 使用能力为驱动。它不仅关注硬件资源的有效管理和利用,更着眼于如何更好地满足终端用户对算力的核心需求:通过智能调度和优化配置,AIDC OS 致力于将可用的、好用的、经济的算力提供给使用者。

五大核心价值,链接底层硬件和大模型应用层


九章云极 DataCanvas 公司联合创始人暨 CTO 尚明栋正式发布 DATACANVAS AIDC OS 智算操作系统,他介绍,AIDC OS 智算操作系统在智算中心产业生态中处于中间位置,在底层硬件芯片和上层大模型之间建立了高效的链接。

 

AIDC OS 能够向下协同大规模 GPU 算力,确保硬件资源得到有效利用和高效管理;同时,向上提供完整的大模型工具链,为大模型训练和推理以及大模型应用提供便捷、高效的开发环境,满足复杂 AI 任务的需求。

 

直击异构算力资源纳管困难、算力调度能力不足且利用率低、AI 加速优化能力不足以及 AI 大模型训练微调门槛高等行业痛点,AIDC OS 在设计前期构建了告别“裸金属”、为 AI 而生、全局加速优化、异构算力纳管与调度和 1 度算力五大价值基核,并以此为根基设计产品功能。发布会上,尚明栋先生从核心价值出发,详细介绍了 AIDC OS 的亮点功能和性能。

 

  • 告别“裸金属”

通过构建多层次、全方位的算力需求满足机制,包含超级智算集群、弹性容器集群、GPU 云服务器、AI 容器实例等系列产品,为精准匹配和满足多样化规模及复杂度的算力需求提供保障。


  • 为 AI 而生

专注于人工智能核心任务,包括大模型的训练、微调、部署和推理等服务。提供集“算力、数据、算法、调度”为一体的融合服务,旨在推动人工智能产业化的创新发展。


  • 全局加速优化

实现并行加速、编译优化、内核加速、算法加速、内存优化、通信加速等六大加速,释放硬件效能。集群训练效率提升 100%,单卡利用率提升 50%;模型推理速度提高 4 倍,Token 吞吐量增加 5 倍。


  • 异构算力纳管与调度

提供包含国内外多种算力资源的适配、纳管、调度和优化。通过实时监控和管理各智算中心的智算设备,以及创新的调度算法,成功实现跨智算中心的海量算力智能调度,大幅提升算力资源的利用率。


  • 1 度算力

DATACANVAS AIDC OS 从用户视角出发,首次提出了统一的算力服务计量单位“度”(DCU),并用其实现标准化的算力计量计费,旨在为用户实现“买到即用到”的算力服务,为未来算力资源互联互通打下良性商业基础。

2024-04-19 17:375569
用户头像
李冬梅 加V:busulishang4668

发布了 1188 篇内容, 共 810.0 次阅读, 收获喜欢 1303 次。

关注

评论

发布
暂无评论
发现更多内容

无痛调度!使用Helm在Kubernetes上一键搭建Prometheus Operator监控

不在线第一只蜗牛

教程分享 K8s 多集群管理

免费体验,有奖评测!低代码开发平台魔笔发布评测令

移动研发平台EMAS

开发者 低代码开发 有奖评测 快速开发全端应用

基于k6和python进行自动化性能测试

华为云开发者联盟

前端 华为云 华为云开发者联盟 企业号 6 月 PK 榜

AIGC时代,基于云原生 MLOps 构建属于你的大模型(下)

York

机器学习 云原生 大模型 MLOps AIGC

时速云使用 Higress 替换 Ngnix Ingress + Spring Cloud Gateway 的生产实践

阿里巴巴云原生

阿里云 云原生 Higress

惊叹!如何在魔幻般的VPS上亲手部署Spring Boot Demo

不在线第一只蜗牛

Docker Kubernetes Spring Boot CLI

【领域驱动设计专题】一文带领你透视DDD领域驱动模型的本质和设计原理分析指南(构建领域知识)

码界西柚

领域驱动设计 DDD 领域驱动设计DDD 领域驱动模型

线上故障的正确打开方式

老张

项目管理 线上故障 复盘归因 故障复盘

pnpm才是前端工程化项目的未来

互联网工科生

前端 npm 工程化

社区新手小伙伴测评 | 使用 ChatGPT 可以帮助完成 IoTDB 部署吗?

Apache IoTDB

IoTDB ChatGPT

垂域LLM应用实践

csunny

大模型 GPT LLM

堡垒机价格都是按年算吗?大概多少钱?

行云管家

网络安全 堡垒机 运维审计 堡垒机价格

大连正规等保测评机构有3家还是4家?叫什么名字?

行云管家

等保 等级保护 等保测评 大连

CVPR首个大模型研讨会顺利召开,吸引超1000支队伍参与文心大模型国际比赛

飞桨PaddlePaddle

人工智能 百度 paddle 飞桨

中移链链账户、合约与资源关系介绍

BSN研习社

突破界限,共创未来!MIAOYUN“一云多芯”全栈信创解决方案获认可!

MIAOYUN

信创 一云多芯解决方案 信创云 信创生态 一云多芯

清安储能*IoTDB | 多个核心查询场景实现毫秒级结果返回,平均压缩比达到 90+ 倍

Apache IoTDB

物联网 时序数据库 IoTDB

eosio.system智能合约介绍(二)系统资源

BSN研习社

当 MQTT 遇上 ChatGPT:探索可自然交互的物联网智能应用

EMQ映云科技

物联网 mqtt ChatGPT

如何在金融企业推进故障演练?中国人寿分阶段实践总结

TakinTalks稳定性社区

HDC华为开发者大会-开发者社区活动

云计算 华为 华为云 华为开发者大会2023

月近万次发布,故障率<4‰如何做到?去哪儿测试左移重难点揭秘!

TakinTalks稳定性社区

磷酸铁锂电池应用前景广阔,英集芯响应市场推出IP2366电源管理芯片

华秋电子

保护数据隐私:深入探索Golang中的SM4加密解密算法

王中阳Go

Go 高效工作 学习方法 6 月 优质更文活动

深度Q网络:DQN项目实战CartPole-v0

华为云开发者联盟

人工智能 华为云 华为云开发者联盟 企业号 6 月 PK 榜

C4D哪个版本最好用又稳定?

Finovy Cloud

PCB板表面如何处理提高可靠性设计?

华秋电子

一次打通FlinkCDC同步Mysql数据

程序员半支烟

flink 数据同步 flinkcdc

提交Flink作业及所见问题总结

程序员半支烟

flink

直击异构算力资源纳管困难,又一款智算操作系统重磅发布_操作系统_李冬梅_InfoQ精选文章