写点什么

第四范式发布先知 AIOS 5.1,升级支持 GPU 资源池化功能

  • 2024-07-23
    北京
  • 本文字数:433 字

    阅读完需:约 1 分钟

大小:240.51K时长:01:22
第四范式发布先知AIOS 5.1,升级支持GPU资源池化功能

今天,第四范式先知 AIOS 5.1 版本正式发布。该版本新增 GPU 资源池化(vGPU)能力,实现对硬件集群平台化管理、算力资源的按需分配和快速调度,最多节省 80%的硬件成本,提高 GPU 综合利用率多达 5-10 倍。



第四范式先知 AIOS 5 是行业大模型开发及管理平台。平台以提升企业核心竞争力为目标,在支持接入企业各类模态数据的基础上,提供大模型训练、精调等低门槛建模工具、科学家创新服务体系、北极星策略管理平台、大模型纳管平台、主流算力适配优化等能力,实现端到端的行业大模型的构建、部署、管理服务。



在行业大模型的构建过程中,为进一步提高算力资源利用率,第四范式先知 AIOS 5.1 版本新增 GPU 资源池化(vGPU)能力,拥有五大技术亮点:

  • 全面适配国产/非国产算力,支持混合部署与统一调度

  • 算力和显存超分复用,算力切分精细到 1%,显存切分以 M 兆为单位

  • 具备千卡级别分布式调度与管理能力

  • 支持自定义隔离策略,实现共享或独享算力池

  • 利用多任务共享及处理优化技术,推理性能提升 10 倍以上

 

了解产品详情,可致电 400-898-7788,或扫描下方二维码。



2024-07-23 16:498989

评论

发布
暂无评论
发现更多内容

GitHub霸榜月余的24万字Java面试手册,竟是阿里机密

热爱java的分享家

Java 面试 程序人生 编程语言 经验分享

Java 项目中使用 Resilience4j 框架实现客户端 API 调用的限速/节流机制

码语者

Java 限速 节流 Resilience4j RateLimit

App 端自动化的最佳方案,完全解放双手!

星安果

Python 自动化 爬虫

Windows 11再出杀手锏....

Jackpop

【高并发】由InterruptedException异常引发的思考

冰河

Java 并发编程 多线程 高并发 异步编程

分析23个赛季NBA数据,我发现10条难以置信的信息!

Jackpop

通过 for 循环,比较 Python 与 Ruby 编程思想的差别

Python猫

Python

Spring中的Controller和Service是线程安全的吗?我有点懵

热爱java的分享家

Java spring 程序人生 编程语言 经验分享

一次搞懂SpringBoot核心原理:自动配置、事件驱动、Condition

热爱java的分享家

Java 程序人生 Spring Boot 编程语言 经验分享

在线文本行固定长度填充工具

入门小站

工具

Golang Gin 框架之分组路由(五)

liuzhen007

11月日更

贪心:柠檬水找零、跳跃游戏🍋

空城机

JavaScript 贪心算法 11月日更

Spring Bean生命周期你除了会背八股文面试,真的会用了吗?

热爱java的分享家

Java spring 程序人生 编程语言 经验分享

华为顶级安全专家分享出来这份‘典藏版’Linux开发实战笔记

热爱java的分享家

Java 架构 程序人生 编程语言 经验分享

这次不怕撕坏了,区块链电子公告来了

CECBC

2018年世界杯德国竟然输给韩国?终于找到原因了!

Jackpop

23 K8S之Secret资源配置

穿过生命散发芬芳

k8s 11月日更

CWE 4.6 和 OWASP TOP10(2021)

Tom(⊙o⊙)

什么是元宇宙?为何要关注它?

CECBC

【死磕Java并发】-----J.U.C之AQS:同步状态的获取与释放

chenssy

11月日更 死磕 Java 死磕 Java 并发

被Chrome坑惨了!

Jackpop

模块四作业:设计千万级学生系统的试卷存储方案

Geek_99eefd

模块四 「架构实战营」

一个对标VSCode的IDE---Fleet

IT蜗壳-Tango

11月日更

linux之strings命令

入门小站

Linux

看完源码记不住?掌握这套方法,Alibaba不会少你一个工位

热爱java的分享家

Java 面试 程序人生 编程语言 经验分享

分布式系统的架构演进过程(一)

卢卡多多

分布式, 11月日更

华为,告别大陆军时代

脑极体

2021RSAC -- 网络韧性

Tom(⊙o⊙)

清华元宇宙深度报告!理论框架产业真相一文看懂

CECBC

EF Core如何处理多对多关系

喵叔

11月日更

[Pulsar] 消息生命历程(三)——客户端发送消息

Zike Yang

Apache Pulsar 11月日更

第四范式发布先知AIOS 5.1,升级支持GPU资源池化功能_AI&大模型_第四范式技术团队_InfoQ精选文章