2天时间,聊今年最热的 Agent、上下文工程、AI 产品创新等话题。2025 年最后一场~ 了解详情
写点什么

第四范式发布先知 AIOS 5.1,升级支持 GPU 资源池化功能

  • 2024-07-23
    北京
  • 本文字数:433 字

    阅读完需:约 1 分钟

大小:240.51K时长:01:22
第四范式发布先知AIOS 5.1,升级支持GPU资源池化功能

今天,第四范式先知 AIOS 5.1 版本正式发布。该版本新增 GPU 资源池化(vGPU)能力,实现对硬件集群平台化管理、算力资源的按需分配和快速调度,最多节省 80%的硬件成本,提高 GPU 综合利用率多达 5-10 倍。



第四范式先知 AIOS 5 是行业大模型开发及管理平台。平台以提升企业核心竞争力为目标,在支持接入企业各类模态数据的基础上,提供大模型训练、精调等低门槛建模工具、科学家创新服务体系、北极星策略管理平台、大模型纳管平台、主流算力适配优化等能力,实现端到端的行业大模型的构建、部署、管理服务。



在行业大模型的构建过程中,为进一步提高算力资源利用率,第四范式先知 AIOS 5.1 版本新增 GPU 资源池化(vGPU)能力,拥有五大技术亮点:

  • 全面适配国产/非国产算力,支持混合部署与统一调度

  • 算力和显存超分复用,算力切分精细到 1%,显存切分以 M 兆为单位

  • 具备千卡级别分布式调度与管理能力

  • 支持自定义隔离策略,实现共享或独享算力池

  • 利用多任务共享及处理优化技术,推理性能提升 10 倍以上

 

了解产品详情,可致电 400-898-7788,或扫描下方二维码。



2024-07-23 16:499024

评论

发布
暂无评论
发现更多内容

接口测试学习之json

测试人生路

json 接口测试

阿里达摩院副院长亲自所写Java架构29大核心知识体系+大厂面试真题+微服务

Java架构追梦

Java 学习 阿里巴巴 架构 面试

Scrum指南这么改,我看要完蛋!

华为云开发者联盟

Scrum 敏捷 改版

DataPipeline 王睿:业务异常实时自动化检测 — 基于人工智能的系统实战

DataPipeline数见科技

大数据

强化学习入门必看之强化学习导识

Alocasia

人工智能 学习

数字货币交易所开发有哪些模式?区块链交易平台

13530558032

微信官方将打击恶意营销号:自媒体不可过度消费粉丝

石头IT视角

11月阿里Spring全家桶+MQ微服务架构笔记:源码+实战

小Q

Java 学习 程序员 面试 微服务

企业工作流设计原则及多项目整合开发注意事项

Marilyn

敏捷开发 工作流 企业开发

6. 自定义容器类型元素验证,类级别验证(多字段联合验证)

YourBatman

Hibernate-Validator Bean Validation 多字段联合验证

区块链数字钱包系统开发方案,区块链钱包APP源码

13530558032

万字图文 | 聊一聊 ReentrantLock 和 AQS 那点事(看完不会你找我)

马丁玩编程

架构 AQS ReentrantLock JUC CLH

Springboot过滤器和拦截器详解及使用场景

996小迁

Java 编程 架构 面试 springboot

DataPipeline CTO 陈肃:构建批流一体数据融合平台的一致性语义保证

DataPipeline数见科技

数据融合

AI技术在音乐类产品中的应用场景

曲多多(嗨翻屋)版权音乐

人工智能 AI 音乐 音乐制作

MySQL 连接为什么挂死了?

华为云开发者联盟

微服务 数据 存储

DataPipeline CPO 陈雷:实时数据融合之道,博观约取,价值驱动

DataPipeline数见科技

数据融合

架构师训练营第九周作业

_

极客大学架构师训练营 第九周作业

DataPipeline CPO 陈雷:实时数据融合之法,便捷可管理

DataPipeline数见科技

数据融合

媲美物理机,裸金属云主机如何轻松应对11.11大促

京东科技开发者

云计算 容器 服务器 云主机

号外!5G+X联创营华为云官网上线,5G 创业春天来了!

华为云开发者联盟

华为 程序员 AI 5G

区块链社交即时通许系统开发,区块链社交app开发价格

13530558032

《JAVA多线程设计模式》.pdf

田维常

多线程

DataPipeline CPO 陈雷:实时数据融合之法,稳定高容错

DataPipeline数见科技

数据融合

快进收藏吃灰!字节跳动大佬用最通俗方法讲明白了红黑树算法

小Q

Java 学习 架构 面试 算法

面试官问:如何排除GC引起的CPU飙高?我脱口而出5个步骤

田维常

cpu飙满

前嗅教你大数据——史上最全代理IP服务商对比

前嗅大数据

大数据 数据采集 动态代理 静态代理 代理IP

合约跟单源码案例,合约跟单模式开发

13530558032

【JDD京智大咖说】AI 未来,路在何方?NLP、CV 技术的探索与展望

京东科技开发者

人工智能 CV nlp

京东T8Java架构师总结整理的15w字的Java面试手册,2021年金三银四不愁涨不了薪!

Java架构之路

Java 程序员 架构 面试 编程语言

架构师训练营 1 期 - 第九周 - 性能优化 3

三板斧

第四范式发布先知AIOS 5.1,升级支持GPU资源池化功能_AI&大模型_第四范式技术团队_InfoQ精选文章