写点什么

第四范式发布先知 AIOS 5.1,升级支持 GPU 资源池化功能

  • 2024-07-23
    北京
  • 本文字数:433 字

    阅读完需:约 1 分钟

大小:240.51K时长:01:22
第四范式发布先知AIOS 5.1,升级支持GPU资源池化功能

今天,第四范式先知 AIOS 5.1 版本正式发布。该版本新增 GPU 资源池化(vGPU)能力,实现对硬件集群平台化管理、算力资源的按需分配和快速调度,最多节省 80%的硬件成本,提高 GPU 综合利用率多达 5-10 倍。



第四范式先知 AIOS 5 是行业大模型开发及管理平台。平台以提升企业核心竞争力为目标,在支持接入企业各类模态数据的基础上,提供大模型训练、精调等低门槛建模工具、科学家创新服务体系、北极星策略管理平台、大模型纳管平台、主流算力适配优化等能力,实现端到端的行业大模型的构建、部署、管理服务。



在行业大模型的构建过程中,为进一步提高算力资源利用率,第四范式先知 AIOS 5.1 版本新增 GPU 资源池化(vGPU)能力,拥有五大技术亮点:

  • 全面适配国产/非国产算力,支持混合部署与统一调度

  • 算力和显存超分复用,算力切分精细到 1%,显存切分以 M 兆为单位

  • 具备千卡级别分布式调度与管理能力

  • 支持自定义隔离策略,实现共享或独享算力池

  • 利用多任务共享及处理优化技术,推理性能提升 10 倍以上

 

了解产品详情,可致电 400-898-7788,或扫描下方二维码。



2024-07-23 16:498765

评论

发布
暂无评论
发现更多内容

劝人写码,千刀万剐——“前端已死”难道要成真了?

引迈信息

前端 大前端 低代码 JNPF

破防了!这个在Ins上保存视频到手机相册的方法把我给感动哭了!

frank

【网易云信】网易云信 RTC 音频 QoS 综述

网易智企

RTC 实时音视频

音视频通讯QoS技术及其演进

阿里云CloudImagine

云计算 音视频 视频云

分析 | 通过 NFTScan 率先捕获 NFT 投资趋势

NFT Research

NFT

大文件传输的3个重要替代方案

镭速

OpenHarmony生态贡献获肯定,华秋践行加速硬件创业初心

华秋电子

【揭秘】智慧公厕监控系统,让你告别糟糕公厕体验!

光明源智慧厕所

智慧城市

AI算力碎片化:矩阵乘法的启示

OneFlow

LinkFlow CDP应用篇02:CDP如何帮助零售行业构建客户画像

游读分享

建木社区、ChatGLM团队与青田创新赋能中心打造AI对话体验平台

Jianmu

人工智能 AI ChatGPT ChatGLM

政企数智办公巡展回顾 | 通信赋能传统行业数智化转型的应用实践

融云 RongCloud

音视频 办公 即时通讯IM 数智化 通讯

数据治理体系建设与实践

Openlab_cosmoplat

数据治理 开源社区

网易云信 RTC 音频 QoS 综述

网易云信

RTC 实时音视频

再见正则表达式!这次彻底告别手写!

Java永远的神

Java 程序员 AI 程序人生 后端

算法题每日一练:组合总和 III

知心宝贝

数据结构 算法 前端 后端 三周年连更

九科信息与统信、电科申泰完成产品适配联合认证

九科Ninetech

RPA 信创

【网络安全】CVE漏洞分析以及复现

网络安全学海

网络安全 安全 信息安全 计算机 渗透测试

Django 的基础模板和模板文件重构

宇宙之一粟

Python django 三周年连更

Ins保存图片保姆级教程!拯救手残党的图文教程,速来GET!

frank

MLCC是电子工业大米,供需波动导致行业成周期性波动

华秋电子

虚拟内存是什么?

测吧(北京)科技有限公司

测试

2023IT市场年会丨浪潮云以云聚数拥抱价值新生

基于python的网站安全检测系统的设计与实现,如何做数据分析?

海拥(haiyong.site)

三周年连更

阿里大佬都在熬夜肝的Java程序优化笔记,程序性能提高了5倍!

程序知音

Java 性能优化 JVM java架构 后端技术

第四范式发布先知AIOS 5.1,升级支持GPU资源池化功能_AI&大模型_第四范式技术团队_InfoQ精选文章