写点什么

飞桨开源框架 2.4 版本全新发布,带来哪些新功能?

  • 2022-12-02
    北京
  • 本文字数:1876 字

    阅读完需:约 6 分钟

飞桨开源框架2.4版本全新发布,带来哪些新功能?

用飞桨一站式搞定大模型生产 PaddleFleetX 大模型开发套件业内首发。


11 月 30 日,在百度 WAVE SUMMIT+2022 深度学习开发者峰会上,百度 AI 技术生态总经理马艳军发布了飞桨深度学习平台的最新技术和生态进展,全新发布飞桨开源框架 2.4 版本,带来业界首个端到端大模型开发套件 PaddleFleetX,联合 12 家硬件生态伙伴发布飞桨生态发行版,AI Studio 学习与实训社区升级推出企业实训和生态异构算力中心等等。



图:百度 AI 技术生态总经理马艳军分享飞桨平台最新发布

飞桨开源框架 2.4 版发布

此次飞桨升级的 2.4 版本,框架开发更加灵活便捷,大规模模型分布式训练持续领先,并实现了全场景高性能推理部署。



开发方面,飞桨开源框架 2.4 版本针对稀疏计算、图学习等重要场景新增 160 多个 API,并且 API 开发门槛和成本大幅降低,使此次新增的 API 中有 1/3 来自生态开发者的贡献。针对 AI for Science 场景需求,2.4 版实现了通用的高阶自动微分功能,更好地支持科学计算相关应用。同时,飞桨全面提升了核心动转静技术的可扩展性和部署灵活性,新模型动转静成功率达 92%,充分发挥动态图和静态图各自优势。


训练方面,2.4 版全新升级,推出了基于 GPU 的超大规模图模型训练引擎 PGLBox,在业内率先实现了可同时支持复杂算法、超大图、超大离散模型的一体化图学习方案。另外,飞桨的集合通信分布式训练性能也做到了优化,为大模型训练提供了全面丰富的分布式训练性能优化体系。


作为 AI 实现产业落地的“最后一公里”,模型的推理部署过程十分关键。首先对于大模型的推理,飞桨开源框架 2.4 版支持自适应模型切分和分布式推理等功能,依托飞桨框架动转静能力,可实现自动深度融合及高性能优化,全面支撑大模型应用落地。同时为了从根本上解决 AI 应用落地面临的场景碎片化、开发成本高、推理速度慢三大难题,飞桨全新推出的全场景高性能 AI 部署工具 FastDeploy,一站式满足端、边、云多场景,多框架与多硬件的部署需求,不仅 API 设计统一,简单易用,而且还支持自动化压缩与高性能推理引擎深度联动,可充分发挥软硬一体融合优势,推理性能提升,为 AI 产业应用落地提供最优解。

持续降低应用门槛,加速 AI 应用落地

大模型的应用可以降低 AI 应用的门槛,但大模型开发、训练、推理部署过程仍具有很大的挑战。为了更好地支撑大模型应用落地,飞桨全新发布端到端大模型开发套件 PaddleFleetX。PaddleFleetX 无缝对接飞桨并行策略并支持定制化组合,可以扩展支持更多类型的大模型,开发者可以根据模型结构的特点自行选择并行策略组合,并且支持 GPU/NPU/DCU 等多硬件平台的多云环境的训练调试。同时,PaddleFleetX 还支持自适应分布式推理技术,真正做到了分布式策略的训推一体,大可支持超大模型的服务化部署,小可协同训压推结合的丰富小型化策略,实现端侧轻量化部署。



此次峰会上,飞桨产业级开源模型库开源算法新增至 600 个以上,覆盖视觉、自然语言、时序建模等主流任务场景;经过产业实践打磨的精度与性能平衡 PP 系列特色模型新增至 42 个;飞桨产业实践范例增至 68 个,覆盖金融、工业、交通、互联网、安防、教育等十个重点行业场景;发布飞桨产业级模型库一站式入口,聚合模型知识与工具集,打通模型选择、快速体验、模型开发与使用、模型部署全流程。飞桨从产业模型开源、范例参考等方面蓄力,为企业应用 AI 技术提供便利支持,共同解决产业痛点难点。

发布硬件生态共创计划

推动人工智能在产业中落地应用,离不开与硬件的发展。今年 5 月,飞桨联合硬件生态伙伴发布“硬件生态共创计划”,在联合研发、资源共享、联合授权、培训赋能等多个维度全面合作。截至 11 月,飞桨“硬件生态共创计划”成员已经从 13 家增加至 28 家。同时,飞桨携手英伟达、Arm、寒武纪、昆仑芯、天数智芯、Graphcore、燧原等 12 家厂商联合发布了飞桨生态发行版,在为开发者提供更好的软硬一体化体验的同时,携手共建硬件生态。


为进一步加速 AI 产业智能化升级,飞桨深入产业场景,联合国家能源集团、中国工商银行、中国联通、中国石油、中国铁道科学研究院、中国移动、中国一汽等企业,发布产业实践范例征集计划,链接企业与开发者,解决各行业实际产业场景中的关键问题,助力 AI 产业落地。


飞桨建设的 AI Studio 学习与实训社区致力于让 AI 学习和应用更简单,目前也已成为国内最大的 AI 开发者社区。本次峰会上,AI Studio 升级新增两大板块:企业实训和生态异构算力中心。


企业实训为企业应用深度学习提供了实训阵地。截至目前,飞桨已与 20 余家企业联合举办赛事,共同探索 AI 应用方案,培养 AI 人才。长期以来,AI Studio 为广大开发者提供了包括 CPU 和 GPU 的丰富算力资源,又接入了曙光 DCU 算力,为开发者提供线上体验中心,为硬件基础设施提供便捷的体验环境。

2022-12-02 17:285590
用户头像
刘燕 InfoQ高级技术编辑

发布了 1123 篇内容, 共 602.9 次阅读, 收获喜欢 1982 次。

关注

评论

发布
暂无评论
发现更多内容

百度可观测系列 | 如何构建亿级指标的高可用 TSDB 存储集群?

百度开发者中心

云效制品仓库 Packages,不限容量免费用

阿里云云效

云计算 maven 阿里云 npm 制品仓库

Kubernetes官方java客户端之四:内部应用

程序员欣宸

Kubernetes client 4月月更

【直播回顾】OpenHarmony 知识赋能第四期第四课——音频驱动开发

Anna

OpenHarmony

TiFlash 开源了

PingCAP

“远见者”特斯拉AI主管Karpathy|深度学习崛起十年

OneFlow

人工智能 深度学习 计算机视觉 特斯拉 openai

We are learning by contributing!访 StarRocks Committer 周康、冯浩桉

StarRocks

数据库 开发者社区 StarRocks

产品知识在线培训的解决方案

小炮

企业知识管理

直播预告 | 如何在有限数据下实现资讯类网站海量信息自动分类

百度开发者中心

科创人·知乎CTO李大海:技术服务内容、商业化依赖内容,曾被「呵呵」难到挠头

科创人

教你VUE中的filters过滤器2种用法

CRMEB

【Zeekr_Tech】初谈我们共同的目标 NPDS + Agile

Zeekr_Tech

人工智能 敏捷开发 智能驾驶

ICDE 2022|Apache ShardingSphere:一个功能全面和可插拔的数据分片平台

SphereEx

数据库 ShardingSphere 论文 SphereEx

功能解读|快速上手 OceanBase 数据迁移服务

OceanBase 数据库

oceanbase OceanBase 开源

2022首场MASA技术团队黑客松大赛完美落幕!精彩集锦

MASA技术团队

C# .net 微软

恒源云(Gpushare)_JupyterLab/TensorBoard使用问题?技巧大放送4!

恒源云

人工智能 深度学习 PyTorch

开发者手册之如何成为 OceanBase Contributor

OceanBase 数据库

oceanbase OceanBase 开源 OceanBase 社区版

设备资产管理系统解决方案

低代码小观

资产管理 CRM系统 企业设备管理 设备巡检管理系统 企业管理软件

提升 Hybrid 体验:饿了么双十一 PHA 框架技术实践

阿里巴巴终端技术

App 用户体验 Hybrid PHA

狗尾巴的故事—数智时代的第一性原理|科创人·数智未来私董会

科创人

车载小程序快马加鞭突围车联网生态系统

FinClip

恒源云(Gpushare)_如何安装包/pip加速等?技巧大放送3!

恒源云

安装 pip Ubuntu apt

打通产销对接,构建新型数智化农副产品供应链

数商云

产业互联网 数字化

清华自研时间序列数据库Apache IoTDB原理解析

云智慧AIOps社区

数据库 时序数据库 消息队列 智能运维

高效使用Java构建工具,Maven篇|云效工程师指北

阿里云云效

云计算 maven 阿里云 java 并发 构建工具

Kubernetes官方java客户端之三:外部应用

程序员欣宸

Kubernetes java client

架构标准TOGAF实践最重要的三件事

博文视点Broadview

恒源云(Gpushare)_如何防止训练不中断?技巧大放送1!

恒源云

算法 服务器 训练

恒源云(Gpushare)_如何查看显卡占用的情况?技巧大放送2!

恒源云

算法 GPU服务器 显卡

飞桨开源框架2.4版本全新发布,带来哪些新功能?_AI&大模型_刘燕_InfoQ精选文章