写点什么

PyTorch 2.1 正式发布,带来自动动态 Shape 支持和分布式训练增强

作者:Andrew Hoblitzell

  • 2023-11-14
    北京
  • 本文字数:1231 字

    阅读完需:约 4 分钟

大小:593.52K时长:03:22
PyTorch 2.1正式发布,带来自动动态Shape支持和分布式训练增强

最新版本的 PyTorch 带来了自动动态 shape 支持和分布式训练增强。PyTorch 2.1 在最近举行的 PyTorch 2023 大会 上正式发布,新版本引入了 ExecuTorch ,用于提升 PyTorch 在移动和边缘设备上的性能。此外,主题演讲还公布了 PyTorch 基金会的新成员以及 11 月份的 Docathon 活动。


PyTorch 2.1



torch.compile() 在许多 PyG 模型上表现出色。总体而言,我们看到了几乎 300% 的运行时改进。—— Matthias Fey(PyG 开发者)


PyTorch 2.1 的一个显著特性是 torch.compile 中的自动动态 shape 支持,可以在模型架构中使用动态输入形状。该功能打破了固定输入形状的限制,提供了更大的灵活性。


在分布式训练方面,通过 torch.distributed.checkpoint 引入了增强功能,可以在多个排名之间并行保存和加载训练任务来提高分布式训练效率。这一功能对于管理长时间运行的训练任务和确保更顺畅的训练流程来说至关重要。


PyTorch 2.1 还增加了对在 torch.compile 中调用 NumPy API 的支持,增强了 PyTorch 和 NumPy 之间的互操作性。这一集成有助于在各种设备上执行 NumPy 代码,使代码生成更高效。新版本还带来了性能方面的改进,包括 CPU 引导程序增强、AVX512 支持以及缩放点积注意机制的增强实现。此外,还引入了 torch.export 的原型版本,提供了一种捕获完整图的机制,启用基于 torch.export 的量化来减小模型大小,以及提升边缘设备和移动平台的推理速度。


ExecuTorch


引入 ExecuTorch 标志着 PyTorch 在移动和边缘设备上改进性能的重要进展。ExecuTorch 的一个显著特性是 Lightweight Operator Registry,是为管理各种 PyTorch 模型量身定制的。它简化了 Operator 的处理,而 Operator 是 PyTorch 模型确保最佳运行时性能的核心构建块。


新版本引入了在目标设备上分析和优化模型性能的设备模型分析功能。这种实时分析对于识别性能瓶颈并通过调整模型来提高效率和降低延迟来说至关重要,特别在各个领域的实时应用中,如增强现实、虚拟现实和物联网。


PyTorch 基金会迎来新成员



我们很高兴成为 PyTorch 基金会的创始成员,并期待与人工智能领域的其他领袖紧密合作来一起发展这个令人惊叹的创新社区。

——谷歌


PyTorch 基金会欢迎 华为Lightning AI 成为新的首席成员。华为的加入旨在优化 PyTorch 以发挥其 Ascend 计算平台的潜力,该平台以其在人工智能应用中的强大计算性能而闻名。


Lightning AI 是 PyTorch Lightning 的开发商,这是 PyTorch 的一个轻量级封装器,已经在代码结构化和可重用方面发挥了关键作用,简化了研究人员和开发人员的工作。Lightning AI 加入 PyTorch 基金会重在加强 PyTorch 生态系统的发展。


Docathon


PyTorch 社区组织了一个 Docathon,计划于 2023 年 11 月举行。这一举措旨在完善和扩展框架的文档,确保文档保持最新和对用户友好。希望更多地参与 PyTorch 2.1 的开发者们可以观看 PyTorch YouTube 频道 上的大会视频,或者查看 活动日程 以获取一些演讲者的信息。


原文链接

https://www.infoq.com/news/2023/10/pytorch21-at-pytorch-con-2023/

2023-11-14 08:005767

评论

发布
暂无评论
发现更多内容

多租户篇 | MatrixOne与MySQL全面对比

MatrixOrigin

数据库 分布式 云原生

获奖!科技进步奖一等奖!成果贡献奖金奖!

天翼云开发者社区

云计算 云服务 云平台

Apifox 2月版本更新:常用参数优化,自动化测试持续优化

Apifox

开发工具 Apifox 测试工具

Databend 开源周报第 133 期

Databend

干货 | 如何通过度量研发效能,多角度洞察百人敏捷团队的价值交付?

思码逸研发效能

我是如何参与 Apache Calcite 社区并成为 Committer 的

LakeShen

大数据 开源 Apache Calcite apache 社区 Calcite

教不会你算我输系列 | 手把手教你HarmonyOS应用开发

百度Geek说

HarmonyOS 鸿蒙开发 ArkTS

如何确保团队协作中,项目Node版本的一致性?

秃头小帅oi

node.js 团队协作 低代码

CertiK CSO Dr. Kang Li 确认出席Hack .Summit() 香港区块链盛会

TechubNews

软件测试学习笔记丨Docker容器镜像制作

测试人

软件测试 测试开发

怎样建立健康的绩效管理体系?聊聊专家看到的误区与疑问

思码逸研发效能

深入解析 Java 面向对象编程与类属性应用

伤感汤姆布利柏

Java js java

unsubscribe:Angular 项目中常见场景以及是否需要 unsubscribe

OpenTiny社区

前端 angular

小程序框架(概念、工作原理、发展及应用)

天津汇柏科技有限公司

小程序开发 定制软件开发 软件开发定制

遇见您的私人法律顾问:智能法律大模型,智能解答您的法律困惑

汀丶人工智能

人工智能 智能问答 法律大模型

大数据时代来了

小齐写代码

Stable Diffusion解析:探寻AI绘画背后的科技神秘

极限实验室

GAN model AI绘画 Diffusion Stable Diffusion

软件测试学习笔记丨Docker网络模式与Docker-compose介绍

测试人

软件测试 测试开发

火山引擎“数据飞轮”助力教育行业持续优化产品

极客天地

华为云携十大系统性创新亮相巴塞罗那 打造最适合AI的基础设施

华为云开发者联盟

云计算 AI 华为云 华为云开发者联盟

第40期 | GPTSecurity周报

云起无垠

NFT支持的ICO开发:开创众筹的未来

区块链软件开发推广运营

dapp开发 区块链开发 链游开发 NFT开发 公链开发

等保测评与合规性检查定义以及区别简单了解

行云管家

等级保护 等保测评 合规性检查

如何评价OpenAi发布的视频生成模型Sora?

算法的秘密

苹果上架App被拒绝的原因

deepin Meetup成都站来了!一起聊聊deepin-IDE 2.0,还有礼品可以拿!

nn-30

flutter Linux 操作系统 linux开发 deepin

产品更新 | 如何利用思码逸DevInsight 度量代码评审效率、质量与瓶颈?

思码逸研发效能

深圳企业要知道的:堡垒机就选行云管家!

行云管家

网络安全 堡垒机

AI与人类联手,智能排序人类决策:RLHF标注工具打造协同标注新纪元,重塑AI训练体验

汀丶人工智能

大模型 智能标注 RLHF

PyTorch 2.1正式发布,带来自动动态Shape支持和分布式训练增强_大数据_InfoQ精选文章