大厂Data+Agent 秘籍:腾讯/阿里/字节解析如何提升数据分析智能。 了解详情
写点什么

苹果开源扩散编码模型 DiffuCoder

  • 2025-07-30
    北京
  • 本文字数:1122 字

    阅读完需:约 4 分钟

大小:560.61K时长:03:11
苹果开源扩散编码模型DiffuCoder

苹果开源了DiffuCoder,这是一个针对编程任务微调的扩散大语言模型(dLLM)。DiffuCoder 基于Qwen-2.5-Coder,并在几个编程基准测试中超越了其他特定于代码的 LLM。

 

与典型的自回归方式“从左到右”生成文本的 LLM 不同,dLLM 通过并行去噪整个序列来生成文本,这意味着可以更快地生成。苹果的研究人员开发了 DiffuCoder,以便他们能够研究 dLLM 微调和推理的最佳策略。在他们的研究中,他们开发了一种称为耦合-GRPO 的组相关策略优化(Group Relative Policy Optimization,GRPO)微调技术的变体,这提高了模型的性能。在MBPP编程基准测试中,DiffuCoder 超越了Gemini Diffusion,并与 GPT-4o“竞争力”相当。根据苹果的说法,

 

通过使用一种新颖的耦合采样策略,我们的方法提供了更准确的似然估计。耦合-GRPO 显著提升了 DiffuCoder 的性能,证明了与扩散原则一致的强化学习方法的有效性。我们的工作使社区对 dLLM 有了更深入理解,并为未来在复杂推理和生成任务中探索 dLLM 奠定了坚实的基础。

 

大多数 LLM,如 OpenAI 的 GPT 模型,通过预测一个单一的下一个标记来追加到序列中,然后以新序列作为输入反馈,以自回归的方式生成文本。dLLM 采取的方法类似于 DALL-E 等图像生成模型:它们从一个嘈杂的序列开始,并迭代地去噪。这使得 dLLM 比自回归 LLM 生成输出要快得多:在 Gemini Diffusion 的案例中快了五倍。此外,它们不受从左到右产生文本的限制。相反,它们可以执行“全局内容规划”,这在编码任务中可能是一个优势。

 

苹果研究的一个关键成果是创建了自回归性(AR-ness)指标,该指标衡量模型遵循 LLM 从左到右模式的程度。他们发现 dLLM 通常表现出高度的 AR-ness,这可能是由于文本生成的固有性质。然而,在生成代码时,这个指标会下降。

 

他们还发现,增加采样温度会影响模型的 AR-ness,使模型在选择标记和标记顺序方面更加灵活。这提高了其在编程基准测试中的“pass@k”得分。研究人员指出,过去的工作表明,RL 微调模型的推理能力“受到基础模型的 pass@k 采样能力的约束”,这表明 DiffuCoder 有“巨大”的改进潜力。这促使了他们开发了耦合-GRPO RL 训练,这确实提高了 DiffuCoder 的基准测试结果,在某些情况下提高了 6 个百分点以上。

 

在 Hacker News 上的讨论中,一位用户写道

 

扩散模型在并行化和速度方面带来了很多好处;在我看来,这种架构比严格的从左到右生成更适合编码……总体而言,这很有趣。在某种程度上,这些本地模型将足够好,可以用于“实际工作”,并且它们将迅速被 API 提供商采用。苹果的游戏是在设备上的;我想我们会在明年看到它们的后代和 Xcode 一起发布,作为编码体验的一部分。

 

DiffuCoder的代码可以在 GitHub 上找到。模型文件可以从 Huggingface 下载。

 

原文链接:

https://www.infoq.com/news/2025/07/apple-diffucoder/

2025-07-30 13:001

评论

发布
暂无评论

物联网场景中灵活实施对设备的控制管理

亚马逊云科技 (Amazon Web Services)

IoT

PassJava 开源 (六) :整合Spring Cloud Alibaba Nacos组件

悟空聊架构

28天写作 passjava 悟空聊架构 12月日更 naocs

【CSS 学习总结】第五篇 - CSS 变量 var

Brave

CSS 12月日更

Golang中的协程是干什么用的?

liuzhen007

28天写作 12月日更

为什么要空投?(24/28)

赵新龙

28天写作

23《重学JAVA》--泛型

杨鹏Geek

Java25周年 28天写作 12月日更

收集、处理并监控设备数据——Amazon IoT SiteWise Edge“一网打尽”

亚马逊云科技 (Amazon Web Services)

IoT

构建安防视频云存,和传统安防视频业务的烦恼说再见!

亚马逊云科技 (Amazon Web Services)

IoT

Certificate Vending Machine – Amazon IoT 设备接入 Amazon IoT 平台解决方案

亚马逊云科技 (Amazon Web Services)

IoT

设计千万级学生管理系统的考试试卷存储方案

drizzle

「架构实战营」

深圳买房记

hackstoic

房地产

给弟弟的信第23封|如何写一篇文章?

大菠萝

28天写作

十大排序算法思想与Python实现

宇宙之一粟

Python 排序算法 12月日更

JavaScript 中对象和映射之间的 6 个区别

devpoint

JavaScript map Object 12月日更

如何根据不同业务场景调节 HPA 扩缩容灵敏度

xcbeyond

Kubernetes 28天写作 12月日更

【CSS 学习总结】第四篇 - CSS 选择器-伪类和伪元素

Brave

CSS 12月日更

利用 Cognizant APEx 2.0 和 Amazon IoT SiteWise Edge 提高产品质量

亚马逊云科技 (Amazon Web Services)

IoT

Capgemini 如何利用 Amazon IoT 通过农业洞察监控农田

亚马逊云科技 (Amazon Web Services)

IoT

利用Amazon Lambda实现Amazon IoT设备证书的即时注册

亚马逊云科技 (Amazon Web Services)

IoT

Servlet基础知识与新手常遇到的错及解决方法(01)

海拥(haiyong.site)

服务器 28天写作 12月日更

1个通用工具平台+多个热点场景工具套件,助力开发者快速构建应用

华为云开发者联盟

云计算 低代码 开发工具 devcloud 应用构建

华为云GaussDB新产品特性亮相DTC2021,重磅新品开源预告

华为云开发者联盟

数据库 华为云 GaussDB 同城双集群 内存引擎

LabVIEW灰度图像操作与运算(基础篇—2)

不脱发的程序猿

机器视觉 图像处理 LabVIEW 灰度图像操作与运算

Amazon ES现更名为Amazon OpenSearch Service并支持OpenSearch 1.0

亚马逊云科技 (Amazon Web Services)

IoT

使用模版自动化 Amazon IoT 设备创建及证书注册过程

亚马逊云科技 (Amazon Web Services)

IoT

圣诞节

Tiger

28天写作

Amazon IoT Core 服务成本优化

亚马逊云科技 (Amazon Web Services)

IoT

左手自研,右手开源,技术揭秘华为云如何领跑容器市场

华为云开发者联盟

Docker 开源 Kubernetes 容器 云原生

圣诞节

圣迪

圣诞节 圣诞老人 平安夜 尼古拉斯 长筒袜

模块3作业

miliving

2022年就要开始啦

搬砖的周狮傅

目标

苹果开源扩散编码模型DiffuCoder_AI&大模型_Anthony Alford_InfoQ精选文章