写点什么

研究者尝试揭示扩散模型创造力的起源

  • 2025-07-08
    北京
  • 本文字数:1025 字

    阅读完需:约 3 分钟

大小:506.40K时长:02:52
研究者尝试揭示扩散模型创造力的起源

斯坦福大学研究人员 Mason Kamb 与 Surya Ganguli 在最新论文中提出了一种可能解释扩散模型创造力的机制。他们建立的数学模型表明,这种创造力是此类模型利用去噪过程生成图像时必然产生的确定性结果。

 

简而言之,扩散模型的训练本质是从各向同性高斯噪声分布中挖掘图像,该噪声分布源自有限训练图像集的处理结果。这一过程通过逐步去除高斯噪声实现,具体方式是学习一个指向概率递增梯度方向的评分函数。

 

若神经网络能精确掌握这个理想评分函数,就能完美逆转前向的过程。但这样一来,也只能是将高斯噪声转化为记忆中的训练样本图像。

 

这意味着,要生成超出训练集分布范围的新图像,模型必须无法完全掌握理想评分函数。对此的一种解释是:归纳偏置的存在可能更准确地描述了扩散模型在创造性生成新样本时的实际运作方式。

 

通过分析扩散模型是如何利用卷积神经网络(CNN)估算评分函数,研究者识别出两种关键偏置:平移等变性局部性。平移等变性是指模型会反映输入图像的位移变化(输入图像平移几个像素,生成图像也会对应平移);局部性则源于学习评分函数时使用的 CNN 结构只考虑输入像素的局部邻域,而非全局信息。

 

基于这些发现,研究者搭建了一个为优化等变性与局部性评分函数的数学模型,并将其称作是等变局部评分机(ELS)。

 

ELS 机是一组能计算去噪图像组合的方程式,研究者将其输出与在简化模型上训练的 ResNet、UNet 等扩散模型进行对比,发现“CNN 输出与 ELS 机输出呈现出显著且一致的量化吻合”,准确率约 90%以上(具体数值因模型和数据集而异)。

 

据我们所知,这是首个能以如此精度解析基于深度神经网络的生成模型创造行为的理论。重要的是,(E)LS 机对所有训练输出的解释力都远超 IS 机。

 

Ganguli 指出,他们的研究揭示了扩散模型如何“通过在新图像不同位置混合匹配训练集的局部图像块,形成一种局部拼贴式的创造力模型”。该理论还能解释扩散模型的典型错误(如生成多余手指或肢体),这些都是过度局部化导致的后果。

 

尽管结论颇具说服力,但初始研究排除了包含高度非局部自注意力层(SA)的扩散模型(因其违背了研究者的局部性假设)。针对这点,论文作者使用 ELS 机预测了基于 CIFAR-10 预训练的公开 UNet+SA 模型输出,发现其准确率仍显著高于基线 IS 机。

 

研究者表示,他们的成果证明局部性与等变性足以解释纯卷积扩散模型的创造力,并可为研究更复杂扩散模型奠定基础。研究团队还开源了实验中使用的扩散模型训练代码


原文链接:

https://www.infoq.com/news/2025/07/diffusion-model-creativity/

2025-07-08 16:009331

评论

发布
暂无评论

使用 TypeScript 从零搭建自己的 Web 框架:路由映射

RoyLin

typescript

XMind 2024思维导图软件:更好地组织思维、管理信息、规划项目和解决问题

Rose

思维导图 XMind 2024思维导图 XMind 2024破解版

影视特效合成软件:Blackmagic Fusion Studio 19 mac中文下载安装 含破解补丁

Rose

视觉特效 Blackmagic Fusion Studio Fusion Studio 19密钥 Fusion Studio 19下载

Monibuca v5 实现热重启

不卡科技

Go 流媒体开发

使用 TypeScript 从零搭建自己的 Web 框架:依赖注入

RoyLin

typescript

使用 TypeScript 从零搭建自己的 Web 框架:代理(Proxy)

RoyLin

typescript

主从延迟调优思路

GreatSQL

Autodesk AutoCAD 2022中文版下载 cad2022破解补丁及安装教程 mac/win

Rose

AutoCAD2022序列号 autocad2022秘钥 autocad2022破解版 cad2022下载

详解K8s 镜像缓存管理kube-fledged

华为云开发者联盟

Kubernetes 开发 华为云 华为云开发者联盟 企业号2024年4月PK榜

西贝柳斯Avid Sibelius 2023:无限制地撰写,排列和创作乐谱

Rose

打谱软件 西贝柳斯 Avid Sibelius

macbook防休眠工具Amphetamine,自定义Mac睡眠时间

Rose

软件 Mac Amphetamine 防休眠

Waves 14 Complete完整破解安装包:音频编辑、混音和母带处理

Rose

waves14 Waves 14破解教程 Waves 下载 Waves 14 Complete破解 母带处理

mac office办公软件平替:Polaris Office 全面的办公自动化套件 支持M1/M2

Rose

office办公软件 软件下载 Polaris Office 下载 Polaris Office mac版

Mac免费软件:不限速下载工具JDownloader

Rose

JDownloader下载 种子下载器 高速下载工具 JDownloader Mac版

MATLAB R2023b mac安装密钥 含许可证文件 matlab r2023b详细图文安装教程

Rose

数学软件 MATLAB R2023b激活码 MATLAB安装秘钥

一种融合指代消解序列标注方法在中文人名识别上的应用(下)

京东科技开发者

Docker从入门到精通:ubuntu系统安装docker

霍格沃兹测试开发学社

利用taobao.item_search API接口,多样搜索类型满足你的购物需求

技术冰糖葫芦

api 货币化 API 测试 pinduoduo API

Docker从入门到精通:Docker镜像相关命令学习

霍格沃兹测试开发学社

使用 TypeScript 从零搭建自己的 Web 框架:探索装饰器与反射 API

RoyLin

typescript

使用 TypeScript 从零搭建自己的 Web 框架:文件扫描与动态导入

RoyLin

typescript

使用 TypeScript 从零搭建自己的 Web 框架:循环引用

RoyLin

Studio One 4永久许可证 含Studio One 4下载安装教程 【mac/win】

Rose

音乐制作 Studio One 许可证 Studio One 4破解版 Studio One下载安装

Monibuca v5 中实现优雅内存分配器

不卡科技

Go 流媒体开发 内存池

使用Python生成二维码

京东科技开发者

研究者尝试揭示扩散模型创造力的起源_AI&大模型_Sergio De Simone_InfoQ精选文章