限时领|《AI 百问百答》专栏课+实体书(包邮)! 了解详情
写点什么

谷歌推出文本到图像模型 Muse:生成图片质量更高、推理时间更短

  • 2023-01-05
    北京
  • 本文字数:654 字

    阅读完需:约 2 分钟

谷歌推出文本到图像模型Muse:生成图片质量更高、推理时间更短

自 2021 年初以来,随着大量深度学习支持的文本到图像模型(例如DALL-E-2Stable DiffusionMidjourney等)的诞生,人工智能研究的进展发生了革命性的变化。

 

近日,谷歌Muse AI 系统正式亮相。据谷歌 Muse AI 团队称,Muse 是一种文本到图像的 Transformer 模型,该模型可以实现先进的图像生成性能。 

 

我们提出 Muse,一种文本到图像的 Transformer 模型,可实现先进的图像生成性能,同时比扩散或自回归模型更有效。

——谷歌 Muse AI 团队

 

据开发团队介绍,与 Imagen DALL-E 2 等像素空间扩散模型相比,Muse 由于使用离散标记并且需要更少的采样迭代,因此效率显着提高;与 Parti 和其他自回归模型不同,Muse 利用了并行解码。 为了生成高质量的图像并识别物体、它们的空间关系、姿态、基数等视觉概念,使用预训练的 LLM 可以实现细粒度的语言理解。Muse 还可以直接启用许多图像编辑应用程序,而无需微调或反转模型:修复、修复和无蒙版编辑。

 

Muse 的 900M 参数模型在 CC3M 上实现了新的 SOTA,FID 得分为 6.06。Muse 3B 参数模型在零样本 COCO 评估中实现了 7.88 的 FID,以及 0.32 的 CLIP 分数。Muse 还可以直接启用许多图像编辑应用程序,而无需微调或反转模型:修复、修复和无蒙版编辑。

 

Muse 模型能够根据文本提示快速生成高质量图像:在 TPUv4 上,512x512 分辨率为 1.3 秒,256x256 分辨率为 0.5 秒。

 

根据 MUSE 的基准测试可以看出,Muse 的推理时间明显低于竞争模型。

 


参考链接:

 

https://muse-model.github.io/

https://dataconomy.com/2023/01/google-muse-ai-explained-how-does-it-work/

2023-01-05 11:436837
用户头像
李冬梅 加V:busulishang4668

发布了 1118 篇内容, 共 731.3 次阅读, 收获喜欢 1260 次。

关注

评论

发布
暂无评论
发现更多内容

英特尔发布提升计算效率的多种新方法:将在机器人、增强现实等领域广泛应用

最新动态

Week2-总结

TiK

极客大学架构师训练营

架构设计篇之领域驱动设计(DDD)

小诚信驿站

领域驱动设计 DDD 架构设计 架构设计原则 刘晓成

永远招聘:打造高绩效团队的最佳姿势

伴鱼技术团队

企业文化 管理 团队建设 绩效 团队组织

深入理解MySQL索引

Simon郎

MySQL 索引

【架构训练营】第二周总结

Mr.hou

极客大学架构师训练营

架构师训练营第二周作业

好名字

极客大学架构师训练营 作业

理解持续测试,才算理解DevOps

禅道项目管理

DevOps 测试 持续集成

第二周作业

芒夏

极客大学架构师训练营

CVPR 2020 六小时教程上线!新视角生成的前沿方法

神经星星

人工智能 学习 计算机视觉 模式识别 教程

带功能隔离的cache设计

Coder的技术之路

Week 02 学习总结

卧石漾溪

极客大学架构师训练营

架构师训练营 - 第二周 - 作业

韩挺

第二周作业

changtai

极客大学架构师训练营

Week2-作业

TiK

极客大学架构师训练营

java静态代理与动态代理

张瑞浩

第二周学习总结

武鹏

架构师训练营 - 软件设计原则

Pontus

极客大学架构师训练营

架构师训练营——第二周作业

jiangnanage

架构师训练营第二周总结

sunnywhy

架构师训练营-第二章课程总结-软件设计&面向对象

而立

极客大学架构师训练营

架构师训练营-作业-2-架构设计原则

superman

Spring Web MVC 依赖倒置原则分析

鲁米

在滴滴和字节跳动干了 2 年后端开发,太真实…

程序员生活志

程序员 字节跳动 后端 滴滴 开发

架构师训练营 - 第二周 - 学习总结

韩挺

架构师训练营第二周作业

sunnywhy

依赖倒置原则

Coder的技术之路

嵌入SpreadJS,赋能计量器具检定信息化

葡萄城技术团队

SpreadJS 计量检定

【架构训练营】第二周作业

Mr.hou

极客大学架构师训练营

架构师训练营 - 软件设计原则

Pontus

极客大学架构师训练营

第二周总结

芒夏

极客大学架构师训练营

谷歌推出文本到图像模型Muse:生成图片质量更高、推理时间更短_文化 & 方法_李冬梅_InfoQ精选文章