阿里、蚂蚁、晟腾、中科加禾精彩分享 AI 基础设施洞见,现购票可享受 9 折优惠 |AICon 了解详情
写点什么

谷歌推出文本到图像模型 Muse:生成图片质量更高、推理时间更短

  • 2023-01-05
    北京
  • 本文字数:654 字

    阅读完需:约 2 分钟

谷歌推出文本到图像模型Muse:生成图片质量更高、推理时间更短

自 2021 年初以来,随着大量深度学习支持的文本到图像模型(例如DALL-E-2Stable DiffusionMidjourney等)的诞生,人工智能研究的进展发生了革命性的变化。

 

近日,谷歌Muse AI 系统正式亮相。据谷歌 Muse AI 团队称,Muse 是一种文本到图像的 Transformer 模型,该模型可以实现先进的图像生成性能。 

 

我们提出 Muse,一种文本到图像的 Transformer 模型,可实现先进的图像生成性能,同时比扩散或自回归模型更有效。

——谷歌 Muse AI 团队

 

据开发团队介绍,与 Imagen DALL-E 2 等像素空间扩散模型相比,Muse 由于使用离散标记并且需要更少的采样迭代,因此效率显着提高;与 Parti 和其他自回归模型不同,Muse 利用了并行解码。 为了生成高质量的图像并识别物体、它们的空间关系、姿态、基数等视觉概念,使用预训练的 LLM 可以实现细粒度的语言理解。Muse 还可以直接启用许多图像编辑应用程序,而无需微调或反转模型:修复、修复和无蒙版编辑。

 

Muse 的 900M 参数模型在 CC3M 上实现了新的 SOTA,FID 得分为 6.06。Muse 3B 参数模型在零样本 COCO 评估中实现了 7.88 的 FID,以及 0.32 的 CLIP 分数。Muse 还可以直接启用许多图像编辑应用程序,而无需微调或反转模型:修复、修复和无蒙版编辑。

 

Muse 模型能够根据文本提示快速生成高质量图像:在 TPUv4 上,512x512 分辨率为 1.3 秒,256x256 分辨率为 0.5 秒。

 

根据 MUSE 的基准测试可以看出,Muse 的推理时间明显低于竞争模型。

 


参考链接:

 

https://muse-model.github.io/

https://dataconomy.com/2023/01/google-muse-ai-explained-how-does-it-work/

公众号推荐:

2024 年 1 月,InfoQ 研究中心重磅发布《大语言模型综合能力测评报告 2024》,揭示了 10 个大模型在语义理解、文学创作、知识问答等领域的卓越表现。ChatGPT-4、文心一言等领先模型在编程、逻辑推理等方面展现出惊人的进步,预示着大模型将在 2024 年迎来更广泛的应用和创新。关注公众号「AI 前线」,回复「大模型报告」免费获取电子版研究报告。

AI 前线公众号
2023-01-05 11:436083
用户头像
李冬梅 加V:busulishang4668

发布了 807 篇内容, 共 376.3 次阅读, 收获喜欢 998 次。

关注

评论

发布
暂无评论
发现更多内容

40张图入门Linux——(前端够用,运维入门)

执鸢者

Linux 大前端

一文了解greenplum

数据社

数据库 greenplum MPP

Jira 和 Confluence 企业最佳部署方式

Atlassian

项目管理 敏捷开发 Atlassian Jira

架构师训练营第十章作业

叮叮董董

远程办公暴露过程管理的不足

持续交付实践指南

管理 软件工程 远程办公

关于微服务架构的思考和认知

任小龙

聊聊数据库

数据社

数据库 大数据

第十周学习总结

赵龙

Dubbo微服务框架请求流程

GalaxyCreater

架构

数据库的那些事

数据社

数据库 大数据

架构师训练营 week10 summary

Nick

微服务和DDD总结

周冬辉

微服务 DDD

第十周作业

方堃

架构师训练营第十章总结

叮叮董董

凉了!张三同学没答好「进程间通信」,被面试官挂了....

小林coding

操作系统 计算机基础 进程

报警不响,黄金万两的“稳定性成熟度”干货

滴滴普惠出行

一周信创舆情观察(8.3~8.9)

统小信uos

微服务架构的思考

Season

芯片破壁者(十一):回看日本半导体的倾塌

脑极体

链表应用之设计高性能访客记录系统

架构师修行之路

数据结构 链表 架构师

Django如何编写自定义manage.py 命令

BigYoung

Python django manage.py

什么是死锁?如何解决死锁?

古月木易

死锁

数据中台建设方法论

数据社

大数据 数据中台

架构师训练营 week10 homework

Nick

CDH部署指南

数据社

大数据 CDH

六张图从HTTP/0.9进化到HTTP3.0

执鸢者

大前端 网络 HTTP

socket通信,你还会实现么?

小隐乐乐

什么是死锁?如何解决死锁?

奈学教育

解决 WARNING: REMOTE HOST IDENTIFICATION HAS CHANGED

邵俊达

Linux SSH

第十周命题作业

赵龙

Go make 和 new 的区别

曲镇

make Go 语言

谷歌推出文本到图像模型Muse:生成图片质量更高、推理时间更短_文化 & 方法_李冬梅_InfoQ精选文章