写点什么

谷歌推出文本到图像模型 Muse:生成图片质量更高、推理时间更短

  • 2023-01-05
    北京
  • 本文字数:654 字

    阅读完需:约 2 分钟

谷歌推出文本到图像模型Muse:生成图片质量更高、推理时间更短

自 2021 年初以来,随着大量深度学习支持的文本到图像模型(例如DALL-E-2Stable DiffusionMidjourney等)的诞生,人工智能研究的进展发生了革命性的变化。

 

近日,谷歌Muse AI 系统正式亮相。据谷歌 Muse AI 团队称,Muse 是一种文本到图像的 Transformer 模型,该模型可以实现先进的图像生成性能。 

 

我们提出 Muse,一种文本到图像的 Transformer 模型,可实现先进的图像生成性能,同时比扩散或自回归模型更有效。

——谷歌 Muse AI 团队

 

据开发团队介绍,与 Imagen DALL-E 2 等像素空间扩散模型相比,Muse 由于使用离散标记并且需要更少的采样迭代,因此效率显着提高;与 Parti 和其他自回归模型不同,Muse 利用了并行解码。 为了生成高质量的图像并识别物体、它们的空间关系、姿态、基数等视觉概念,使用预训练的 LLM 可以实现细粒度的语言理解。Muse 还可以直接启用许多图像编辑应用程序,而无需微调或反转模型:修复、修复和无蒙版编辑。

 

Muse 的 900M 参数模型在 CC3M 上实现了新的 SOTA,FID 得分为 6.06。Muse 3B 参数模型在零样本 COCO 评估中实现了 7.88 的 FID,以及 0.32 的 CLIP 分数。Muse 还可以直接启用许多图像编辑应用程序,而无需微调或反转模型:修复、修复和无蒙版编辑。

 

Muse 模型能够根据文本提示快速生成高质量图像:在 TPUv4 上,512x512 分辨率为 1.3 秒,256x256 分辨率为 0.5 秒。

 

根据 MUSE 的基准测试可以看出,Muse 的推理时间明显低于竞争模型。

 


参考链接:

 

https://muse-model.github.io/

https://dataconomy.com/2023/01/google-muse-ai-explained-how-does-it-work/

2023-01-05 11:436318
用户头像
李冬梅 加V:busulishang4668

发布了 913 篇内容, 共 499.7 次阅读, 收获喜欢 1086 次。

关注

评论

发布
暂无评论
发现更多内容

话说 wait、notify 、 notifyAll

木子的昼夜

Java 通信 Wait notify notifyAll

翻译:《实用的Python编程》03_04_Modules

codists

Python

互联网信贷风险与大数据 个人信贷业务互联网化

张老蔫

28天写作

职场中吃力不讨好?从根因上去破解

一笑

28天写作

大话 Python:python 操作 excel 系列 -- excel 数据分析

老王说编程

Python 数据分析 Excel

DevOps敏捷60问,一定有你想了解的问题

华为云开发者联盟

DevOps 运维 敏捷 工具链 华为云

大话 Python:python 操作 excel 系列 -- 数据汇总与统计

老王说编程

Python Excel 数据统计

区块链培训哪家专业,引领区块链技术创新

CECBC

区块链

试用期没过,因在公司上了1024网站...

程序猿石头

程序员 网络安全 信息安全 个人隐私

Mybatis系列全解(八):Mybatis的9大动态SQL标签你知道几个?提前致女神!

潘大壮

Java 后端 mybatis 后台 mybatis源码

大话 Python:python 操作 excel 系列 -- 怎样读取 excel 文件?

老王说编程

Python Excel 数据读取

有图有真相:带你实现现流行的权限验证

华为云开发者联盟

安全 session 权限 JWT 认证

浪潮肖雪:用工业互联网解决企业痛点问题

浪潮云

工业互联网

LeetCode题解:190. 颠倒二进制位,使用遮罩,JavaScript,详细注释

Lee Chen

算法 大前端 LeetCode

基于pandas

rainbow

不用代码趣讲 ZooKeeper 集群

HelloGitHub

Java zookeeper ZooKeeper原理

B站专栏内页数据如何抓取,Web Scraper 学习在进一步,无编码学爬虫之五

梦想橡皮擦

Python 28天写作 3月日更

【笔记】第六周-第1课

Geek_娴子

死磕归并排序算法

Silently9527

算法 排序算法 快速排序

git 教程 --git reset命令

生之欢愉,时间同行

git git reset

linux使用udev配置U盘自动挂载

happlyfox

Linux 28天写作 udev 自动挂载

大话 Python:python 操作 excel 系列 -- pandas 读取、分析、保存

老王说编程

Python Excel pandas

大话 Python:python 操作 excel 系列 -- 数据处理

老王说编程

数据处理 python excel

Redis最佳实践:7个维度+43条使用规范,带你彻底玩转Redis | 附最佳实践清单

Kaito

数据库 redis 后端

架构学习2021年03月03日(002)

张小胖

据说很多女性看不懂地图——视觉表象

Justin

心理学 28天写作 游戏设计

大话 Python:python 操作 excel 系列 -- 数据清洗

老王说编程

Python Excel 数据清洗

徐烨:这20年,我与应用系统的“云化”之路

华为云开发者联盟

架构 服务器 华为云 企业上云 应用系统

为什么你停滞不前

ES_her0

28天写作 3月日更

呀,又是一个谣言「Day 12」

道伟

28天写作

大话 Python:python 操作 excel 系列 -- 数据的提取与筛选

老王说编程

Python Excel 数据提取与筛选

谷歌推出文本到图像模型Muse:生成图片质量更高、推理时间更短_文化 & 方法_李冬梅_InfoQ精选文章