大厂Data+Agent 秘籍:腾讯/阿里/字节解析如何提升数据分析智能。 了解详情
写点什么

谷歌推出文本到图像模型 Muse:生成图片质量更高、推理时间更短

  • 2023-01-05
    北京
  • 本文字数:654 字

    阅读完需:约 2 分钟

谷歌推出文本到图像模型Muse:生成图片质量更高、推理时间更短

自 2021 年初以来,随着大量深度学习支持的文本到图像模型(例如DALL-E-2Stable DiffusionMidjourney等)的诞生,人工智能研究的进展发生了革命性的变化。

 

近日,谷歌Muse AI 系统正式亮相。据谷歌 Muse AI 团队称,Muse 是一种文本到图像的 Transformer 模型,该模型可以实现先进的图像生成性能。 

 

我们提出 Muse,一种文本到图像的 Transformer 模型,可实现先进的图像生成性能,同时比扩散或自回归模型更有效。

——谷歌 Muse AI 团队

 

据开发团队介绍,与 Imagen DALL-E 2 等像素空间扩散模型相比,Muse 由于使用离散标记并且需要更少的采样迭代,因此效率显着提高;与 Parti 和其他自回归模型不同,Muse 利用了并行解码。 为了生成高质量的图像并识别物体、它们的空间关系、姿态、基数等视觉概念,使用预训练的 LLM 可以实现细粒度的语言理解。Muse 还可以直接启用许多图像编辑应用程序,而无需微调或反转模型:修复、修复和无蒙版编辑。

 

Muse 的 900M 参数模型在 CC3M 上实现了新的 SOTA,FID 得分为 6.06。Muse 3B 参数模型在零样本 COCO 评估中实现了 7.88 的 FID,以及 0.32 的 CLIP 分数。Muse 还可以直接启用许多图像编辑应用程序,而无需微调或反转模型:修复、修复和无蒙版编辑。

 

Muse 模型能够根据文本提示快速生成高质量图像:在 TPUv4 上,512x512 分辨率为 1.3 秒,256x256 分辨率为 0.5 秒。

 

根据 MUSE 的基准测试可以看出,Muse 的推理时间明显低于竞争模型。

 


参考链接:

 

https://muse-model.github.io/

https://dataconomy.com/2023/01/google-muse-ai-explained-how-does-it-work/

2023-01-05 11:436855
用户头像
李冬梅 加V:busulishang4668

发布了 1121 篇内容, 共 738.6 次阅读, 收获喜欢 1267 次。

关注

评论

发布
暂无评论
发现更多内容

支持 4K/HDR/杜比视界!nPlayer for Mac

Rose

当AI遇上供应链 第七在线助力精准决策

第七在线

KOL技术圈 | 下一代智能可观测平台长什么样?来看Bonree ONE的极致演绎!

博睿数据

CST的热仿真THs稳态求解器--针式散热片

思茂信息

cst CST软件 CST Studio Suite

OpsPilot 智能体:打破工具孤岛、降低人为失误,优化运维流程

嘉为蓝鲸

智能运维 #WeOps OpsPilot

DeepChat for mac您的桌面AI伙伴

Rose

为什么有的企业上了ERP还要上MES?

积木链小链

数字化转型 ERP 智能制造 mes

BricsCAD 23 for Mac(CAD建模软件)v23.2.07中/英文永久激活版

Rose

Screen Wonders for Mac:点亮 Mac 桌面的奇幻之光

晨光熹微

3D建筑建模 Vectorworks2024破解安装教程【Mac&win】

Rose

TK海外抢单网站源码/前后端分离,前端uniapp,后端php

网站,小程序,APP开发定制

从OCR到Document Parsing,AI时代的非结构化数据处理发生了什么改变?

合合技术团队

人工智能 算法 #大数据

Boom 3D for Mac:重塑你的听觉盛宴

晨光熹微

Boom 3D Boom 3D for Mac Boom 3D激活版

cinema 4d 2024-c4d中文版激活教程【Mac/win】

Rose

嘉为蓝鲸可观测系列产品入选Gartner《中国智能IT监控与日志分析工具市场指南》

嘉为蓝鲸

Gartner 可观测

专业的科学和工程分析软件 WaveMetrics Igor Pro 9 Mac

Rose

【重磅】JimuReport 积木报表 v2.0 版本发布,免费可视化报表

JEECG低代码

数据可视化 报表 积木报表 报表工具 积木BI

QT软件外包开发流程

北京木奇移动技术有限公司

软件外包公司 QT软件开发 QT外包公司

精彩抢先看 | 博睿数据将受邀出席GOPS全球运维大会2025北京站!

博睿数据

QT软件外包项目的验收

北京木奇移动技术有限公司

软件外包公司 QT开发公司 QT外包公司

构建精细化DevOps权限体系:从数据级管控到全局授权

嘉为蓝鲸

DevOps 智能运维

嘉为蓝鲸WeOps:集成主流云服务商,自动化证书申请 + 一键部署全流程提速

嘉为蓝鲸

SSL证书 #WeOps 一体化运维

选择GPU云服务器供应商的注意事项

Ogcloud

gpu 云服务商 GPU云服务器 GPU云服务器供应商

AI技术在图书馆业务中的应用

北京木奇移动技术有限公司

软件外包公司 AI技术应用 图书馆信息化

警惕!这3个AI测试用例陷阱,让80%的团队白忙一场...

测试人

人工智能

企业带宽租赁的优势与应用场景有哪些?

Ogcloud

带宽租用 带宽租赁 大带宽 机房大带宽 大带宽租用

QT软件外包开发中的测试

北京木奇移动技术有限公司

软件外包公司 QT开发公司 QT软件开发

装备制造MES系统解决方案:破解生产痛点,驱动智能制造升级

万界星空科技

制造业 mes 装备修理行业 装备制造 装备mes

Package Builder for Mac:Mac 软件打包的得力助手

晨光熹微

ToothFairy for Mac:轻松管理蓝牙设备

晨光熹微

钉钉携手鸿蒙扫一扫,打造高效办公新体验

HarmonyOS SDK

harmoyos

谷歌推出文本到图像模型Muse:生成图片质量更高、推理时间更短_文化 & 方法_李冬梅_InfoQ精选文章