写点什么

谷歌 AI 发布新的文本至图像 Transformer 模型 Muse

作者:Daniel Dominguez

  • 2023-02-13
    北京
  • 本文字数:786 字

    阅读完需:约 3 分钟

谷歌AI发布新的文本至图像Transformer模型Muse

谷歌AI发布了一篇关于Muse的研究论文,这是一种新的文本至图像生成技术,它基于掩码生成(Masked Generative)Transformer,可以生成与DALL-E 2Imagen等竞争对手相媲美的高质量图片,但是速度要快得多。


Muse 被训练为预测随机掩码图像的 token,它会使用业已训练过的大型语言模型所生成的嵌入式文本。这项工作涉及在离散的 token 空间中进行掩码建模。Muse 使用一个 9 亿个参数的模型,称为掩码生产transformer(masked generative transformer),以创造视觉效果,而不是采用像素空间扩散自回归模型。


谷歌声称,借助 TPUv4 芯片,可以在 0.5 秒内创建一个 256*256 的图像,而使用 Imagen 则需要 9.1 秒,根据谷歌的说法,Imagen 使用的扩散模型提供了“前所未有的逼真程度”和“深度的语言理解”。TPU,即张量处理单元(Tensor Processing Unit),是谷歌开发的定制芯片,专门用作 AI 的加速器。


根据研究,谷歌 AI 已经训练了一系列不同规模的 Muse 模型,参数从 6.32 亿到 30 亿不等,研究发现,预先训练好的大型语言模型,对于生成逼真的高质量图像至关重要。


Muse 的性能也超过了最先进的自回归模型Parti,因为它使用了并行解码,在推理时间上比 Imagen-3B 或 Parti-3B 模型快 10 倍以上,根据使用同等硬件的测试,比 Stable Diffusion v1.4 快 3 倍。


Muse 创建的视觉效果与输入中的各种语义成分相对应,如名词、动词和形容词。此外,它还展示了视觉风格和多对象特性的知识,如合成性(compositionality)和基数(cardinality)。


近年来,由于新的训练方法和改进的深度学习架构,图像生成模型有了长足的进步。这些模型有能力生成非常详尽和逼真的图像,在广泛的行业和应用中,它们正在成为越来越强大的工具。


原文链接:

Google AI Unveils Muse, a New Text-To-Image Transformer Model


相关阅读:

OpenAI 宣布 DALL·E 开放测试版:面向 100 万用户,有文字就能生成图片

谷歌最新 Imagen AI 在文本至图像生成方面优于 DALL-E

2023-02-13 08:005336

评论

发布
暂无评论
发现更多内容

RightFont for Mac(字体管理软件)v 9.4.1 免激活版

小玖_苹果Mac软件

Nova for Mac(强大的代码编辑器)v12.3中文版

Rose

Capture One 23 Pro for mac(RAW转换和图像编辑工具)中文专业版

小玖_苹果Mac软件

RUM性能监控之数据埋点

乘云数字DataBuff

前端监控 可观测性 用户体验 RUM

HTTPS 与 HTTP 的区别在哪?

伤感汤姆布利柏

ForkLift for Mac:快速、强大、易用的文件管理工具

Rose

RightFont for Mac(字体管理软件)v 9.4.1 免激活版

Rose

信用社需要使用堡垒机的情况分析

行云管家

等保 等保测评 信用社

GForce Oddity3 for Mac Oddity音频合成器

Rose

Microsoft Outlook 2024 LTSC for Mac v16.94.2中文正式版

小玖_苹果Mac软件

和鲸科技携手四川气象,以 AI 的力量赋能四川气象一体化平台建设

ModelWhale

Python 人工智能 大数据 环境 气象

“2025深圳人工智能展”带你领略AI技术创新的魅力

AIOTE智博会

人工智能展

Microsoft Outlook 2024 LTSC for Macv16.94.2中文正式版

Rose

中文专业版Capture One 23 ProRAW转换和图像编辑工具

Rose

ForkLift for Mac(文件管理程序)v4.2.6激活版

小玖_苹果Mac软件

Dropzone 4 for mac(文件拖拽增强工具)v4.80.46激活版

Rose

用友BIP公有云服务荣获SOC 2 Type II鉴证报告,安全可信赋能企业数智化转型

用友BIP

云服务 数据安全 智能体 数智化转型 用友BIP

Arturia Analog Lab V Pro for Mac(模拟实验室) 直装激活版

Rose

Capture One Studio for Mac:摄影后期处理的终极选择

小玖_苹果Mac软件

Kontakt 8:专业音乐人的终极采样工具

Rose

一家承担数据重任的新央企将成立,用友BIP破局企业数据难题

用友BIP

数字化转型 数据驱动 数据应用 数据资产管理 用友BIP

Native Instruments Kontakt for Mac(苹果专业音频采样器)v8.2.1激活版

小玖_苹果Mac软件

博云AI一体机全面适配DeepSeek各尺寸模型

BoCloud博云

博云 DeepSeek

周边生态 | WAL-G 与 DBeaver 新版增加 Cloudberry 支持

酷克数据HashData

PullTube for Mac(在线视频下载器)v1.8.5.60 中文激活版

Rose

Capture One 23 Enterprise for Mac(图片编辑工具)企业版

小玖_苹果Mac软件

谷歌AI发布新的文本至图像Transformer模型Muse_AI&大模型_InfoQ精选文章