写点什么

谷歌 AI 发布新的文本至图像 Transformer 模型 Muse

作者:Daniel Dominguez

  • 2023-02-13
    北京
  • 本文字数:786 字

    阅读完需:约 3 分钟

谷歌AI发布新的文本至图像Transformer模型Muse

谷歌AI发布了一篇关于Muse的研究论文,这是一种新的文本至图像生成技术,它基于掩码生成(Masked Generative)Transformer,可以生成与DALL-E 2Imagen等竞争对手相媲美的高质量图片,但是速度要快得多。


Muse 被训练为预测随机掩码图像的 token,它会使用业已训练过的大型语言模型所生成的嵌入式文本。这项工作涉及在离散的 token 空间中进行掩码建模。Muse 使用一个 9 亿个参数的模型,称为掩码生产transformer(masked generative transformer),以创造视觉效果,而不是采用像素空间扩散自回归模型。


谷歌声称,借助 TPUv4 芯片,可以在 0.5 秒内创建一个 256*256 的图像,而使用 Imagen 则需要 9.1 秒,根据谷歌的说法,Imagen 使用的扩散模型提供了“前所未有的逼真程度”和“深度的语言理解”。TPU,即张量处理单元(Tensor Processing Unit),是谷歌开发的定制芯片,专门用作 AI 的加速器。


根据研究,谷歌 AI 已经训练了一系列不同规模的 Muse 模型,参数从 6.32 亿到 30 亿不等,研究发现,预先训练好的大型语言模型,对于生成逼真的高质量图像至关重要。


Muse 的性能也超过了最先进的自回归模型Parti,因为它使用了并行解码,在推理时间上比 Imagen-3B 或 Parti-3B 模型快 10 倍以上,根据使用同等硬件的测试,比 Stable Diffusion v1.4 快 3 倍。


Muse 创建的视觉效果与输入中的各种语义成分相对应,如名词、动词和形容词。此外,它还展示了视觉风格和多对象特性的知识,如合成性(compositionality)和基数(cardinality)。


近年来,由于新的训练方法和改进的深度学习架构,图像生成模型有了长足的进步。这些模型有能力生成非常详尽和逼真的图像,在广泛的行业和应用中,它们正在成为越来越强大的工具。


原文链接:

Google AI Unveils Muse, a New Text-To-Image Transformer Model


相关阅读:

OpenAI 宣布 DALL·E 开放测试版:面向 100 万用户,有文字就能生成图片

谷歌最新 Imagen AI 在文本至图像生成方面优于 DALL-E

2023-02-13 08:005481

评论

发布
暂无评论
发现更多内容

【论文速读】| 用于安全漏洞防范的人工智能技术

云起无垠

客户在哪儿AI助力ToB销售精准混圈子

客户在哪儿AI

ToB营销 ToB获客 ToB增长 ToB销售 大客户销售

客户在哪儿AI:如何用最少场次的活动覆盖最多的目标客户

客户在哪儿AI

ToB营销 活动营销 ToB增长

公开课 | 利用AI智能体实现自动化公开课

测吧(北京)科技有限公司

测试

如何应对团队中的刺头员工

老张

团队管理 管理者 质量保障 绩效考核

数据为王!深度挖掘天猫商品详情接口,赋能电商运营新策略

tbapi

天猫 天猫商品详情数据接口 天猫API接口 天猫商品数据采集

客户在哪儿AI告诉你,与什么样的平台合作才是ToB企业的最优选

客户在哪儿AI

ToB营销 ToB获客 ToB增长 ToB企业

客户在哪儿AI:新媒体时代ToB企业做传播该如何选择媒体

客户在哪儿AI

内容营销 ToB营销 ToB获客 ToB增长

优画质低功耗,空域GPU超分技术引领图像渲染新体验

HarmonyOS SDK

HarmonyOS

软件测试学习笔记丨Allure2报告中添加附件-html

测试人

软件测试 测试开发

ITSM流程落地经验之请求管理

嘉为蓝鲸

ITSM 流程管理 请求管理

中国标网正式公布BizDevSecOps能力成熟度模型标准,嘉为科技参编

嘉为蓝鲸

DevOps BizDevOps

成功登上主要中心化交易所 (CEX) 的终极指南:从准备到上市的全面策略

区块链软件开发推广运营

dapp开发 区块链开发 链游开发 NFT开发 公链开发

自媒体时代ToB企业该选哪些媒体做传播?

客户在哪儿AI

内容营销 ToB营销 ToB增长

嘉为蓝鲸WeOps智能化模块:专属于运维的智能助手正式面世!

嘉为蓝鲸

运维 大模型 weops

企业的分层运维对象监控指标体系建设

嘉为蓝鲸

可观测 指标管理 指标建设

Sentieon快速入门指南

INSVAST

软件 基因数据分析 生信服务

开通GPT4.0、GPT-4o的方法,门槛超低,三分钟学会

蓉蓉

GPT-4 gpt4o

《第一章、HarmonyOS介绍》01-HarmonyOS简介

清风论

华为 前端 HarmonyOS 鸿蒙开发

谷歌AI发布新的文本至图像Transformer模型Muse_AI&大模型_InfoQ精选文章