写点什么

阿里云 AI 绘画创作大模型通义万相亮相,已开启定向邀测

  • 2023-07-08
    北京
  • 本文字数:764 字

    阅读完需:约 3 分钟

阿里云AI绘画创作大模型通义万相亮相,已开启定向邀测

7 月 7 日,在 2023 世界人工智能大会上,阿里云宣布 AI 绘画创作大模型通义万相开启定向邀测,该模型可辅助人类进行图片创作,未来可应用于艺术设计、电商、游戏和文创等应用场景。阿里云智能集团 CTO 周靖人表示,这是阿里云大模型全面掌握多模态能力的关键一步,该能力将逐步向行业客户开放。

 


阿里云宣布 AI 绘画创作大模型通义万相开启定向邀测


据介绍,通义万相在语义理解和图片生成上均表现优秀,首批上线 3 大能力:在基础文生图功能中,可根据文字内容生成水彩、扁平插画、二次元、油画、中国画、3D 卡通和素描等风格图像;在相似图片生成功能中,用户上传任意图片后,即可进行创意发散,生成内容、风格相似的 AI 画作;该模型还在业内率先支持图像风格迁移,用户上传原图和风格图,可自动把原图处理为指定的风格图。

 

通义万相基于阿里研发的组合式生成模型 Composer,其可通过对配色、布局、风格等图像设计元素进行拆解和组合,提供高度可控性和极大自由度的图像生成效果,仅需一个模型即可支持多类图像生成类任务能力,该研究成果已在国际 AI 顶会 ICML 2023 上发表。

 

阿里云在现场展示了该模型生成图片的效果,当输入“沉浸在全页灰度涂色的迷人世界中,有一只老虎在曼陀罗宁静的森林中,画面采用线条、笔画”后,系统能迅速生成线条细节丰富的老虎图片,如果继续使用风格迁移功能,还可随意切换图片风格。

 

在去年的世界人工智能大会上,阿里云“通义”大模型系列首次亮相,在此之后,通义千问、通义听悟等模型和产品相继推出,通义万相的问世意味着阿里云在大模型领域已经具备处理或生成文本、语音和图片等模态的能力。目前,阿里云大模型正逐步走向千行百业,已有超过 30 万企业申请测试通义千问,通义听悟累计用户数达到 36 万。

 

“多模态是大模型演进的必然路径,我们希望用不同模态的能力服务千行百业,帮助企业全面拥抱智能化时代。”周靖人表示。

2023-07-08 16:015848
用户头像
李冬梅 加V:busulishang4668

发布了 1074 篇内容, 共 693.1 次阅读, 收获喜欢 1236 次。

关注

评论

发布
暂无评论
发现更多内容

我们是如何测试人工智能的(四):模型全生命周期流程与测试图

测试人

人工智能 软件测试

VMware ESXi 8.0U2b macOS Unlocker & OEM BIOS 标准版和厂商定制版

sysin

esxi 驱动 unlocker dell hpe

人工智能,应该如何测试?(三)数据构造与性能测试篇

霍格沃兹测试开发学社

如何打造全国一体化算力体系?

天津汇柏科技有限公司

算力 一体化

VMware ESXi 8.0U2b macOS Unlocker & OEM BIOS 集成网卡驱动和 NVMe 驱动 (集成驱动版)

sysin

esxi 驱动 网卡 BIOS unlocker

@Transactional事务是真的好用吗

派大星

Spring事务 Java 面试题 互联网大厂面试

Overlay网络与Underlay网络:深入探索与全面对比

GousterCloud

网络 #Kubernetes#

OpenAI Sora:60s超长长度、超强语义理解、世界模型。浅析文生视频模型Sora以及技术原理简介

蓉蓉

openai GPT-4 人工智

这一次,让我们一起来搞懂MySQL

TimeFriends

【论文速读】| 大语言模型平台安全:将系统评估框架应用于OpenAI的ChatGPT插件

云起无垠

Vision Pro开发实践(一)

京东科技开发者

Advanced RAG 02:揭开 PDF 文档解析的神秘面纱

Baihai IDP

AI LLM 白海科技 企业号 4 月 PK 榜 检索增强生成

探索Kubernetes的大二层网络:原理、优势与挑战🚀

GousterCloud

大二层网络 网络模型 #k8s

阿里巴巴中国站按关键字搜索商品 API接口使用指南:快速获取商品ID、名称、描述、价格

技术冰糖葫芦

API Explorer API 文档

一条SQL查询语句是如何执行的

TimeFriends

思考-使用JSON结构映射业务数据与数据库表结构

alexgaoyh

json 数据库 系统设计 映射

代码手术刀—自定义你的代码重构工具

京东科技开发者

马斯克开源大模型Grok-1,手把手教你如何使用

京东科技开发者

kube-apiserver限流机制原理

华为云开发者联盟

Kubernetes 开发 华为云 华为云开发者联盟 企业号2024年4月PK榜

效率提升 80%:go-mongox 让复杂的 BSON 数据编写变得简单

陈明勇

Go 开源 go mongo

支付系统概述(五):结算系统

agnostic

支付系统设计与实现

Kubernetes大二层网络:挑战与解决方案探索

GousterCloud

cni #k8s

AMA live class

Echo!!!

English

Sermant热插拔能力在故障注入场景的实践

华为云开源

开源 微服务 服务治理

Sermant热插拔能力在故障注入场景的实践

华为云开发者联盟

开源 华为云 华为云开发者联盟 sermant 企业号2024年4月PK榜

LangChain初探:为你的AI应用之旅导航

蛋先生DX

#人工智能 LLM #LangChain Prompt 企业号2024年4月PK榜

基于开源IM即时通讯框架MobileIMSDK:RainbowChat-iOS端v9.0版已发布

JackJiang

网络编程 即时通讯 IM

人工智能,应该如何测试?(二)数据挖掘篇

霍格沃兹测试开发学社

阿里云AI绘画创作大模型通义万相亮相,已开启定向邀测_阿里巴巴_李冬梅_InfoQ精选文章