写点什么

阿里云 AI 绘画创作大模型通义万相亮相,已开启定向邀测

  • 2023-07-08
    北京
  • 本文字数:764 字

    阅读完需:约 3 分钟

阿里云AI绘画创作大模型通义万相亮相,已开启定向邀测

7 月 7 日,在 2023 世界人工智能大会上,阿里云宣布 AI 绘画创作大模型通义万相开启定向邀测,该模型可辅助人类进行图片创作,未来可应用于艺术设计、电商、游戏和文创等应用场景。阿里云智能集团 CTO 周靖人表示,这是阿里云大模型全面掌握多模态能力的关键一步,该能力将逐步向行业客户开放。

 


阿里云宣布 AI 绘画创作大模型通义万相开启定向邀测


据介绍,通义万相在语义理解和图片生成上均表现优秀,首批上线 3 大能力:在基础文生图功能中,可根据文字内容生成水彩、扁平插画、二次元、油画、中国画、3D 卡通和素描等风格图像;在相似图片生成功能中,用户上传任意图片后,即可进行创意发散,生成内容、风格相似的 AI 画作;该模型还在业内率先支持图像风格迁移,用户上传原图和风格图,可自动把原图处理为指定的风格图。

 

通义万相基于阿里研发的组合式生成模型 Composer,其可通过对配色、布局、风格等图像设计元素进行拆解和组合,提供高度可控性和极大自由度的图像生成效果,仅需一个模型即可支持多类图像生成类任务能力,该研究成果已在国际 AI 顶会 ICML 2023 上发表。

 

阿里云在现场展示了该模型生成图片的效果,当输入“沉浸在全页灰度涂色的迷人世界中,有一只老虎在曼陀罗宁静的森林中,画面采用线条、笔画”后,系统能迅速生成线条细节丰富的老虎图片,如果继续使用风格迁移功能,还可随意切换图片风格。

 

在去年的世界人工智能大会上,阿里云“通义”大模型系列首次亮相,在此之后,通义千问、通义听悟等模型和产品相继推出,通义万相的问世意味着阿里云在大模型领域已经具备处理或生成文本、语音和图片等模态的能力。目前,阿里云大模型正逐步走向千行百业,已有超过 30 万企业申请测试通义千问,通义听悟累计用户数达到 36 万。

 

“多模态是大模型演进的必然路径,我们希望用不同模态的能力服务千行百业,帮助企业全面拥抱智能化时代。”周靖人表示。

2023-07-08 16:016415
用户头像
李冬梅 加V:busulishang4668

发布了 1223 篇内容, 共 838.4 次阅读, 收获喜欢 1316 次。

关注

评论

发布
暂无评论
发现更多内容

IDEA中Git使用http协议和ssh协议的区别

刘大猫

人工智能 云计算 算法 物联网 大模型

镜界寻踪:基于Rokid AR眼镜打造城市沉浸式探险生态系统的全栈开发指南

知识浅谈

Rokid

WordPress FindAll Membership插件身份验证绕过漏洞分析

qife122

网络安全 漏洞分析 ordPress

从零开始学Flink:数据转换的艺术

郝培强

在AI技术快速实现创意的时代,挖掘项目管理系统新需求成为关键

qife122

项目管理系统 AI协作

Acme设置模块权限控制漏洞分析

qife122

网络安全 权限控制

基于反馈循环的自我进化AI智能体:原理、架构与代码实现

郝培强

Dynamic Wallpaper for Mac 精美动态壁纸下载器

做梦万元户

深入解析Active Directory站点攻击与枚举技术

qife122

漏洞利用 Active Directory

AI重塑招聘生态:从效率革命到职能升级

郝培强

依托鲲鹏处理器矩阵算力 中科大陈俊仕团队破解稀疏计算效率

新消费日报

僵尸启示录重现:广播系统安全漏洞与内部威胁剖析

qife122

网络安全 数据泄露

Swinsian for Mac 轻量级音乐播放器

做梦万元户

技术文章

qife122

人工智能 openai

微店商品详情API使用指南

Datafox(数据狐)

微店数据接口 微店API 微店数据采集 微店商品详情API

Apache SkyWalking存储型XSS漏洞安全警报(CVE-2025-54057)

qife122

应用性能监控 Apache SkyWalking

筑牢AI强国之基,上海边云协同算网一体服务实战启示录

脑极体

AI

BeeHive:iOS模块化开发的优雅解决方案

qife122

ios objective-c 架构

AI辅助病历书写系统:医生的“AI速记员”与“智能质控员”

上海拔俗

大数据-169 Elasticsearch 入门到可用:索引/文档 CRUD 与搜索最小示例

武子康

Java 大数据 kylin elasticsearch 分布式

在AI技术唾手可得的时代,挖掘白板工具新需求成为创新关键

qife122

开源项目 白板工具

Unity原生融合:体验生态构建与玩法裂变的实战指南

郝培强

Node-forge ASN.1无限递归漏洞解析

qife122

JavaScript 网络安全

我用Gemini3手搓英语点读机,省下2000块!

阿星AI工作室

产品 AI gemini gemin3

拼多多商品列表API使用指南

Datafox(数据狐)

拼多多API 拼多多商品数据采集 拼多多商品列表API

Adobe屏幕录制器UAF漏洞技术分析

qife122

逆向工程 漏洞挖掘

乌镇见证!和鲸科技成为光合组织教育专委会理事单位,携手上海大学共建人工智能通识项目入选优秀案例

ModelWhale

人工智能 高等教育 光合组织 和鲸科技

集成电路设计中的IP核心价值:加速创新的基石

郝培强

Dify+DeepSeek实战教程:从零搭建企业级AI应用

郝培强

一款开源、多语言的 WPF 可筛选 DataGrid 控件

追逐时光者

WPF

RapidWeaver 9 for Mac 零代码网页开发工具

做梦万元户

阿里云AI绘画创作大模型通义万相亮相,已开启定向邀测_阿里巴巴_李冬梅_InfoQ精选文章