大咖直播-鸿蒙原生开发与智能提效实战!>>> 了解详情
写点什么

阿里云 AI 绘画创作大模型通义万相亮相,已开启定向邀测

  • 2023-07-08
    北京
  • 本文字数:764 字

    阅读完需:约 3 分钟

阿里云AI绘画创作大模型通义万相亮相,已开启定向邀测

7 月 7 日,在 2023 世界人工智能大会上,阿里云宣布 AI 绘画创作大模型通义万相开启定向邀测,该模型可辅助人类进行图片创作,未来可应用于艺术设计、电商、游戏和文创等应用场景。阿里云智能集团 CTO 周靖人表示,这是阿里云大模型全面掌握多模态能力的关键一步,该能力将逐步向行业客户开放。

 


阿里云宣布 AI 绘画创作大模型通义万相开启定向邀测


据介绍,通义万相在语义理解和图片生成上均表现优秀,首批上线 3 大能力:在基础文生图功能中,可根据文字内容生成水彩、扁平插画、二次元、油画、中国画、3D 卡通和素描等风格图像;在相似图片生成功能中,用户上传任意图片后,即可进行创意发散,生成内容、风格相似的 AI 画作;该模型还在业内率先支持图像风格迁移,用户上传原图和风格图,可自动把原图处理为指定的风格图。

 

通义万相基于阿里研发的组合式生成模型 Composer,其可通过对配色、布局、风格等图像设计元素进行拆解和组合,提供高度可控性和极大自由度的图像生成效果,仅需一个模型即可支持多类图像生成类任务能力,该研究成果已在国际 AI 顶会 ICML 2023 上发表。

 

阿里云在现场展示了该模型生成图片的效果,当输入“沉浸在全页灰度涂色的迷人世界中,有一只老虎在曼陀罗宁静的森林中,画面采用线条、笔画”后,系统能迅速生成线条细节丰富的老虎图片,如果继续使用风格迁移功能,还可随意切换图片风格。

 

在去年的世界人工智能大会上,阿里云“通义”大模型系列首次亮相,在此之后,通义千问、通义听悟等模型和产品相继推出,通义万相的问世意味着阿里云在大模型领域已经具备处理或生成文本、语音和图片等模态的能力。目前,阿里云大模型正逐步走向千行百业,已有超过 30 万企业申请测试通义千问,通义听悟累计用户数达到 36 万。

 

“多模态是大模型演进的必然路径,我们希望用不同模态的能力服务千行百业,帮助企业全面拥抱智能化时代。”周靖人表示。

2023-07-08 16:016366
用户头像
李冬梅 加V:busulishang4668

发布了 1202 篇内容, 共 825.5 次阅读, 收获喜欢 1312 次。

关注

评论

发布
暂无评论
发现更多内容

【天池训练营之大模型第一课】Data-juicer系列学练赛火热开启!

阿里云天池

多 Agent 协作,效果如何评估?

Baihai IDP

程序员 AI Baihai IDP AI Agents 智能体评估

鸿蒙APP开发的核心框架

北京木奇移动技术有限公司

APP开发 鸿蒙开发 软件外包公司

如何在保障精度的同时,轻量级部署DeepSeek?

华为云开发者联盟

人工智能 大模型 昇腾 模型量化 MindStudio

【FAQ】HarmonyOS SDK 闭源开放能力 —Live View Kit (1)

HarmonyOS SDK

harmoyos

国内外主流的19款招聘管理系统(ATS)测评

易成研发中心

办公软件 ATS

程序员如何高效学习一些新技术

秃头小帅oi

搜款网VVIC商品列表数据接口(搜款网API系列)

tbapi

搜款网 搜款网API 搜款网商品列表接口 搜款网商品详情接口

CRM管理系统(源码+文档+部署+讲解)

深圳亥时科技

传统AI不给力!模型自训练优化可以这样玩

鲸品堂

人工智能 企业号 2025年2月PK榜

直播间互动框架性能优化与稳定性实践

百度Geek说

百度 直播 性能优化、

搜款网VVIC商品详情数据接口(搜款网API系列)

tbapi

搜款网API 搜款网商品详情接口 搜款网商品数据采集

简单了解中国网络空间安全协会

行云管家

网络安全

人工智能丨微信搜索“暗藏玄机”?DeepSeek-R1灰度测试背后有何深意?

测试人

Svelte 最新中文文档教程(14)—— 特殊元素

冴羽

vue.js 前端 React Svelte SvelteKit

我的电子产品家族成员-懒猫微服

玄兴梦影

家庭数据中心 NAS 懒猫微服 使用体验 微型服务器

CRM系统(源码+文档+部署+讲解)

深圳亥时科技

阿里云AI绘画创作大模型通义万相亮相,已开启定向邀测_阿里巴巴_李冬梅_InfoQ精选文章